tgoop.com/scriptRunAI_media/8799
Last Update:
OpenAI подозревают в обучении ИИ на защищённом авторским правом контенте
Новое исследование AI Disclosures Project выявило, что модель GPT-4o демонстрирует высокую осведомлённость о материалах из книг O’Reilly Media, доступ к которым ограничен.
Ключевые выводы:
🔹 GPT-4o чётко распознаёт контент из закрытых книг O’Reilly (82% AUROC).
🔹 В старой модели GPT-3.5 Turbo этот эффект почти не наблюдается.
🔹 Предполагаемый источник данных — база LibGen, где найдены тестируемые книги.
🔹 Авторы исследования указывают на системную проблему использования защищённого контента без разрешения.
⚖️ Почему это важно?
Неоплачиваемое использование данных угрожает качеству контента в интернете и ставит под вопрос законность методов обучения ИИ.
📢 Будущее регулирования
Эксперты считают, что законодательные требования (например, нормы ЕС по раскрытию источников данных) помогут создать прозрачный рынок лицензирования контента для ИИ.
👉 Что вы думаете? Должны ли ИИ-компании платить авторам контента?
BY scriptRun AI медиа

Share with your friend now:
tgoop.com/scriptRunAI_media/8799
