YouTube позволит третьим лицам обучать модели искусственного интеллекта на пользовательском контенте
2024 год — год бурного развития искусственного интеллекта, когда будет запущена серия больших языковых моделей (LLM), которые постепенно станут неотъемлемой частью технологической жизни многих людей.
2024 год — год взрыва искусственного интеллекта, когда будет запущена серия больших языковых моделей (LLM), которые постепенно станут неотъемлемой частью технологической жизни многих людей.
Однако компании, занимающиеся искусственным интеллектом (ИИ), изо всех сил пытаются собрать высококачественные данные для обучения. Другими словами, многие компании «жаждут» обучающих данных для своих крупномасштабных моделей ИИ. Фактически, многие крупные технологические компании, в том числе Apple, Nvidia, Salesforce и Anthrophic, втянуты в новый спор относительно данных обучения ИИ, в первую очередь обвинения в использовании огромного и богатого видеоконтента YouTube для обучения ИИ, что серьезно влияет на авторские права на цифровой контент. проблемы.
Чтобы решить эти проблемы, YouTube предоставит создателям больше контроля над тем, как сторонние компании могут использовать их контент для обучения ИИ. Официальное заявление команды YouTube гласит:
В ближайшие дни мы выпустим обновление, которое позволит создателям и правообладателям видео разрешать сторонним компаниям использовать их контент для обучения моделей искусственного интеллекта. Эта опция появится непосредственно в настройках Studio в разделе «Стороннее обучение».
Включив эту функцию, авторы дают разрешение таким компаниям, как xAI, Apple, Amazon, Anthropic, Meta, Microsoft, Nvidia, OpenAI… использовать их видео для обучения соответствующих моделей ИИ. Однако не все видео имеют право на участие. Чтобы быть «выбранными» в качестве данных для обучения ИИ, видео должны соответствовать следующим условиям:
- Правообладатель видео разрешает третьим лицам использовать его для обучения ИИ.
- Настройки конфиденциальности видео являются общедоступными.
- Видео соответствуют Условиям использования YouTube и принципам сообщества.
Но похоже, что многие люди недовольны тем, что крупные технологические компании используют их контент для обучения моделей ИИ. Возьмем, к примеру, пользователей Bluesky. Сообщество пользователей социальной сети выразило возмущение после того, как эксперт по машинному обучению опубликовал набор данных, содержащий один миллион сообщений на Bluesky.
YouTube позволит третьим лицам обучать модели искусственного интеллекта на пользовательском контенте. Изображение 1
Многие пользователи присоединились к Bluesky, чтобы избежать таких платформ, как X (ранее Twitter), где xAI Илона Маска использовал сообщения пользователей для обучения своего ИИ Grok. Они думали, что нашли более безопасное место, но этот инцидент заставил многих осознать, что даже на Bluesky их контент может использоваться без их согласия.
В Великобритании около 40 творческих групп, в том числе издатели, авторы и фотографы, призывают правительство усилить защиту авторских прав, присоединяясь к консультации по искусственному интеллекту и творческим индустриям. Коалиция «Творческие права в ИИ» выступает за создание рынка лицензирования, который позволит справедливо использовать творческий контент в генеративном ИИ, гарантируя, что создатели контента сохранят контроль над своей работой и вознаграждением.
В августе 2024 года американские художники выиграли знаковое дело об авторских правах на ИИ. Окружной судья постановил, что такие компании, как Stability AI, Midjourney, DeviantArt и Runway AI, нарушили авторские права художников, используя их работы без разрешения для обучения своих собственных моделей ИИ.
Дэвид Пак
Обновление от 24 декабря 2024 г.