Неназванная ИИ-компания заплатит Reddit 60 млн долларов за контент
Популярный агрегатор новостей и форумов Reddit заключил лицензионное соглашение с одной из крупных компаний в сфере искусственного интеллекта.
Реклама
Согласно сообщению агентства Bloomberg, соглашение позволит этой компании использовать контент с Reddit для обучения своих моделей ИИ. Финансовые детали сделки впечатляют - Reddit будет получать около 60 миллионов долларов в год за предоставление доступа к данным. По словам источников, это соглашение было одним из ключевых факторов, привлекших инвесторов перед планируемым IPO Reddit в 2024 году. Несмотря на масштабность сделки, имя компании-партнера пока держится в секрете. Известно лишь, что это один из лидеров в области ИИ, а соглашение может стать примером для будущих контрактов Reddit с другими разработчиками ИИ. Доступ к данным является главным фактором успеха для современных алгоритмов машинного обучения. Миллионы постов, комментариев и другого контента на Reddit представляют уникальную ценность для "обучения" нейронных сетей. Анализируя огромные массивы текстов на естественном языке, ИИ-системы способны выявлять паттерны, улучшать понимание контекста и взаимосвязей. Особый интерес представляют разделы Reddit, где пользователи ведут неформальное общение на самые разные темы - от кино и игр до политики и науки. Такие данные помогают "обучить" ИИ более естественному диалогу. Показательный пример, чат-бот ChatGPT от компании OpenAI. Его алгоритмы были обучены в том числе на основе данных из Википедии, научных публикаций и других открытых источников. ChatGPT удивил многих своими способностями к ведению диалога на любые темы. Возможно, вскоре аналогичные чат-боты появятся и на основе данных Reddit. В то же время, использование контента из открытых источников несет определенные риски нарушения авторских прав. Эту проблему пришлось решать и OpenAI. Разработчики ИИ должны найти баланс между обучением алгоритмов и соблюдением прав владельцев данных.