Интернет04.07.2023 - 12:32

Google не будет ограничивать себя в использовании данных для обучения своего ИИ

Отмечается, что компания задействует для этого всю общедоступную информацию в Сети.

Фото: Google

Американские СМИ обнаружили в обновленной «Политике конфиденциальности» Google разрешение компании самой себе задействовать все ресурсы интернета для обучения своего искусственного интеллекта. Изначально документ указывал, что общедоступные данные будут использованы для коммерческих и исследовательских целей, а также для улучшения функционала «Google Переводчика».

Сейчас же компания сможет использовать общедоступную информацию для обучения своих ИИ-моделей и создания продуктов, таких как «Google Переводчик», Bard и Cloud AI.

Далее в документе приводится уточнение о том, что под «общедоступной» информацией понимается информация, которая появляется о компаниях на веб-сайтах и может быть проиндексирована и отображена в сервисах Google. Эти изменения вступили в силу с 1 июля 2023 года.

При этом эксперты считают, что до сих пор неясно, существует ли механизм, который позволяет пользователям исключать связанную с ними информацию из этого объема данных, подобно тому, как это делается в отношении поисковой системы.

Новая редакция документа Google фактически отражает современные реалии, поскольку множество разработчиков искусственного интеллекта уже используют большие наборы данных для обучения своих моделей, не задумываясь о принадлежности этих данных. Некоторые платформы, такие как Reddit и Twitter, уже ограничили доступ к своему контенту, игнорируя общественное возмущение и возможные долгосрочные последствия.

Напомним, что ранее юридическая компания Clarkson подала коллективный иск против OpenAI за использование данных ее клиентов для обучения ChatGPT.