Отмечается, что компания задействует для этого всю общедоступную информацию в Сети.
Американские СМИ обнаружили в обновленной «Политике конфиденциальности» Google разрешение компании самой себе задействовать все ресурсы интернета для обучения своего искусственного интеллекта. Изначально документ указывал, что общедоступные данные будут использованы для коммерческих и исследовательских целей, а также для улучшения функционала «Google Переводчика».
Сейчас же компания сможет использовать общедоступную информацию для обучения своих ИИ-моделей и создания продуктов, таких как «Google Переводчик», Bard и Cloud AI.
Далее в документе приводится уточнение о том, что под «общедоступной» информацией понимается информация, которая появляется о компаниях на веб-сайтах и может быть проиндексирована и отображена в сервисах Google. Эти изменения вступили в силу с 1 июля 2023 года.
При этом эксперты считают, что до сих пор неясно, существует ли механизм, который позволяет пользователям исключать связанную с ними информацию из этого объема данных, подобно тому, как это делается в отношении поисковой системы.
Новая редакция документа Google фактически отражает современные реалии, поскольку множество разработчиков искусственного интеллекта уже используют большие наборы данных для обучения своих моделей, не задумываясь о принадлежности этих данных. Некоторые платформы, такие как Reddit и Twitter, уже ограничили доступ к своему контенту, игнорируя общественное возмущение и возможные долгосрочные последствия.
Напомним, что ранее юридическая компания Clarkson подала коллективный иск против OpenAI за использование данных ее клиентов для обучения ChatGPT.