Берут информацию из российских государственных СМИ ряд крупных англоязычных языковых нейросетей
Сразу несколько крупных англоязычных языковых нейросетей, аналогичных ChatGPT, самообучаются в том числе и из данных сайтов российских государственных СМИ - RT и Sputnik, пишет американская газета The Washington Post.
Так, в базе нейросетей для обучения содержат около 15 миллионов вебсайтов, в числе которых есть, например, англоязычная версия сайта-справочника KakProsto.
Также языковые модели берут данные и из сайтов американского госдепа и кабинета министров Великобритании, но есть и совсем необычные ресурсы. Таковыми, например, называют сайты 4chan или threepercentpatriots.com, где сторонники экс-президента США Дональда Трампа распространяли «антиправительственные тезисы». Есть там и 27 сайтов, что, как считают американские власти, занимаются продажей подделок и пиратской продукции.
Напомним, что ранее в создатели Dota 2 выпустили крупное обновление с новыми героями и расширенной картой «Новые горизонты».