Более 10 лет назад в России стали появляться голосовые помощники ― программы для гаджетов, которые умеют распознавать озвученные вслух запросы и давать на них ответы. И если раньше они были как «детсадовцы», плохо понимали нечёткие фразы, то сегодня уже вполне могут называться «школьниками»: они дают разнообразные ответы, шутят и даже дерзят. Всё потому, что в основе голосовых помощников ― искусственный интеллект (ИИ), способный обучаться и развиваться. Пока что не без помощи людей, но прогресс за десятилетие колоссальный.
По данным IT-компании «Just AI», в 2021 году в стране продали 2,9 млн умных гаджетов с голосовыми помощниками: колонки, TV-приставки и экраны с функцией smart. Эта же компания прогнозирует к 2025 году умеренный рост голосового сегмента рынка, а также рост запросов бизнеса на голосовые технологии.
Для россиян адаптированы два основных зарубежных голосовых помощника от компаний Google и Apple, но также активно развивается собственное производство виртуальных ассистентов. Самые популярные:
Одни умеют предлагать лучший маршрут на карте, другие расскажут пользователю всё про его счета и траты.
Статья по теме: Невидимый, но полезный ассистент: что умеют делать Алиса, Маруся и другие российские голосовые помощники
В основе таких виртуальных ассистентов заложены технологии искусственного интеллекта ― ASR (Automatic Speech Recognition) вычленяет человеческий голос из посторонних шумов, а NLU (Natural Language Understanding) позволяет системе запомнить предыдущие вопросы и ответы и улавливать контекст фраз, а не просто отдельные слова.
Есть два варианта, как устроена внутри технология голосового помощника:
подход rule-based уже содержит готовые ответы на запросы пользователей, система выбирает актуальный из базы;
подход генеративный намного сложнее: происходит обучение при помощи открытых источников, встроенных алгоритмов и языковых норм, на основе чего и генерируется фраза-ответ.
Российский медиахолдинг Group4Media в октябре 2022 года провёл исследование и выяснил, что с мая 2022 года 63% россиян активно использовали голосовых помощников, причём именно Алису чаще других. То есть, на эти технологии уже есть большой спрос, а значит, они продолжат развиваться. Другой вопрос ― в каком направлении?
Во-первых, голосовые помощники станут персонализированными. Это не про реакцию системы на имя, а про то, что технологии научатся (уже многие умеют) отличать голос владельца смартфона или колонки от сотен других, замечать настроение и эмоции человека и подбирать индивидуальный подход к каждому пользователю (например, голосовые ассистенты из бизнес-сферы).
Во-вторых, голосовые помощники обучатся и сами моделировать настоящую человеческую речь ― эмоции, диалекты, манеры. Это произойдёт благодаря технологиям глубокого машинного обучения. Возможно, через пять лет мы не сможем отличить с кем говорим по телефону ― с ИИ или с живым человеком.
В-третьих, виртуальные ассистенты будут визуализированы под человеческий образ. С помощью проекторов или экранов голосовой помощник будет общаться с владельцем гаджета или клиентом не только аудиально, но и визуально.
Цифровой виртуальный мир становится всё ближе благодаря технологиям искусственного интеллекта. Голосовые помощники уже стали неотъемлемой частью жизни свыше половины населения России.
Мы доверяем ИИ выбор маршрута, ресторана для ужина, подарков для любимых людей. Возможно, совсем скоро они будут развиваться и обучаться самостоятельно, без помощи человека. Наверное, это пугает многих, но при этом голосовой помощник есть едва ли не у каждого владельца смартфона. И прямо сейчас он учится понимать вас еще лучше.