Главная » Статья » Как голосовые помощники изменили нашу жизнь

Как голосовые помощники изменили нашу жизнь


В то время как в России рынок виртуальных помощников только начинает набирать обороты, на Западе за внимание пользователей активно соревнуются такие крупнейшие производители как Apple, Amazon, Google, Samsung, Xiaomi и Microsoft. По прогнозам экспертов, в 2018 году по всему миру использовалось около 3,7 млрд устройств с функцией голосового помощника. При этом основную массу таких гаджетов составляли смартфоны и планшеты. Однако планируется, что в 2019 году этот рынок будет развиваться в первую очередь благодаря активному внедрению виртуальных ассистентов в автомобили и домашние устройства.

Персональные голосовые ассистенты из года в год становятся только умнее. Так, в августе 2018 года компании Amazon и Microsoft приступили к тестированию интеграции своих голосовых помощников. Предполагается, что Cortana (Microsoft) и Alexa (Amazon) смогут передавать голосовые команды друг другу. Например, пользователь сможет попросить: «Cortana, открой Alexa» и наоборот.
Тем не менее сегодня мы всё ещё имеем дело с первым поколением голосовых ассистентов. Да, они неплохо справляются с простыми задачами, но до построения многоступенчатых логических цепочек им пока далеко. Кроме этого, голосовые помощники первого поколения, в основном, пассивны. То есть они ждут вашей команды, но сами не предпринимают никаких действий. К довершению всего современным виртуальным ассистентам свойственно полное отсутствие эмпатии.

История появления голосовых помощников

Технология распознавания голоса была разработана задолго до того, как в 2011 году Apple дебютировали c Siri. На Всемирной выставке в Сиэтле в 1962 году IBM представила инструмент под названием Shoebox. Он был размером с обувную коробку и мог выполнять математические функции и распознавать 16 произнесенных слов, а также цифры 0-9, но при условии, если:

  • человек ранее ознакомился с системой;
  • числа диктовал мужчина;
  • пауза между словами говорящего составляла 350 миллисекунд.

В 1970-х годах ученые из Университета Карнеги-Меллона в Питтсбурге, штат Пенсильвания, при существенной поддержке Министерства обороны США и Агентства перспективных исследований в области обороны (DARPA) создали Harpy. Система понимала 1011 слов — средний словарный запас трёхлетнего ребёнка.

Первая попытка внедрить искусственные нейронные сети для распознавания речи была предпринята в 1980-ых, но она провалилась. Неудачной оказалась коммерческая система Text-to-speech компании Kurzweil. В Text-to-speech был типичный для других систем минус: необходимость надиктовки. Первый же коммерческий продукт на основе технологии распознавания голоса был выпущен только в 1987 году. Американская компания по производству игрушек Worlds of Wonder разработала куклу по имени Джули с функцией распознавания детской речи.

В течение 1990-х годов такие разработчики программного обеспечения, как IBM, Apple и другие, создавали продукты, использующие распознавание голоса. Например, Apple в 1993 году начала встраивать функцию распознавания речи в свои компьютеры Macintosh с помощью PlainTalk. А в апреле 1997 года компания Dragon выпустила Dragon NaturallySpeaking, Система разрабатывалась для Microsoft Windows, став для неё оригинальным приложением распознавания голоса. Она использовала дискретную речь: пользователь делал паузу между каждым словом.

Популярные голосовые ассистенты
Siri

Особенности:

  • понимает естественную речь;
  • хорошо осведомлена о новостях, погоде, спорте, кино, маршрутах и местных компаниях;
  • может подсказать, что посмотреть по телевизору;
  • легко взаимодействует с некоторыми элементами «умного дома».

Недостатки:

  • не умеет взаимодействовать с большинством других приложений и сервисов;
  • работает медленнее некоторых конкурентов;
  • отсутствие открытого API.
Google Assistant

Особенности:

  •  с легкостью отвечает на простые вопросы;
  •  решать некоторые задачи пользователя (установка будильника, отправка сообщений);
  • встроенный переводчик;
  • взаимодействует с большинством приложений; музыкальными проигрывателями, заметками, календарями, мессенджерами;
  • открытый API.

Недостатки:

  • слишком инициативен (например, показывает статьи, которые вам неинтересны, или маршруты до дома из известных мест).
Alexa

Особенности:

  • информирует о погоде, трафике и прочих событиях;
  • осуществляет заказ товаров из Amazon Prime;
  • интегрирован со многими устройствами;
  • неплохое чувство юмора;
  • предоставляет новости из нескольких источников;
  • имеет открытое API.

Недостатки:

  • переводит все ответы с целью приобретения товара;
  • использование ограничено домом;
  • отсутствует русский язык.
Microsoft Cortana

Особенности:

  • управляет напоминаниями и календарем, отслеживает посылки, устанавливает будильники;
  • ищет в Bing новости, прогноз погоды и другие сведения;
  • взаимодействует с некоторыми приложениями Windows;
  • может общаться с другими ботами через Skype.

Недостатки:

  • пользоваться помощником на Android и iOS сложнее, а функций меньше.
Xiao Ai

Особенности:

  • воспроизводит аудиокниги и музыку через встроенный динамик;
  • подбирает оптимальный маршрут и узнает о погоде;
  • отправляет селфи в социальные сети по запросу пользователя;
  • включает «умную» технику Xiaomi.

Недостатки:

  • работает пока только на английском и китайском языке.
Алиса

Особенности:

  • подсказывает, какая погода, курс валюты сегодня, и предлагает оптимальный маршрут;
  • советует заведения для посещения;
  • с ней можно поиграть в игры: «Угадай песню», «Города» и прочие;
  • отлично справляется с функциями, которые чаще используются на сайте «Яндекс».

Недостатки:

  • отвечает загадками.

Введите номер телефона и наш менеджер перезвонит вам в течение 1 часа!

Зарегистрируйтесь, и вы получите доступ к платформе