Говорим со смартфоном: немного о голосовых ассистентах

Говорим со смартфоном: немного о голосовых ассистентах

Голосовые помощники пока неуверенно, но все же входят в нашу жизнь. Если изначально они воспринимались как забавный сервис, с которым можно подурачиться, но практической пользы от него нет, то сейчас голосовому помощнику можно доверять несложные задачи, с которыми он относительно неплохо справляется, особенно если делать запросы на английском языке.

Голосовые ассистенты развиваются с помощью нейросетей, то есть способны к самообучению, разумеется, в разумных пределах. При подсчете количества нейронов современного искусственного интеллекта ученые сделали вывод, что ИИ сейчас обладает интеллектом на уровне насекомых, причем не дотягивает до таких социальных насекомых, как, например, пчела. Да, это значит, что пока что восстания машин опасаться нечего, условный современный Терминатор не умнее мухи, а машинный разум пока не догадается, как делать из людей батарейки.

Однако это не мешает развиваться голосовым помощникам, которые уже сейчас существуют в современных смартфонах и учатся облегчать нам жизнь. Поговорим немного о них.

На данный момент существует пять наиболее распространенных голосовых помощника – Siri от Apple, Bixby от Samsung, Google Assistant от Google, Alexa от Amazon, Cortana от Windows.

Они в той или иной мере представлены в нашей стране, кроме, разве что, Alexa, так как торговой платформы Amazon в нашей стране нет.

Учитывая то, что эта технология еще развивается, и относительно молода, то поговорим о том, что умеют делать голосовые помощники, что пока им не удается, и что ожидать от них в будущем. Наступает эпоха интернета вещей, умных домов и прочих хайтек-киберпанк технологий, поэтому голосовые помощники неизменно приобретут доминирующее положение.

С ассистентом пока можно поддерживать лишь короткий диалог, чаще всего формата вопрос-ответ. В его ИИ заложено некоторое чувство юмора, однако искусственный интеллект пока не способен сам продуцировать юмор (так как для юмора необходимо абстрактное мышление, отсутствующее у машин), и те шутки, которыми отвечает ассистент, заложены создателями. Что же касается возможности обучения и адаптации ассистента, когда вам кажется, что он учится лучше вас понимать, то отчасти это так, однако ничего сверхъестественного в этом нет – по этому же принципу работает таргетированная реклама.

К слову, считается, что наиболее успешным помощником является Google Assistant. В основном этот успех объясняется тем, что он обладает большим массивом информации о пользователе, так как имеет доступ, к примеру, его запросов в Гугле, и действиям в других гугл-сервисах.

К слову, остановимся немного подробнее на Google Assistant – он является продолжателем и развитием Google Now, ставшим знаменитым благодаря фразе «Окей, Гугл», которая активировала помощника. Разница в том, что Google Now был более «неживым», хоть и точным ассистентом, что существенно ограничивало его возможности, а также не позволяло создать ощущение эмпатии к устройству. Google Assistant, в свою очередь демонстрирует более «человеческое» общение, упрощая коммуникацию с устройством. Кроме того, Google Assistant способен строить логическую цепочку при диалоге с пользователем, что означает запоминание предыдущего запроса, и способность связать его с последующим.

Приложение от Amazon, например, считается самым удобным для совершения покупок в интернете, так как хранит все покупки в памяти, и можно заказать «пиццу как на той неделе», и путаницы не возникнет.  В свою очередь, при выборе из ряда товаров обойтись без «ручной» работы не удастся, так как ни Alexa, ни любой другой ассистент не будет зачитывать все позиции, впрочем, как и никто не будет их выслушивать.

В Apple для отслеживания качества их ассистента Siri использовали другой метод, который не очень понравился бы пользователям: около одного процента запросов прослушивали сотрудники компании, по их заверениям, для улучшения работы ассистента. Впрочем, в компании решили от этой тактики отказаться. Несмотря на то, что в самих поисковых запросах ничего криминального, как правило, нет, политика конфиденциальности предполагает, что сотрудник не имеет права доступа к контактам и геолокации пользователя.

При коммуникации с ассистентом возникает еще одна трудность – нельзя откорректировать запрос, если он уже задан. При попытке исправить запрос система просто добавляет слова пользователя к запросу, в результате чего возникает путаница. Помимо этого, ассистенты пока не умеют устранять сторонние шумы и речь находящихся рядом людей, над чем, впрочем, уже идет активная работа. Пока это реализовано в смарт-колонках, которые способны фильтровать сторонний шум.

К таким недостаткам можно отнести также некоторую неестественность голоса, однако некоторые разработчики специально следуют этому эффекту, создавая подчеркнуто-механические голоса, которые ассоциируются с научно-фантастическими фильмами.

Что же ждет голосовых ассистентов в будущем?

Очевидно, что голосовые ассистенты ждет активное развитие, и в будущем они будут не дополнительным, а одним из основных методов взаимодействия пользователя и устройства (или экосистемы устройств).

Ассистенты станут способны сами проявлять инициативу. То есть, в случае, если пользователь находится в замешательстве при каком-либо выборе, или устройство определит, что пользователь, к примеру, заблудился, то оно будет само обращаться к нему с предложением о помощи. Функция, скорее всего, будет отключаема, так как многие не хотели бы ощущать назойливость, которую ощущают в магазинах от консультантов с их «вам что-то подсказать?».

Также возможно внедрение распознавание эмоции пользователя. К примеру, раздражение будет интерпретироваться как необходимость смены запроса, или предоставление других данных, страх может активировать вызов полиции и других служб совместно с геоданными.

Также очевидно, что голосовые ассистенты будут работать совместно с элементами дополненной реальности. Вполне возможно, что физическое взаимодействие с «базовым» устройством (смартфоном) будет сведено к минимуму, и голосовой ассистент будет выдавать результаты запросов на очки дополненной реальности. Очки, впрочем, пока особой популярностью не пользуются, но, думается, это вопрос времени.

Одна из главных целей голосовых помощников это не только облегчение эксплуатации устройства пользователем, но и создание некоей личности устройства, гуманизация бездушной техники. Общаясь с искусственным интеллектом устройства, человек невольно начинает его одушевлять, проявлять к нему большую привязанность. Хорошо это или нет – вопрос спорный, и относится уже к философии, но уже сейчас можно прогнозировать большое будущее искусственного интеллекта и его локального проявления – голосового ассистента.

Оставьте комментарий