Что такое голосовой робот
Что умеют голосовые боты, как выбрать сервис интеграции и проверить эффективность внедрения
Голосовые боты — это программное обеспечение, основанное на искусственном интеллекте, которое позволяет вызывающему абоненту общаться с роботом, имитирующим естественную речь. Очевидный и простой вариант использования голосовых ботов — меню с ответами на типовые вопросы у какого-нибудь банка. Человек звонит и попадает в меню, где записанный заранее голос просит выбрать соответствующую цифру, чтобы узнать задолженность по кредиту, сменить пин-код или закрыть лимит на покупки в интернете.
Проще говоря, это машины, которые могут разговаривать как люди и выполнять типовую работу быстро и эффективно. В отличие от живых операторов, голосовые боты не совершают ошибок и им не нужно время на отдых. Для бизнеса такие боты — масштабируемый способ элементарного взаимодействия с клиентами и уменьшение затрат на обслуживание. При грамотном внедрении они могут легко превзойти большую часть неквалифицированных специалистов на первых линиях службы поддержки и отдела продаж.
Голосовых ботов также иногда называют голосовыми помощниками, но это не одно и то же. Голосовые помощники интегрированы в устройства клиентов. Например, Siri от Apple или Алису от Яндекса можно назвать голосовыми помощниками. То есть если в мобильный банкинг интегрировать помощника по имени Кузьма, который будет работать аналогично Алисе, но в экосистеме конкретного банка — его можно будет назвать голосовым помощником.
Разбираемся, нужен ли вам голосовой бот
Что умеют голосовые боты
Боты определяют ключевые слова в человеческой речи и находят подходящий ответ в подготовленной базе данных. Механизмы быстро преобразовывают текст в аудио и наоборот — и все это происходит во время того, пока клиент что-то говорит. Поэтому как правило задержки с ответом не бывает, так как это не оператор, который оставит человека на линии и пойдет спрашивать у начальства ответ на каверзный вопрос.
Голосовых ботов можно использовать в любых сферах, где есть работа с клиентами и обработка типовых запросов:
Постепенно голосовые боты смогут заменить целые кол-центры и будут самостоятельно обрабатывать входящие звонки от клиентов. Если бот не сможет решить вопрос с которым обратился клиент — он переведет звонок на человека-оператора.
В отличие от живых людей, боты не спят и готовы помочь 24/7. Клиенты могут звонить, получать информацию и решать проблемы, когда им это больше всего нужно. Боты позволят им избежать необходимости ждать на линии, чтобы поговорить с оператором. Кроме того, это означает, что клиентам не нужно звонить только в рабочее время кол-центра. Взаимодействие происходит мгновенно и может помочь улучшить качество обслуживания клиентов. Все потому что люди вынуждены звонить в тех. поддержку по типовым вопросам: списали лишние 100 рублей со счета, не работает интернет или не везут доставку из интернет-магазина.
Голосовые роботы могут быть интегрированы с CRM-системами — это дает еще больше возможностей для голосовых ботов.
Боты требуют минимального обучения, чем сокращают время между настройкой и повышением производительности, по сравнению с людьми, которые порой не могут запомнить элементарный скрипт общения с клиентами. Голосовой робот легко выполняет повторяющиеся задачи, с которыми приходится сталкиваться большинству операторов, что снижает рабочую нагрузку и устраняет необходимость в дополнительном персонале.
Как понять, нужен ли голосовой бот компании
От себя добавим, что стоит:
Если экономия несущественная или ее нет вовсе — оставьте сотрудника на своем месте. Если вы понимаете, что бот очень быстро себя окупит, но у вас нет человека, который будет заниматься разработкой скриптов, или вас недостаточно времени на эту задачу — отложите ее до лучших времен. Скорее всего сейчас у вашей компании есть задачи поважнее.
Определяемся с сервисом
Какие сервисы бывают
Мы не решились составлять какой-то рейтинг лучших сервисов голосовых ботов, но убедились в том, что их достаточно много. Вот список некоторых из них, с которыми можно ознакомиться:
Smart Dialogs —голосовой бот для автоматизации звонков. Система робота обучается с применением нейронных сетей. Робот звучит как живой человек и понимает сложную человеческую речь.
ЗвоноПес — сервис автодозвона может быстро обзвонить клиентов, поднять продажи, напомнить о событии, провести опросы и верифицировать номера. Есть бесплатная пробная версия.
Zvonobot — сервис обзвона клиентской базы через голосовые рассылки. Возможности: организация холодных обзвонов и телефонных опросов, информирование клиентов, автоматизация рассылок, интеграция с виджетом amoCRM, обзвон определённого сегмента клиентов и т. д.
Это малая часть из них, рекомендовать какой-то конкретный сервис не будем, так как для каждой организации все индивидуально. А вот рассказать о том, как выбрать подходящий — без проблем.
Как выбрать подходящий сервис
Ниже мы привели довольно обширный, но не исчерпывающий список советов, который поможет вам выбрать подходящий сервис и минимизировать риск «сюрпризов» после того, как вы заплатите.
Определитесь, сколько вы готовы заплатить за сервис
Необходимо выбирать тариф исходя из задач, которые собирается решать организация. Выбирая сервис голосового бота желательно выяснить, за какие звонки взимается оплата и как происходит тарификация. Существуют сервисы с посекундной и поминутной оплатой, а также с оплатой за звонок.
Также есть тарифы с ежемесячным платежом, но такой вариант может не подойти организациям, которые занимаются обзвоном лишь в редких случаях. Абонентскую плату желательно только тогда, когда взаимодействие с клиентами происходит на ежедневной основе.
Протестируйте все подходящие варианты в пробный период
Если организация впервые сталкивается с голосовыми ботами, то наличие бесплатной тестовой версии поможет не потратить деньги впустую и решить, точно ли нужно внедрять новую технологию в работу.
Проверьте удобство платформы
Компании необходимо время, чтобы разобраться с интерфейсом и настройкой личного кабинета. Как и с другими приложениями и платформами — чем проще и понятнее, тем лучше для заказчика. Существуют сервисы, где предлагают самостоятельно настраивать и запустить голосового бота, что не всегда удобно. Уж лучше переплатить и доверить работу профессионалам, чем экономить и разбираться во всем самостоятельно. Правда, не так много сервисов предлагают создать и настроить бота под задачи организации самостоятельно.
Изучите отзывы о техподдержке сервиса
Если голосовой робот выйдет из строя, то клиенты начнут массово звонить в службу поддержки и операторы столкнуться с нагрузкой, к которой не были готовы. Важно быть уверенным, чтобы техническая поддержка сервиса может быстро решить проблему. Клиенты не будут разбираться кто виноват и обрушит весь негатив на компанию, а не на конкретный сервис голосового бота.
Решите кто будет разрабатывать скрипты разговора
Не все сервисы сами разрабатывают сценарий разговора, проводят тестирование и корректируют реплики в зависимости от потребностей организации и реакции аудитории. При выборе необходимо обратить внимание, что они предлагают — шаблонный скрипт, который разработан с помощью запросов компании или же написание скрипта полностью отводится заказчику.
Решите кто будет озвучивать голосового бота
При выборе сервиса также необходимо обратить внимание на то, кто их будет озвучить. Организация без проблем может выбрать вариант озвучки искусственным интеллектом, который будет находить необходимые слова в заранее созданной базе данных, но так речь будет плохо восприниматься людьми, потому что по крайней мере сейчас не всем приятно слушать и отвечать на вопросы робота. Также, искусственный голос будет странно произносить слова и коверкать окончания. Так что, куда лучше взять сотрудника с самым красивым голосом, ну или обратиться за помощью к профессиональному диктору, который вдохнет жизнь в искусственный интеллект.
Узнайте срок хранения данных
Голосовые боты записывают и хранят в базе данных совершенные разговоры, но некоторые делают это лишь до определенного времени. Необходимо проверить этот критерий, чтобы в какой-то момент не оказалось что сервис хранит информацию 2-3 недели и прослушать записи звонков, которые были ранее — невозможно.
Узнайте о наличии отчетности
Любая технология должна приносить результат. Важно, чтобы сервис предоставлял отчетность о качестве работы голосового помощника. За ним необходимо следить также, как и за работой живого оператора.
Уточните возможность интеграции с другими сервисами
Некоторые боты могут брать информацию из CRM-системы и прямо во время беседы с клиентом заносить информацию о разговоре в карточку клиента. Системы интеграции упрощают работу бизнеса и экономит время на рутинные задачи.
Подытожим
К сожалению, процесс общения с аудиторией обезличивается, так как бот еще не может реагировать на эмоции и не обладает гибким умом, чтобы принимать неоднозначные решения. Использовать такие технологии в наше время предпочтительно лишь на простых задачах, которые не требуют прокаченного эмоционального интеллекта.
Как голосовой робот экономит время и финансы компании
Для малого и среднего бизнеса телефонные звонки — основное средство для взаимодействия с клиентами. При этом компании тратятся на содержание собственных call-центров или выведение их на аутсорсинг. Однако человек часто перестаёт быть эффективным там, где нужно обрабатывать огромный поток звонков. И тут на помощь приходит голосовой робот. Давайте разберёмся, как автоматика позволит улучшить продажи, повысить лояльность клиентов и сократить расходы компании.
Голосовой робот — система, которая не только отвечает на вопросы клиента, но и сама способна их задавать по готовому сценарию. Запустить готовое решение можно в считанные минуты: для внедрения не требуются технические навыки или привлечение дорогостоящих IT-специалистов.
Любому, если он активно контактирует с клиентами: принимает входящие звонки с однообразными вопросами, подтверждает заказы и заявки, напоминает о записи на приём или о задолженности, запрашивает оценку качества, приглашает на мероприятие, сообщает о новых продуктах и услугах, проводит опросы. При этом робот не только говорит, но и распознает ответы абонентов, на основании которых продолжает диалог.
Гораздо удобнее. Давайте рассмотрим на примере. Стоит задача — обзвонить 3 000 человек из базы и предупредить о том, что заканчивается срок действия страхового полиса. Оператор call-центра делает 20-30 таких звонков в час, то есть за рабочий день — около 200. Всю базу один человек обзвонит ориентировочно за 15 рабочих дней. Робот справится с этой задачей за пару часов, так как может звонить одновременно нескольким десяткам клиентов. При использовании голосового робота исключается человеческий фактор. Робот работает по сценарию, не может заболеть, устать или нагрубить — автоматика чётко работает в режиме 24/7 без больничных, отпусков и выходных.
Очевидны и финансовые выгоды: компании не нужно тратиться на поиск и обучение сотрудников, расширять штат call-центра.
Робот хорошо там, где много рутины и однообразия. Оставьте человеку лишь то, где действительно требуется его вмешательство. Например, робот может получить у клиента всю основную информацию и перевести звонок на оператора только в случае необходимости (клиент хочет купить товар или у него есть дополнительные вопросы).
Интеграция с CRM заказчика позволит в процессе разговора мгновенно подтянуть и озвучить необходимые сведения: скажем, свободно ли время для записи на приём завтра после шести вечера.
В случае интеграции с CRM заказчика можно в автоматическом режиме отправлять роботу задания связаться с клиентом, выяснить у него какой-либо вопрос и вернуть данные обратно в CRM-систему. Это произойдет быстро и без участия человека (оператор смог бы взять задачу в работу только когда освободится, а робот многозадачен).
Если ваш сценарий простой, мы оперативно добавим его на сайт. Если требуется персональное решение, мы готовы обсудить и реализовать его.
Да, это возможно, причем можно задать специфические данные для отправки каждому абоненту (например, номер заказа) и сделать это только в том случае, если в разговоре абонент подтвердил, что это его заказ.
Успех разговора зависит от того, насколько он нужен и полезен клиенту. Если робот звонит с рекламным спамом, а на том конце вешают трубку — это не вина робота. Такая же реакция была бы и при звонке человека. Если же робот звонит и подтверждает, что в аптеку привезли заказанное лекарство и можно его забирать, для покупателя совершенно нет разницы, кто это делает — человек или нет. Общение с роботом происходит в естественной манере. Автоматика копирует интонацию, ставит правильно ударения и обращается по имени, если оно указано в базе. Это повышает доверие — принявший человек понимает, что имеет дело не с массовым обзвоном.
Можно. Но у записи живого голоса есть существенные ограничения: с её помощью не получится озвучить персонализированную информацию: скажем, для подтверждения онлайн-заказа произнести название и стоимость товара, назвать время, дату записи на прием и имя специалиста.
Смотря что было его целью. Если телефон абонента выключен, вне зоны действия сети или сработала голосовая почта, робот это поймет и перезвонит позже согласно расписанию, настроенному заказчиком.
Если целью было продать полис КАСКО, то робот, конечно, продажи не гарантирует. При этом в процессе разговора робот может уточнить информация по клиенту, которая поможет осуществить продажу в будущем.
Робот формирует отчёты в реальном времени, они доступны в личном кабинете и их можно выгрузить в популярных форматах excel, csv, pdf, а также через API. Робот составляет подробные систематизированные отчёты с настройкой фильтра по результату звонка: кто готов купить продукт, кто просит перезвонить, кто отказался. Таким образом сотрудники избавлены от рутины: им не надо прослушивать тысячи звонков — достаточно выставить фильтр по условию.
Для приема входящих требуется отдельный телефонный номер. Мы можем его выделить, а если у вас есть своя АТС, поможем увязать работу робота с нею.
Вся работа с сервисом происходит на сайте МТС, в личном кабинете. Для того, чтобы начать, нужно:
1. Выбрать сферу бизнеса и задачу для робота.
2. Загрузить базу клиентов и придумать для неё название (если нужно персональное обращение к клиентам, база должна состоять из двух колонок: номера телефона и имени).
3. Заполнить сценарий и выбрать голос робота.
4. Указать время и дату запуска кампании.
Справиться с настройкой по готовым сценариям можно самостоятельно за 5-10 минут. Если нужна более развернутая интеграция, специалисты МТС окажут полную поддержку, помогут с разработкой нового сценария. В этом случае на подготовку запуска робота уйдёт от одного до пяти дней.
Робота МТС можно «нанять» по цене от 1 800 рублей за 400 звонков. В отличие от большинства провайдеров, МТС берёт оплату не за минуту разговора, а за состоявшийся звонок. При этом неизрасходованные в течение месяца звонки не сгорают, а переносятся на следующий период. Также мы рассматриваем возможность оплаты только за полученные от клиента ответы.
Для крупных заказчиков со сложной интеграцией сервиса разрабатывается индивидуальное решение — для этого необходимо обратиться к персональному менеджеру.
Любому, если он активно контактирует с клиентами: принимает входящие звонки с однообразными вопросами, подтверждает заказы и заявки, напоминает о записи на приём или о задолженности, запрашивает оценку качества, приглашает на мероприятие, сообщает о новых продуктах и услугах, проводит опросы. При этом робот не только говорит, но и распознает ответы абонентов, на основании которых продолжает диалог.
Гораздо удобнее. Давайте рассмотрим на примере. Стоит задача — обзвонить 3 000 человек из базы и предупредить о том, что заканчивается срок действия страхового полиса. Оператор call-центра делает 20-30 таких звонков в час, то есть за рабочий день — около 200. Всю базу один человек обзвонит ориентировочно за 15 рабочих дней. Робот справится с этой задачей за пару часов, так как может звонить одновременно нескольким десяткам клиентов. При использовании голосового робота исключается человеческий фактор. Робот работает по сценарию, не может заболеть, устать или нагрубить — автоматика чётко работает в режиме 24/7 без больничных, отпусков и выходных.
Очевидны и финансовые выгоды: компании не нужно тратиться на поиск и обучение сотрудников, расширять штат call-центра.
Робот хорошо там, где много рутины и однообразия. Оставьте человеку лишь то, где действительно требуется его вмешательство. Например, робот может получить у клиента всю основную информацию и перевести звонок на оператора только в случае необходимости (клиент хочет купить товар или у него есть дополнительные вопросы).
Интеграция с CRM заказчика позволит в процессе разговора мгновенно подтянуть и озвучить необходимые сведения: скажем, свободно ли время для записи на приём завтра после шести вечера.
В случае интеграции с CRM заказчика можно в автоматическом режиме отправлять роботу задания связаться с клиентом, выяснить у него какой-либо вопрос и вернуть данные обратно в CRM-систему. Это произойдет быстро и без участия человека (оператор смог бы взять задачу в работу только когда освободится, а робот многозадачен).
Если ваш сценарий простой, мы оперативно добавим его на сайт. Если требуется персональное решение, мы готовы обсудить и реализовать его.
Да, это возможно, причем можно задать специфические данные для отправки каждому абоненту (например, номер заказа) и сделать это только в том случае, если в разговоре абонент подтвердил, что это его заказ.
Успех разговора зависит от того, насколько он нужен и полезен клиенту. Если робот звонит с рекламным спамом, а на том конце вешают трубку — это не вина робота. Такая же реакция была бы и при звонке человека. Если же робот звонит и подтверждает, что в аптеку привезли заказанное лекарство и можно его забирать, для покупателя совершенно нет разницы, кто это делает — человек или нет. Общение с роботом происходит в естественной манере. Автоматика копирует интонацию, ставит правильно ударения и обращается по имени, если оно указано в базе. Это повышает доверие — принявший человек понимает, что имеет дело не с массовым обзвоном.
Можно. Но у записи живого голоса есть существенные ограничения: с её помощью не получится озвучить персонализированную информацию: скажем, для подтверждения онлайн-заказа произнести название и стоимость товара, назвать время, дату записи на прием и имя специалиста.
Смотря что было его целью. Если телефон абонента выключен, вне зоны действия сети или сработала голосовая почта, робот это поймет и перезвонит позже согласно расписанию, настроенному заказчиком.
Если целью было продать полис КАСКО, то робот, конечно, продажи не гарантирует. При этом в процессе разговора робот может уточнить информация по клиенту, которая поможет осуществить продажу в будущем.
Робот формирует отчёты в реальном времени, они доступны в личном кабинете и их можно выгрузить в популярных форматах excel, csv, pdf, а также через API. Робот составляет подробные систематизированные отчёты с настройкой фильтра по результату звонка: кто готов купить продукт, кто просит перезвонить, кто отказался. Таким образом сотрудники избавлены от рутины: им не надо прослушивать тысячи звонков — достаточно выставить фильтр по условию.
Для приема входящих требуется отдельный телефонный номер. Мы можем его выделить, а если у вас есть своя АТС, поможем увязать работу робота с нею.
Вся работа с сервисом происходит на сайте МТС, в личном кабинете. Для того, чтобы начать, нужно:
1. Выбрать сферу бизнеса и задачу для робота.
2. Загрузить базу клиентов и придумать для неё название (если нужно персональное обращение к клиентам, база должна состоять из двух колонок: номера телефона и имени).
3. Заполнить сценарий и выбрать голос робота.
4. Указать время и дату запуска кампании.
Справиться с настройкой по готовым сценариям можно самостоятельно за 5-10 минут. Если нужна более развернутая интеграция, специалисты МТС окажут полную поддержку, помогут с разработкой нового сценария. В этом случае на подготовку запуска робота уйдёт от одного до пяти дней.
Робота МТС можно «нанять» по цене от 1 800 рублей за 400 звонков. В отличие от большинства провайдеров, МТС берёт оплату не за минуту разговора, а за состоявшийся звонок. При этом неизрасходованные в течение месяца звонки не сгорают, а переносятся на следующий период. Также мы рассматриваем возможность оплаты только за полученные от клиента ответы.
Для крупных заказчиков со сложной интеграцией сервиса разрабатывается индивидуальное решение — для этого необходимо обратиться к персональному менеджеру.
Зачем нужен голосовой робот?
В среднем один оператор контакт-центра ежедневно обрабатывает до 200 звонков. А что делать, если в компанию поступают тысячи телефонных обращений, многие из которых необходимо обработать одновременно?
На помощь приходит голосовой робот. Конечно, разговор идет не об R2-D2, Терминаторе и Wall-e, а о виртуальных операторах, которые встречаются в нашей повседневной жизни буквально на каждом шагу, например, при обращении в банк, интернет-магазин, турфирму или службу такси. В этой статье вы узнаете, за что так полюбили роботов руководители компаний, и какие реальные бизнес-задачи они решают?
Сложно сравнивать возможности оператора колл-центра и голосового помощника. Робот работает 24/7 без обедов и выходных, и здесь нет места человеческому фактору. Так оператор может что-то не услышать, не корректно донести информацию до клиента. Робот выполняет все задачи в соответствии с заранее прописанными скриптами, при этом ведется запись всех разговоров.
Почему роботы так популярны?
А теперь мы подробнее расскажем о возможностях голосовых роботов Телфин.
Один из наших клиентов, ведущая сеть аптек Санкт-Петербурга, для распределения входящих звонков использует голосового робота с функцией IVR и распознаванием речи. При подключении простого голосового меню для перехода в очередь звонков или на добавочный необходимо вводить цифры на телефоне, в случае с голосовым роботом достаточно сказать ключевое слово, например, адрес одного из филиалов в Санкт-Петербурге, и звонок автоматически переводится на соответствующий добавочный номер.
Голосовых роботов также используют, чтобы быстро обзвонить клиентов и получить обратную связь. Так крупнейший московский ритейлер подключил виртуального помощника с функцией автоинформатора. Специалисты Телфин загрузили в систему файлы с номерами для прозвона и записали вопросы. Робот оперативно связался со всеми клиентами и зафиксировал ответы. В дальнейшем эти данные также легко преобразовать в текст для детального изучения и анализа звонков.
Голосовой робот с функцией автоинформатора позволяет провести массовый обзвон клиентов в ограниченные сроки. Для разных групп можно загрузить свои файлы для проигрывания, настраивается время начала и конца обзвона, количество попыток вызова номера из списка и интервал между ними, а также время ожидания ответа. По результатам работы формируется SMS-оповещение об окончании обзвона, краткий и полный отчеты по каждому номеру.
Кроме конструктора сценариев IVR, а также конвертации голоса в текст и обратно для более результативной работы голосового робота можно настроить интеграцию с различными корпоративными бизнес-приложениями. Связка решений помогает роботу анализировать данные из базы и озвучивать информацию из любого раздела системы.
Если в карточке клиента указано количество заказов, то при соединении с менеджером, на экране IP-телефона или на мониторе ПК, если звонок принимают с помощью программного телефона, высвечивается информация по заказу. В зависимости от запросов клиента голосовой робот также озвучивает статус заказа, дату и время запланированной отгрузки.
Мы рассказали о 3-х вариантах настройки работы виртуальных помощников. В зависимости от бизнес-задач функции голосового робота могут меняться. При этом в процессе эксплуатации компании могут вносить свои дополнения и изменения в его работу, как вариант, совершенствовать скрипты разговоров, расширять словарный запас, создавать новые сценарии обработки и распределения звонков.
Если у вас есть вопросы по подключению и настройке голосовых роботов Телфин, или вы хотите создать своего голосового робота на базе виртуальной АТС «Телфин.Офис», напишите нам. Наши специалисты ответят вам в ближайшее время.
Будущее уже здесь: как работают голосовые роботы и что они умеют делать
Роботизация рутинных операций, когда для решения простых и одновременно трудоемких задач используются роботы, а не люди — весьма активный тренд. Автоматизируется многое, включая телефонные разговоры с клиентами. Компания Neuro.net занимается созданием технологий, которые дают возможность улучшить возможности роботов.
В этой статье разработчики рассказывают о технологиях и нюансах распознавания пола собеседника по голосу и работе над важными элементами диалога.
Сначала кейс, ну а потом — разбор технологий
Один из наиболее интересных кейсов — замена сотрудников колл-центра компании-партнера голосовым роботом. Возможности последнего применили не для штатных ситуаций вроде уточнения адреса доставки, а для того, чтобы выяснить, почему некоторые покупатели стали реже заходить на сайт компании.
Технология базировалась на использовании полноценной нейросети, а не отдельных скриптов. Именно нейросеть позволила решить проблемы, которые обычно ставят роботов в тупик. В первую очередь, речь идет об ответах собеседника вроде «ну я пока не знаю, возможно да, хотя нет» или даже «да нет». Обычные для человека слова становятся непреодолимым препятствием для робота.
В ходе обучения робот стал понимать, какой смысл закладывается в ту либо иную фразу, и каким должен быть ответ. Голосов у робота было несколько — как мужских, так и женских. Основная задача состояла в «очеловечивании» робота с тем, чтобы собеседник-человек не испытывал возможности машины, а вел диалог по целевому сценарию.
Ниже — пример того, что получилось.
Робот слушает собеседника, давая ответ в зависимости от смысла того, что сказал клиент. Общее количество веток сценария, по которым может пойти разговор — более тысячи.
Главной целью этого робота было понять причину снижения активности клиента компании на сайте и сделать интересное предложение каждому. Это была одна из первых попыток компании автоматизировать работу колл-центров.
Новые роботы более совершенны. Вот еще несколько примеров общения роботов с человеком: первый, второй, третий примеры.
Теперь о технологиях
Есть три ключевых технологических особенности, которые позволяют роботу работать:
Распознавание пола собеседника по голосу
Зачем это нужно? Изначально эта функция создавалась для проведения опросов при помощи роботов. Раньше работа по проведению опросов проводилась людьми, которые заполняли ряд пунктов. Например — пол собеседника. Понятно, что человеку для определения этого параметра не нужно спрашивать, с кем он говорит — мужчиной или женщиной. В 99% все и так понятно. С роботами другое дело, для того, чтобы они более-менее точно научились распознавать голоса, пришлось провести масштабную работу. И она не была напрасной, сейчас технология используется для персонализации предложения и голосовых промптов в зависимости от пола.
Важный момент — женский голос универсален и применим для работы с самым широким спектром продукции, а особенно он важен для продуктов для женщин. Согласно разным исследованиям, женский голос воспринимается любой аудиторией положительно, соответственно, в этом случае конверсия больше. Исключение — при продвижении “мужских” продуктов предпочтительнее мужской голос.
Как это работает? Сначала производится первичная обработка данных, она осуществляется на основе обработки голосовых записей и фрагментов продолжительностью по 20 мс. Все собранные голосовые фрагменты проходят предварительную обработку в компоненте VAD (Voice Activity Detection). Это необходимо для отделения «зерен от плевел», то есть речи от шумов. Весь мусор удаляется, благодаря чему увеличивается точность работы моделей.
Для распознавания используется так называемое пространство кепстральных коэффициентов, первой и второй разностей. Основа — метод GMM — Gauss Mixture Models.
Так, на интервале в 10-20 мс вычисляется текущий спектр мощности, после чего применяется обратное преобразование Фурье от логарифма спектра, с поиском необходимых коэффициентов.
Наши GMM-модели настроены отдельно для обучения мод мужской и женский голоса, также используются модели для определения взрослых и детских голосов. Конечно, с нуля обучить систему нельзя, нужны размеченные голосовые записи.
Для того, чтобы повысить эффективность работы системы, применяются коэффициенты тембральных моделей голоса:
Главная часть системы — модуль классификации данных на основе многослойного персептрона, MLP. В нее передаются данные от моделей мужского, женского голосов, данные тембральных моделей. На входе в систему получаем массив проклассифицированных значений, а на выходе — результат определения пола.
Технология, которая здесь описывается, используется для работы как в онлайн (по первой фразе клиента), так и оффлайн режиме классификации (после разговора). Точность распознавания пола составляет около 95%. Важный момент — задержка при работе в онлайне не превышает 120-150 мс, что крайне важно для «очеловечивания» робота. Обычно паузы в общении робота и человека составляют не миллисекунды, а секунды, что, конечно, для собеседника-человека выглядит странно, и сразу понятно, что общение ведет цифровая система.
В планах добавление работы с текстом, точнее — окончаниями. Если собеседник говорит «я могла бы» — однозначно, это женщина. В ближайшее время эта технология будет дорабатываться и внедряться в систему распознавания.
Определение возраста собеседника
Зачем это нужно? В первую очередь, для того, чтобы не предлагать различные продукты и услуги несовершеннолетним. Кроме того, идентифицировать возраст полезно для того, чтобы персонализировать предложения по возрастным категориям.
Как это работает? Используются точно те же технологии, что и в предыдущем случае. Точность работы системы составляет около 90%.
Построение диалогов
И теперь приступаем к самому интересному — принципу построения диалогов.
Зачем это нужно? Для того, чтобы грамотно заменять человека, робот должен уметь работать как по линейному, так и по нелинейному сценариям ведения диалога. В первом случае это может быть опросник, во втором — работа с абонентами колл-центра, линии техподдержки компании и т.п.
А как это работает? Мы используем NLU Engine, основа которого — семантический разбор полученного от ASR-систем текста. Далее из него выделяются такие объекты распознавания, как entities (сущности) и intents (намерения), которые применяются в логике построения conversational flow.
Вот пример работы технологии.
Текст полученный от системы распознавания речи (ASR):
«Мне в целом интересно ваше предложение, но хотелось бы подешевле. И я сейчас немного занят, вы могли бы мне перезвонить завтра часиков в шесть».
Объекты, заполненные NLU Engine:
Intents:
confirmation=true
objection=expensive
question=null
callback=true
wrong_time=true
Entities:
date= 02.01.2019 (предположим, что дата звонка 01.01.2019)
time=18:00
amount=6
Принцип заполнения объектов в данном примере:
Теперь поговорим об алгоритмах работы, которые поддерживаются системой NLU Engine. Она включает два уровня.
Первый уровень — работает на относительно небольшой выборке данных порядка 600-1000 записей. Здесь используются ML-алгоритмы. Точность распознавания: 90-95%.
Второй уровень — переход на него осуществляется после запуска проекта и накопления большой выборки данных, включающей более 1 млн записей. Здесь уже используются DL-алгоритмы. Точность распознавания: 95-98%.
Решение работает с двумя подсистемами:
Подсистема формирования диалога для построения нелинейных сценариев построена на нейронной сети. На входе в систему передается распознанный из голосовой фразы текст абонента, на выходе — решение о том, что должно быть проиграно в следующий момент.
Для первой линии поддержки подходит нелинейный сценарий — робот не знает, кто звонит, по поводу какого именно продукта и с какими вопросами. Здесь от ответа клиента зависит дальнейшее построение диалога.
А вот для исходящего обзвона наилучшим решением будет линейный сценарий. Его пример был подан в самом начале статьи. Еще один вариант линейного сценария — проведение опроса, когда неважно, что именно ответит клиент, это будет анализироваться в дальнейшем специалистами. Зато важно провести клиента через все вопросы, которые есть в списке.
Как итог, хочется подчеркнуть, что голосовые роботы не заменят людей. Сейчас они отлично справляются с рутинной работой — обзвоном людей с целью задать им какие-то вопросы и выслушать/записать/проанализировать ответы. Таким образом, операторы колл-центров и техподдержки избавлены от необходимости проводить одни и те же рутинные процедуры. Вместо этого они могут сосредоточиться на решении действительно интересных вопросов и задач.