Архив новостей → Поговори со мной, компьютер...
Поговори со мной, компьютер...
Наконец-то речь становится способом коммуникации между человеком и компьютером - помогая снизить издержки в ведении бизнеса, создавать новые услуги в Интернете, сделать машины более безопасными средствами передвижения".
Информацию в компьютеры на заре вычислительной техники вносили, щелкая переключателями. Потом наступил период относительно более сложных методов загрузки данных - с помощью перфолент и перфокарт. Они, в свою очередь, уступили место клавиатуре, мышке, трекболу, джойстику, сенсорным панелям и экрану. При этом все время как-то забывали о речи - самой естественной и, вероятно, самой эффективной форме коммуникации. Если не принимать в расчет скромные достижения компьютерной индустрии в виде некоторых систем для диктовки текстов компьютерам, в основном люди обращались к ними в словесной форме только для того, чтобы как следует обругать их.
Теперь все меняется. Системы распознавания речи уже нередко можно видеть в колл-центрах телемаркетинговых фирм, в офисах финансовых посредников и авиакомпаний в США. А в Японии и Европе эти технологии внедряют в систему управления автомобилем для распознавания команд водителя.
Такие технологии, как автоматическое распознавание речи (АРР), идентификация личности говорящего, озвучиватели текста, получают все большую популярность. Они обеспечивают доступ к информации в любое время и в любом месте, где есть телефон.
Понятно, почему это вызывает такой энтузиазм: во всем мире около одного миллиарда телефонов, а темпы роста числа пользователей телефонной связи сопоставимы с геометрической прогрессией.
Людям не привыкать пользоваться телефоном, их не надо обучать этому делу. К тому же у них есть желание платить за телефонные услуги. Так почему это происходит сейчас, а не, скажем, пять лет назад?
До сегодняшнего дня технологии были дороги и экономически невыгодны. Только в прошлом году компьютеры, способные на серьезную работу, настолько потеряли и в цене, и в весе, что их стали запихивать в мобильные телефоны и PDA (персональный цифровой помощник). Вспыхнул спрос на возможности мгновенного доступа к информации, ведь все большее распространение получали каналы широкополосного доступа в Интернет, особенно в виде беспроводной сети Ethernet в общественных местах (аэропорты, гостиницы, кафе и офисы). Нужно было каким-то образом автоматизировать ответы на запросы. Между тем, хотя компьютеры и стали такими маленькими, что их уже можно было носить в кармане рубашки или крепить на пояс, размеры человеческих рук и пальцев остались прежними. Короче, у систем распознавания речи было резонное право на существование. Без нее людям трудно будет соответствовать тем требованиям, которые предъявляет к ним информационное общество.
Вас не слышно!
В последние годы распознавание речи медленно проникало в офисы. Но жизнь изменилась не благодаря программам для диктовки, этим ближайшим родственникам толстенных словарей, с рафинированными манерами речи. Их техническая структура оставляла желать лучшего, и единственное, что им действительно удавалось - это дискредитировать системы распознавания речи как таковые. Многие организации, желающие автоматизировать свои колл-центры, вовсе не интересуют такие тонкости, как умение отличать "I scream" от "ice-cream". Если они хотят установить автоматическую систему для обработки запросов о времени прилета или вылета рейсов, то им уже ясно, какие слова потребитель часто будет использовать в своих вопросах. Чем скромнее задачи, возложенные на такие системы, тем выше шансы, что они будут нормально функционировать.
Неудивительно, что в октябре в Нью-Йорке, на выставке SpeechTek 2001 царил всеобщий оптимизм. Хотя в целом этот год отличался вялотекущим ростом в отрасли информационных технологий, эксперты ожидают десятикратного роста рынка для систем распознавания речи в течение ближайших пяти лет. И это небеспочвенные заявления. В одной только Америке 80 000 колл-центров, которые вместе тратят $90 млрд на выполнение клиентских заказов. Если минута работы оператора-человека стоит $1, понятно, что системы распознавания речи дают возможность маркетинговым компаниям снижать издержки. Но интерес телефонных компаний и финансовых посреднических фирм основывается еще и на возможности автоматических систем распознавания речи улучшить качество и обеспечить устойчивость информационных услуг, ликвидируя очереди звонков. По выражению одного участника выставки, эти системы помогут избавить мир от "ада в тоновом режиме", когда многоуровневые телефонные меню с голосовой почтой чаще всего ведут звонящего по заколдованному кругу или загоняют его в тупик.
Один из американских финансовых брокеров, Charles Schwab, еще в 1996 г. внедрил в своей конторе голосовые системы для розничных брокерских услуг. В том же году количество клиентских счетов на фирме выросло на 41%, ее колл-центры обслужили 97 млн звонков. Эта система была установлена калифорнийской фирмой Nuance, ведущим провайдером подобных услуг. В Schwab машина-оператор понимает названия 15 000 ценных бумаг, обслуживает 100 000 звонков в день и с точностью до 93% распознает запросы с первого раза. Клиенты фирмы даже в часы пик получают мгновенный доступ к котировкам и торгам. При этом стоимость обслуживания одного звонка снизилась с $4-5 до $1.
Голос!
Сегодня многие системы АРР используют ограниченную форму распознавания речи - так называемый метод наведенной речи, когда агент-автомат задает вопросы, на которые отвечает звонящий. В следующем году компании Nuance и SpeechWorks International собираются разработать системы для работы на естественных языках. Такие системы будут понимать обычные запросы, сделанные в свободной форме, даже если в них не используются ключевые слова. В прошлом году AT&T, ведущий оператор междугородней и международной телефонной связи в Америке, установил такую систему в своем офисе поддержки клиентов. Она обрабатывает более двух миллионов звонков в месяц. Пока фирма не собирается продавать свое запатентованное изобретение.
А вот IBM поступает по-другому. Этот гигант компьютерной индустрии внедрил в T.Rowe Price, фирме - управляющей фондов, систему обработки запросов о пенсионных счетах на естественном языке. Она понимает запросы, сделанные в тысячах различных форм, включая особенности различных диалектов, структуры предложения и региональные акценты.
" The Economist 2001 Публикуется в соответствии с соглашением об эксклюзивной синдикации материалов в еженедельном журнале "Русский Фокус" на территории России. На сайте статья приведена в сокращенном варианте. Окончание читайте в печатной версии журнала.
00:04 10.12
Лента новостей
|
Форум → последние сообщения |
Галереи → последние обновления · последние комментарии →
Мяу : )![]() Комментариев: 4 |
Закрой глаза![]() Нет комментариев |
______![]() Нет комментариев |
ере![]() Комментариев: 2 |
IMG_0303.jpg![]() Комментариев: 2 |