Голосовое управление ПК Борисов В.А. – преподаватель информатики КАСК – филиала РАНХ и ГС
Введение В настоящее время попытки создания интеллектуального речевого интерфейса “человек-машина” все более перемещаются в реальную жизнь, а соответствующие системы стремятся занять свое место под солнцем в кабинах самолетов, рубках кораблей, трубках мобильных телефонов и т.д.
Актуальность Электронные приборы как бытовые, так и используемые в различной профессиональной деятельности людей, продолжают “обрастать” все новыми многофункциональными кнопками, значения которых не в состоянии быстро запомнить и эффективно использовать, особенно в условиях возможного дефицита времени, ни один нормальный человек.
Актуальность Позволит легко открывать необходимое приложение вместо длительного и скучного процесса поиска нужных файлов в различных системных директориях компьютера. Поможет работе с ПК людям с различными патологиями (например: зрения и др.). Облегчит работу с ПК в ситуациях, когда руки пользователя заняты.
Актуальность Еще лет 30 назад, а может быть и более, специалисты предрекали блестящее будущее подобным системам. Но предсказания не оправдались, несмотря на значительные успехи в области повышения надежности распознавания речи, в особенности команд из ограниченного набора.
Причины Существенную зависимость надежности распознавания от индивидуальных особенностей диктора Подчиненность результатов распознавания текущему психофизиологическому состоянию человека Сильное влияние акустических помех, присутствующих в ситуациях реальной жизниНаличие пользовательского стереотипа управления
Принципы работы Технология распознавания позволяет организовать одновременное распознавание 100-200 команд в дикторозависимом режиме. То есть, пользователь должен обучить каждую команду на свой голос, прежде чем система начнет работать. И 30-50 команд в дикторонезависимом режиме, но только для неизменного набора команд, для которого предварительно собирается база эталонов этих команд.
Принципы работы При этом пользователю не обязательно обучать систему перед началом работы. При правильном структурировании использования словаря, то есть когда на каждом уровне доступно 20-30 команд, возможно использование словарей практически неограниченного объема.
Ошибки распознавания 1) “Неизвестная команда --> известная недоступная команда” - (оператор ошибся, машина не смогла распознать ошибку); 2) “Неизвестная команда --> известная доступная команда ” - (оператор ошибся, машина не смогла распознать ошибку); 3) “Известная доступная команда ---> неизвестная команда ” (ошиблась машина);
Ошибки распознавания 4) “Известная недоступная команда --> неизвестная команда ” - (оператор ошибся, машина не смогла распознать ошибку); 5) “Известная доступная команда --> известная недоступная команда ” (ошиблась машина); 6) “Известная доступная команда --> известная доступная команда распознана неправильно ” (ошиблась машина).
Реакция компьютера Чтобы поведение машины выглядело дружелюбным и “интеллектуальным” возможны следующие основные варианты ее реакции:промолчать и ничего не делать; сообщить человеку о возможной ошибке и попросить повторить команду; предложить помощь, произнося доступные в данном режиме команды.
Реакция компьютера Совсем не лишним будет заранее “договориться” с машиной о том, как она будет интерпретировать молчание хозяина:молчит - выполнить команду; молчит - не выполнять команду; молчит - у хозяина отказали мозги или пропал голос, запрошу еще раз, а там видно будет…
Программы для голосового управления компьютером
DragonDictate for Windows 3.0 Программа для контроля за работой и предоставления возможности диктования для Microsoft Windows 95, Windows NT и Windows 3.x. Пакет позволяет виртуально поддерживать многие приложения Windows, включая Corel WordPerfect Suite, Lotus SmartSuite и Microsoft Office. Вы можете также осуществить поддержку других программ, использовать мощный редактор макросов. DragonDictate позволяет диктовать в любом приложении, а также поддерживать широкий набор голосовых команд редактирования и навигации.
Voice Systems Listen 3.0 for Windows Программа предоставляет список предусмотренных команд, который изменяется в зависимости от контекста речевой акции и приложения, в котором используется. Предусмотрена возможность добавлять новые команды. Следует отметить несколько сложный процесс тренировки, предусматривающий, в частности, голосовой контроль размера шрифта от 1 до 99. Утешением может служить то, что это придется делать лишь единожды.
Simply Speaking Gold Программа для голосового контроля, предусматривающая также возможность дискретного диктования. Прежде чем дать голосовую команду, следует прекратить диктование. Есть возможность использовать подсказку "Что я могу сказать?", открывающую окно со списком команд, работающим в данном приложении. Сопутствующая документация очень слаба, однако ее расширенный вариант доступен через Интернет.
VoicePlus Программа для голосовых команд. Вы можете использовать ее для диктования в различных Windows-приложениях, а открыв специальное окно, произвести побуквенную транскрипцию слов. Новая программа компании L&H Voice Xpress поддерживает режим непрерывной речи и полный набор голосовых команд.
VoiceCommands Разработана специально для Microsoft Word. Она не поддерживает режим диктования вообще, однако имеет широкий набор команд редактирования и форматирования.
Горыныч Программа распознавания русской речи. Программный комплекс "Горыныч" – первая русскоязычная система автоматического распознавания речи. Программа для диктовки и голосового управления компьютером по-русски.
ввод текста с голоса на русском и английском языке;голосовое управление периферийным оборудованием; голосовое управление отдельными функциями операционных систем Microsoft Windows; голосовое управление функциями текстовых редакторов и прикладных программ; позволяет оформлять документы, дипломные работы (включая формулы) для школьников, абитуриентов, студентов.
Заключение Предложенный подход к созданию систем речевого управления в части психолого-эргономических аспектов проектирования интерфейса “человек – машина” для работы на ограниченном наборе речевых команд был достаточно успешно апробирован при создании компьютерных прототипов систем речевого управления общего назначения с использованием собственного оригинального программного обеспечения процедуры распознавания.
Ресурсы http://209.85.135.132/search?q=cache:VOQlfj8TQwkJ:www.evarussia.ru/upload/doklad/doklad_198.rtf+%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%BE%D0%B5+%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5+%D0%BA%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BE%D0%BC+%D0%B4%D0%BE%D0%BA%D0%BB%D0%B0%D0%B4&cd=3&hl=ru&ct=clnk&gl=ruhttp://mixzona.ru/referat/referat/73201/http://103.by/blog/tag/upravlenie-kompyuterom-golosom/http://speech-soft.ru/index.php?a=inf&inf=rasp
Спасибо за внимание