PowerPoint 9 страница

б дикторонезависимые (рискую предложить термин "омнивойс"),

б распознающие отдельные слова,

б распознающие слитную речь.

По механизмам функционирования:

б простейшие (корреляционные) детекторы,

б экспертные системы с различным способом формирования и обработки базы знаний,

б вероятностно-сетевые модели принятия решения, в том числе нейронные сети.



В настоящее время на рынке представлено множество коммерческих систем распознавания речи:

б Voice Type Dictation, Voice Pilot и ViaVoice от IBM;

б Dragon Dictate и Naturally Speaking от Dragon Systems;

б Voice Assist от Creative Technology;

б Listen for Windows от Verbex и многие другие.

Проведем сравнительный анализ существующих программ по распознаванию речи.

Программный комплекс "Горыныч" (разработчик: VoiceLock, соразработчик: российская фирма White Computers) - первая русскоязычная система автоматического распознавания речи. Словарь программы содержит 10 тысяч слов. С помощью данной программы можно вводить текст с голоса на русском и английском языке. Скорость голосового набора текстов зависит от производительности компьютера и может достигать 500-700 печатных знаков в минуту, что значительно превышает скорость "слепого" метода печатания. При этом система "Горыныч" осуществляет автоматический контроль правописания: в текстах, введенных с ее помощью. Во время работы можно пользоваться клавиатурой и мышкой. Система позволяет работать с несколькими библиотеками произношений - их количество может достигать восьми на одном рабочем месте. При диктовке слова необходимо произносить отдельно, делая небольшие паузы. Слово произносится без учета его грамматического написания. Неверное распознанное слово может быть исправлено либо с помощью клавиатуры, либо путем выбора нужного слова из списка предложенных вариантов.

Системные требования: Microsoft Windows 95/98/NT. Свободное пространство на жестком диске - минимум 25 Мб. Процессор - не ниже 133 МГц. Оперативная память - не менее 16 Мб (для Windows NT - 32Мб). Звуковые карты среднего и высшего (например, 16-ти разрядная звуковая карта, имеющая микрофонный вход).

Программа распознавания русской речи - "Комбат" московской фирмы "Вайт Груп" - русифицированная версия программы Dragon Dictate. Представляет собой программу ввода текстов с помощью микрофона в компьютер. "Комбат" позволяет настраиваться на очень широкий диапазон голосов: от детского или женского до мужского.

Система облегчает работу с компьютером слабовидящим людям и инвалидам с травмами рук, так как позволяет управлять практически всей операционной системой компьютера с помощью голоса. Скорость вводимого текста составляет от 350 до 600 знаков в минуту, в зависимости от производительности компьютера, при этом сохраняется возможность пользования, как мышкой, так и клавиатурой. Слова необходимо произносить очень четко, медленно и с небольшими паузами (степень распознавания текста 30 %).

Программа при инсталляции в зависимости от оперативной системы загружает либо 16-ти разрядные, либо 32-х разрядные драйвера. Для установки и эксплуатации системы необходим привод CD-ROM и электретный микрофон, который в меньшей степени (по сравнению с динамическим) реагирует на посторонние внешние шумы.

Компания "Сакрамент"разработала собственные модули распознавания отдельных слов и речевых команд, которые могут быть использованы в любом из приложений для решения самого широкого спектра задач, в том числе и для работы с белорусским и украинским языками. Разработанный модуль раздельного распознавания слов позволяет вводить цифры от 0 до 9 и 20 основных команд, присущих стандартному MS Windows Calculator. Модуль распознавания изолированных слов имеет словарь на 300 слов, точность составляет 95-98%, его можно внедрять в различные приложения.

Программный комплекс Philips FreeSpeech, разработан компанией . Он дает возможность диктовать текст в любой программе для Windows, где есть ввод текста, а также позволяет управлять перемещениями по меню и окнам на Рабочем столе. Словарь содержит 64 тысячи слов. Однако данный программный комплекс не распознает русского языка. В отличие от других пакетов, FreeSpeech требует ручного переключения между диктовкой, управлением, диктовкой по буквам и режимом "сна". Соответствующие команды можно подавать голосом, но скорость и качество распознавания невелики. Системные требования: Pentium MMX-166, память 32 Мбайт, 64 Мбайт на жестком диске, 16-разрядная звуковая плата.

Dragon NaturallySpeaking Preferred, разработанный компанией Dragon один из лучших программных пакетов. Он обладает высокой степенью распознавания речи (62 тысячи слов) и прост в использовании. С Dragon можно работать двумя способами: во-первых, пакет позволяет диктовать в своем текстовом окне (получившийся документ затем вставляется в нужную программу), во-вторых, он содержит встроенные утилиты, обеспечивающие ввод непосредственно в окне текстового процессора, почтовой программы, электронной таблицы. В качестве недостатка данной программы можно отметить неудобный ввод чисел, посредственное управление экраном и отсутствие распознавания текста на русском языке. Системные требования: Pentium-133, память 32 Мбайт, 60 Мбайт на жестком диске, 16-разрядная звуковая плата.

Программный комплекс Voice Xpress Professiona, разработанный компанией Lernout & Hauspie Данная система хорошо интегрируется с компонентами Microsoft Office,обладает хорошим распознаванием чисел, но уступает программе Dragon в качестве распознавания слов и команд. Также качество распознавания текста неравномерное, команды управления и форматирования иногда воспринимаются неправильно, а паузы необходимо делать перед командой и после нее. С другой стороны пакет обладает лучшей из всех рассмотренных системой исправления ошибок. Системные требования: Pentium MMX-166, память 48 Мбайт, 130 Мбайт на жестком диске, 16-разрядная звуковая плата.


2299689858335736.html
2299738498476936.html
    PR.RU™