PPt4Web Хостинг презентаций

Главная / Информатика / Основные классы естественно-языковых систем. Системы распознавания речи
X Код для использования на сайте:

Скопируйте этот код и вставьте его на свой сайт

X

Чтобы скачать данную презентацию, порекомендуйте, пожалуйста, её своим друзьям в любой соц. сети.

После чего скачивание начнётся автоматически!

Кнопки:

Презентация на тему: Основные классы естественно-языковых систем. Системы распознавания речи


Скачать эту презентацию

Презентация на тему: Основные классы естественно-языковых систем. Системы распознавания речи


Скачать эту презентацию



№ слайда 1 Новые информационные технологии Харламов Александр Александрович © 2012 МГЛУ Ин.
Описание слайда:

Новые информационные технологии Харламов Александр Александрович © 2012 МГЛУ Ин. яз. им. М. Тореза

№ слайда 2 Лекция № 2. Основные классы естественно-языковых систем. Системы распознавания р
Описание слайда:

Лекция № 2. Основные классы естественно-языковых систем. Системы распознавания речи

№ слайда 3 Основные классы естественно-языковых систем Средства распознавания речи распозна
Описание слайда:

Основные классы естественно-языковых систем Средства распознавания речи распознают голосовую (речевую) информацию и преобразуют ее в последовательность символов 13

№ слайда 4 Основные классы естественно-языковых систем Средства распознавания речи распозна
Описание слайда:

Основные классы естественно-языковых систем Средства распознавания речи распознают голосовую (речевую) информацию и преобразуют ее в последовательность символов 13

№ слайда 5 7 Структура коммуникационной системы для организации речевого поведения
Описание слайда:

7 Структура коммуникационной системы для организации речевого поведения

№ слайда 6 8 Информационно-кодовая модель коммуникации Шеннона и Уивера
Описание слайда:

8 Информационно-кодовая модель коммуникации Шеннона и Уивера

№ слайда 7 10 Адресант передает, а адресат принимает одно из группы событий (классов, к кот
Описание слайда:

10 Адресант передает, а адресат принимает одно из группы событий (классов, к которым относятся передаваемые и получаемые сообщения). Группа событий обладает следующими свойствами (она - полная): 1) все события попарно несовместны: ; 2) их объединение образует пространство элементарных исходов : Правило Байеса

№ слайда 8 11 Правило Байеса Пусть - полная группа событий и – некоторое событие. Тогда по
Описание слайда:

11 Правило Байеса Пусть - полная группа событий и – некоторое событие. Тогда по формуле Байеса исчисляется вероятность реализации гипотезы при условии, что событие А произошло. Здесь А – конкретное наблюдение (измерение). - априорная вероятность гипотезы - апостериорная вероятность известны функции распределения вектора признаков для каждого класса

№ слайда 9 12 Правило Байеса В случае двух классов и , если то классифицируется в , иначе в
Описание слайда:

12 Правило Байеса В случае двух классов и , если то классифицируется в , иначе в .

№ слайда 10 13 Правило Байеса
Описание слайда:

13 Правило Байеса

№ слайда 11 14 Правило Байеса
Описание слайда:

14 Правило Байеса

№ слайда 12 15 Информационно-кодовая модель коммуникации Шеннона и Уивера, модифицированная
Описание слайда:

15 Информационно-кодовая модель коммуникации Шеннона и Уивера, модифицированная для коммуникационного акта Якобсоном

№ слайда 13 3 Автоматическое распознавание речи Общая блок-схема ориентированной на задачу с
Описание слайда:

3 Автоматическое распознавание речи Общая блок-схема ориентированной на задачу системы распознавания-синтеза речи

№ слайда 14 20 Речевая волна во временной и частотной областях
Описание слайда:

20 Речевая волна во временной и частотной областях

№ слайда 15 уровень семантических представлений (словарь попарной сочетаемости слов) синтакс
Описание слайда:

уровень семантических представлений (словарь попарной сочетаемости слов) синтаксический уровень (словарь синтаксем) лексикон (словарь корневых основ) морфологический уровень (словарь окончаний) акустико-фонетический уровень Процесс восприятия речи человеком Структура речевой информации 31

№ слайда 16 Системы распознавания речи 1. Системы покомандного распознавания 2. Системы расп
Описание слайда:

Системы распознавания речи 1. Системы покомандного распознавания 2. Системы распознавания ключевых слов в потоке слитной речи 3. Системы распознавания связной речи 4. Системы распознавания слитной речи 54

№ слайда 17 Системы покомандного распознавания Средства голосового ввода, управления и сбора
Описание слайда:

Системы покомандного распознавания Средства голосового ввода, управления и сбора данных предназначены для ввода голосовых команд, управляющих работой некоторой системы (например бытовой техникой) 14

№ слайда 18 лексикон (словарь корневых основ) акустико-фонетический уровень Системы покоманд
Описание слайда:

лексикон (словарь корневых основ) акустико-фонетический уровень Системы покомандного распознавания 31

№ слайда 19 38 1) Формирование вектора признаков 2) Сегментация 3) Сравнение входного и этал
Описание слайда:

38 1) Формирование вектора признаков 2) Сегментация 3) Сравнение входного и эталонных образов 4) Принятие решения Покомандное распознавание речи Базовый алгоритм покомандного распознавания

№ слайда 20 39 Покомандное распознавание речи Имеется три основных подхода к покомандному ра
Описание слайда:

39 Покомандное распознавание речи Имеется три основных подхода к покомандному распознаванию речи 1. Подход, основанный на распознавании образов 2. Акустико-фонетический (структурный) подход 3. Подход, основанный на использовании искусственных нейронных сетей

№ слайда 21 44 Подход, основанный на распознавании образов Блок-схема распознавателя речи на
Описание слайда:

44 Подход, основанный на распознавании образов Блок-схема распознавателя речи на основе подхода, основанного на распознавании образов

№ слайда 22 47 Подход, основанный на распознавании образов Алгоритм включает четыре основных
Описание слайда:

47 Подход, основанный на распознавании образов Алгоритм включает четыре основных шага: 1) Измерение первичных признаков речевого сигнала. Вычисляются спектральные признаки, либо с помощью гребенки фильтров, либо с помощью линейного предсказывающего кодирования, либо с помощью Дискретного преобразования Фурье 2) Формирование эталонов (обучение). Эталоны формируются с помощью некоторых усредняющих процедур. Это может быть модель, характеризующая статистику признаков эталона.

№ слайда 23 47 Подход, основанный на распознавании образов Алгоритм включает четыре основных
Описание слайда:

47 Подход, основанный на распознавании образов Алгоритм включает четыре основных шага: 3) Классификация, во время которой входной образ сравнивается с эталонами. Сравнение образов, которые есть последовательность векторов признаков, осуществляется с использованием как локального расстояния между двумя синхронными векторами, так и глобальной выравнивающей во времени процедуры (чаще всего, это процедура динамического программирования), которая компенсирует различные скорости произнесения входного и эталонного образов 4) Принятие решения

№ слайда 24 45 Подход, основанный на распознавании образов Достоинства подхода: 1. Простота.
Описание слайда:

45 Подход, основанный на распознавании образов Достоинства подхода: 1. Простота. Он легко интерпретируется 2. Имеется хорошо развитый математический аппарат для всех процедур подхода 3. Устойчивость и инвариантность к различным словарям, пользователям, выбору признаков, использования алгоритмов сравнения образов и принятия решения, а также групп дикторов, используемого оборудования, канала 4. Не зависит от выбора речевой единицы: от фонемы до фразы. Дает хорошие результаты в широком круге задач

№ слайда 25 46 Подход, основанный на распознавании образов Недостатки: 1. Чувствительность к
Описание слайда:

46 Подход, основанный на распознавании образов Недостатки: 1. Чувствительность к объему обучающей выборки 2. Подверженность качества распознавания влиянию шума 3. Неиспользование лингвистической информации 4. Большая вычислительная емкость

№ слайда 26 41 Акустико-фонетический подход Фонетические гипотезы, полученные при распознава
Описание слайда:

41 Акустико-фонетический подход Фонетические гипотезы, полученные при распознавании строки слов «all about»

№ слайда 27 41 Акустико-фонетический подход Диаграмма классификации стандартных фонем америк
Описание слайда:

41 Акустико-фонетический подход Диаграмма классификации стандартных фонем американского английского в широкие звуковые классы

№ слайда 28 42 Акустико-фонетический подход Бинарное дерево классификации речевых звуков
Описание слайда:

42 Акустико-фонетический подход Бинарное дерево классификации речевых звуков

№ слайда 29 42 Акустико-фонетический подход Акустико-фонетический классификатор гласных
Описание слайда:

42 Акустико-фонетический подход Акустико-фонетический классификатор гласных

№ слайда 30 40 Сравнение подходов, основанного на распознавании образов и на основе акустико
Описание слайда:

40 Сравнение подходов, основанного на распознавании образов и на основе акустико-фонетического анализа

№ слайда 31 51 Подход, основанный на искусственных нейронных сетях Многослойный персептрон д
Описание слайда:

51 Подход, основанный на искусственных нейронных сетях Многослойный персептрон для классификации гласных, основанной на формантных измерениях

№ слайда 32 Искусственные нейронные сети Трехслойный персептрон * - сравнивает с порогом - в
Описание слайда:

Искусственные нейронные сети Трехслойный персептрон * - сравнивает с порогом - вычисляет сумму

№ слайда 33 52 Подход, основанный на искусственных нейронных сетях Нейронная сеть с задержка
Описание слайда:

52 Подход, основанный на искусственных нейронных сетях Нейронная сеть с задержками

№ слайда 34 38 1) Формирование вектора признаков 2) Сегментация 3) Сравнение входного и этал
Описание слайда:

38 1) Формирование вектора признаков 2) Сегментация 3) Сравнение входного и эталонных образов 4) Принятие решения Покомандное распознавание речи Базовый алгоритм покомандного распознавания

№ слайда 35 60 Оцифровка речевого сигнала
Описание слайда:

60 Оцифровка речевого сигнала

№ слайда 36 53 Первичная обработка Наиболее характерные подходы: 1. Спектральный анализ 2. А
Описание слайда:

53 Первичная обработка Наиболее характерные подходы: 1. Спектральный анализ 2. Антропоморфная модель

№ слайда 37 57 Спектральный анализ Типичный вид речевой волны и ее спектра в модели анализа
Описание слайда:

57 Спектральный анализ Типичный вид речевой волны и ее спектра в модели анализа на основе гребенки фильтров

№ слайда 38 54 Спектральный анализ На основе гребенки фильтров
Описание слайда:

54 Спектральный анализ На основе гребенки фильтров

№ слайда 39 54 Спектральный анализ На основе гребенки фильтров
Описание слайда:

54 Спектральный анализ На основе гребенки фильтров

№ слайда 40 21 Представление речи в виде формантных траекторий Для последовательности «Why d
Описание слайда:

21 Представление речи в виде формантных траекторий Для последовательности «Why do I owe you a letter»

№ слайда 41 21 Сегментация Сегментация и разметка для последовательности «did-you»
Описание слайда:

21 Сегментация Сегментация и разметка для последовательности «did-you»

№ слайда 42 75 Принятие решения Динамическое программирование Байесовское правило Скрытые Ма
Описание слайда:

75 Принятие решения Динамическое программирование Байесовское правило Скрытые Марковские модели

№ слайда 43 75 Принятие решения Ключевым вопросом в распознавании речи является вопрос сравн
Описание слайда:

75 Принятие решения Ключевым вопросом в распознавании речи является вопрос сравнения входного образа с эталонными образами с целью выяснения степени их подобия Обычно входной и эталонный образы имеют разную длину

№ слайда 44 75 Принятие решения Сравниваемые образы не могут быть нормализованы по длительно
Описание слайда:

75 Принятие решения Сравниваемые образы не могут быть нормализованы по длительности, поскольку различные типы звуков имеет различные возможности по удлинению произнесения Необходимо найти способ сравнения спектральных векторов такой, чтобы можно было вычислять глобальную меру совпадения образов

№ слайда 45 76 Динамическое программирование
Описание слайда:

76 Динамическое программирование

№ слайда 46 83 Адресант передает, а адресат принимает одно из группы событий (классов, к кот
Описание слайда:

83 Адресант передает, а адресат принимает одно из группы событий (классов, к которым относятся передаваемые и получаемые сообщения). Группа событий обладает следующими свойствами (она - полная): 1) все события попарно несовместны: ; 2) их объединение образует пространство элементарных исходов : Правило Байеса

№ слайда 47 11 Правило Байеса Эти вероятности можно оценить методами математической статисти
Описание слайда:

11 Правило Байеса Эти вероятности можно оценить методами математической статистики на множестве прецедентов. , где - число прецедентов из , - общее число прецедентов. - гистограмма распределения вектора признаков для прецедентов из класса .

№ слайда 48 11 Системы покомандного распознавания Классы ЕЯ систем Уровни представления инфо
Описание слайда:

11 Системы покомандного распознавания Классы ЕЯ систем Уровни представления информации (функции) Акустико-фонети-ческий Морфоло-гический Лекси-ческий Синтакси-ческий Модель мира Прагма-тический Сравнение (классификация) Системы распознавания речи Системы покомандного распозна-вания + - + - - - +

№ слайда 49 Системы распознавания слитной речи Системы типа «Речь-текст» предназначены для р
Описание слайда:

Системы распознавания слитной речи Системы типа «Речь-текст» предназначены для распознавания слитной речи (например для диктовки деловой корреспонденции) 14

№ слайда 50 39 Распознавание слитной речи Имеется два подхода к распознаванию слитной речи:
Описание слайда:

39 Распознавание слитной речи Имеется два подхода к распознаванию слитной речи: 1. Подход, основанный на распознавании образов 2. Структурный подход

№ слайда 51 44 Подход, основанный на распознавании образов Блок-схема распознавателя речи на
Описание слайда:

44 Подход, основанный на распознавании образов Блок-схема распознавателя речи на основе подхода, основанного на распознавании образов

№ слайда 52 уровень семантических представлений (словарь попарной сочетаемости слов)уровень
Описание слайда:

уровень семантических представлений (словарь попарной сочетаемости слов)уровень семантических представлений (словарь попарной сочетаемости слов)синтаксический уровень (словарь синтаксем)лексикон (словарь корневых основ)морфологический уровень (словарь окончаний)акустико-фонетический уровень

№ слайда 53 90 Подход, основанный на распознавании образов Модель фонемы
Описание слайда:

90 Подход, основанный на распознавании образов Модель фонемы

№ слайда 54 94 Подход, основанный на распознавании образов Составление эталонных сигналов сл
Описание слайда:

94 Подход, основанный на распознавании образов Составление эталонных сигналов слов из фонем в соответствие с моделью произношения sкін. 1 1 1 1 1 0 1 1 1 1 1 0 sпоч. 1 1 1 1 1 0 1 1 1 sпоч. sкін. 1 1 1 1 1 0 1 1 1 1 1 0 sпоч. sкін. 1 1 0 k = 1 k = 2 k = 3

№ слайда 55 97 Подход, основанный на распознавании образов Модель предложения с произвольным
Описание слайда:

97 Подход, основанный на распознавании образов Модель предложения с произвольным порядком следования моделей слов и моделей фонем в предложении

№ слайда 56 44 Подход, основанный на распознавании образов Блок-схема распознавателя речи на
Описание слайда:

44 Подход, основанный на распознавании образов Блок-схема распознавателя речи на основе подхода, основанного на распознавании образов

№ слайда 57 48 Структурный подход «Снизу-вверх» подход интеграции знаний для Распознавания с
Описание слайда:

48 Структурный подход «Снизу-вверх» подход интеграции знаний для Распознавания слитной речи

№ слайда 58 49 Структурный подход «Сверху-вниз» подход к интеграции знаний для распознавания
Описание слайда:

49 Структурный подход «Сверху-вниз» подход к интеграции знаний для распознавания слитной речи

№ слайда 59 50 Структурный подход Подход, основанный на концепции классной доски для интегра
Описание слайда:

50 Структурный подход Подход, основанный на концепции классной доски для интеграции знаний

№ слайда 60 50 Структурный подход Взаимодействие между источниками знаний разных уровней
Описание слайда:

50 Структурный подход Взаимодействие между источниками знаний разных уровней

№ слайда 61 50 Структурный подход Частичные гипотезу на разных уровнях
Описание слайда:

50 Структурный подход Частичные гипотезу на разных уровнях

№ слайда 62 52 Модель языка на основе многослойного персептрона Структурный подход (синтакси
Описание слайда:

52 Модель языка на основе многослойного персептрона Структурный подход (синтаксический уровень)

№ слайда 63 11 Системы распознавания слитной речи Классы ЕЯ систем Уровни представления инфо
Описание слайда:

11 Системы распознавания слитной речи Классы ЕЯ систем Уровни представления информации (функции) Акустико-фонети-ческий Морфоло-гический Лекси-ческий Синтакси-ческий Модель мира Прагма-тический Сравнение (классификация) Системы распознавания речи Системы распозна-вания слитной речи + + + + + -(+) +

№ слайда 64 4 Сравнение эффективности распознавания человеком и искусственными системами Зад
Описание слайда:

4 Сравнение эффективности распознавания человеком и искусственными системами Задача Процент ошибок человека Процент ошибок ИСРР База \"TI46\", SNR ~60 дБ Звуки, обозначающие буквы алфавита 1.6% 1 5% 2 База \"TI digits\", SNR ~60 дБ Цифровые последовательности 0.009% 0.72% 0.105% 3 База \"Resource Management\", SNR ~60 дБ (словарь 1000 слов, языковое моделирование) 0.1% 3.6% База \"Resource Management\", SNR ~60 дБ (словарь 1000 слов, нет модели языка) 2% 17% База \"Wall Street Journal\", SNR ~60 дБ (словарь 5000 слов, чтение) 0.9% 7.2%

№ слайда 65 4 Сравнение эффективности распознавания человеком и искусственными системами (пр
Описание слайда:

4 Сравнение эффективности распознавания человеком и искусственными системами (продолжение) База \"Switchboard\", SNR ~60дБ (задача распознавания спонтанной речи) 4% 43% База “Corpus of Spontaneous Japanese”, SNR ~ 60 дБ (задача распознавания спонтанной речи) 4% 9% База \"Switchboard\", SNR ~60 дБ (задача выделения 20 ключевых слов) 12.8% 4 31.1% 7.4% 5 Слитная речь, SNR ~60 дБ (словарь 20000, чтение) 2.6% 12.6% 1 - распознавание последовательностей 2 - распознавание изолированных слов 3 - распознавание вокодерной речи (модель линейного предсказания 12-го порядка) 4 - отсутствие контекста, бессмысленный поток слов 5 - осмысленный контекст ~ 2 сек

№ слайда 66 4 Сравнение эффективности распознавания человеком и искусственными системами в у
Описание слайда:

4 Сравнение эффективности распознавания человеком и искусственными системами в условиях шума Отношение Сигнал-Шум Процент ошибок человека Процент ошибок ИСРР SNR ~60 дБ ~1% ~1% SNR 18 дБ ~1% ~10% SNR 12 дБ ~1% ~25% SNR 6 дБ ~1% ~60% SNR 0 дБ ~1% ~100%

№ слайда 67 4 Диалог человека и машины Существует два типа таких систем Системы первого типа
Описание слайда:

4 Диалог человека и машины Существует два типа таких систем Системы первого типа ведут человека, следуя четкому порядку заполнения определенных форм. Примером такой системы может стать заказ билетов. В каждом из состояний система настраивается на распознавание заранее приготовленных атрибутов, допуская варианты возврата к предыдущему шагу или выходу из системы В системах второго типа человеку отводится роль собеседника, который может сам проявлять интерес к разным аспектам информации, задавая любые вопросы.

№ слайда 68 3 Общая блок-схема ориентированной на задачу системы речевого диалога Диалог чел
Описание слайда:

3 Общая блок-схема ориентированной на задачу системы речевого диалога Диалог человека и машины

№ слайда 69 4 Диалог человека и машины Классификация систем устного диалога по направлению п
Описание слайда:

4 Диалог человека и машины Классификация систем устного диалога по направлению потока информации Тип системы Поток информации Примеры Объяснение Система Пользователь Прокладка маршрута, обучение Заполнение форм Пользователь Система Покупки по телефону, перенаправление абонента Получение информации Пользователь Система Резервирование гостиницы, поиск литературы

№ слайда 70 4 Диалог человека и машины Классификация систем устного диалога по структуре инф
Описание слайда:

4 Диалог человека и машины Классификация систем устного диалога по структуре информации Структура информации Тип системы Распознавание речи Семантическая интерпретация Стратегия диалога Реляционная БД Запрос к БД Ограничен-ное граммати-кой, заданной экспертом Отображение результата понимания на SQL-запрос Заполнение необходимых форм и подтверждение второстепенных ЕЯ текст Извлечение документа Статисти-ческая модель Извлечение информации (векторно-простран-ственная модель) Уточнение запросов и ограничение совпадающих элементов

Скачать эту презентацию


Презентации по предмету
Презентации из категории
Лучшее на fresher.ru