Главная / Информатика / Системы оптического распознавания документов

Презентация на тему: Системы оптического распознавания документов

Получить код Наши баннеры

Системы оптического распознавания документов

Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредак…

Оптическое распознавание символов Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, исполь…

Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. Далее выделен…

Хорошее качество текста Растровый метод распознавания текста Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и в…

Хорошее качество текста Растровый метод распознавания текста Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является…

Плохое качество текста Структурный метод распознавания

Плохое качество текста Структурный метод распознавания При pacпознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для…

Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) р…

Системы оптического распознавания форм Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и отведено место для переменной. Сложность состоит в том, что необходимо распознать написанные от руки символы, довольно …

Системы оптического распознавания форм Для обработки бланков предназначено специальное приложение FineReader Forms. Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Сервис/ Шаблоны Шаблон используют на этапе сегме…

Системы распознавания рукописного текста С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьюте…

Системы распознавания рукописного текста

Принцип работы сканера состоит в следующем: в результате преобразования света получается электрический сигнал, содержащий информацию об активности цвета в исходной точке сканируемого изображения. После оцифровки аналогового сигнала в АЦП цифровой си…

Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition - OCR). Современная OCR должна уметь многое: распознавать тексты, набранные не тольк…

ABBYY FineReader Популярная проприетарная программа распознавания текста компании ABBYY Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распозна…

Процесс обработки FineReader Сканирование (сканер, цифровой фотоаппарат, цифровая видеокамера). Сегментация - выделение блоков на изображении. Распознавание – неоднозначно опознанные символы выделяются цветом. Проверка ошибок- можно провести проверк…

1 из 20

Презентация на тему: Системы оптического распознавания документов

Скачать эту презентацию

№ слайда 1 Системы оптического распознавания документов

Описание слайда:

Системы оптического распознавания документов

№ слайда 2 Системы оптического распознавания символов При coздании электронных библиотек и

Описание слайда:

Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов.

№ слайда 3 Оптическое распознавание символов Оптическое распознавание символов (англ.

Описание слайда:

Оптическое распознавание символов Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. С помощью сканера несложно получить изображение страницы текста в графическом файле.

№ слайда 4

Описание слайда:

№ слайда 5 Сначала необходимо распознать структуру размещения текста на странице: выделить

Описание слайда:

Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. Далее выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст.

№ слайда 6 Хорошее качество текста Растровый метод распознавания текста Сначала растровое и

Описание слайда:

Хорошее качество текста Растровый метод распознавания текста Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством точек, отличных от входного изображения.

№ слайда 7 Хорошее качество текста Растровый метод распознавания текста Растровое изображен

Описание слайда:

Хорошее качество текста Растровый метод распознавания текста Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого в наибольшей степени совпадает с изображением

№ слайда 8 Плохое качество текста Структурный метод распознавания

Описание слайда:

Плохое качество текста Структурный метод распознавания

№ слайда 9 Плохое качество текста Структурный метод распознавания При pacпознавании структу

Описание слайда:

Плохое качество текста Структурный метод распознавания При pacпознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего coответствуют распознаваемому символу.

№ слайда 10 Системы оптического распознавания форм При проведении Единого государственного э

Описание слайда:

Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных. Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст.

№ слайда 11 Системы оптического распознавания форм Бланком называется стандартный лист бумаг

Описание слайда:

Системы оптического распознавания форм Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и отведено место для переменной. Сложность состоит в том, что необходимо распознать написанные от руки символы, довольно сильно различающиеся у разных людей. Кроме того система должна определить, к какому полю относится распознаваемый текст.

№ слайда 12 Системы оптического распознавания форм Для обработки бланков предназначено специ

Описание слайда:

Системы оптического распознавания форм Для обработки бланков предназначено специальное приложение FineReader Forms. Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Сервис/ Шаблоны Шаблон используют на этапе сегментации. Сегментация в данном случае состоит в наложении шаблона. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещён бланк при сканировании. Заключительный этап состоит в распознавании содержимого бланка.

№ слайда 13 Системы распознавания рукописного текста С появлением первого карманного компьют

Описание слайда:

Системы распознавания рукописного текста С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

№ слайда 14 Системы распознавания рукописного текста

Описание слайда:

Системы распознавания рукописного текста

№ слайда 15

Описание слайда:

№ слайда 16

Описание слайда:

№ слайда 17 Принцип работы сканера состоит в следующем: в результате преобразования света по

Описание слайда:

Принцип работы сканера состоит в следующем: в результате преобразования света получается электрический сигнал, содержащий информацию об активности цвета в исходной точке сканируемого изображения. После оцифровки аналогового сигнала в АЦП цифровой сигнал через аппаратный интерфейс сканера идет в компьютер, где его получает и анализирует программа для работы со сканером. После окончания одного такого цикла (освещение оригинала — получение сигнала — преобразование сигнала — получение его программой) источник света и приемник светового отражения перемещается относительно оригинала. Принцип работы сканера состоит в следующем: в результате преобразования света получается электрический сигнал, содержащий информацию об активности цвета в исходной точке сканируемого изображения. После оцифровки аналогового сигнала в АЦП цифровой сигнал через аппаратный интерфейс сканера идет в компьютер, где его получает и анализирует программа для работы со сканером. После окончания одного такого цикла (освещение оригинала — получение сигнала — преобразование сигнала — получение его программой) источник света и приемник светового отражения перемещается относительно оригинала.

№ слайда 18 Программы распознавания текста Преобразованием графического изображения в текст

Описание слайда:

Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition - OCR). Современная OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами, но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст — это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата — скажем, формата Microsoft Word.

№ слайда 19 ABBYY FineReader Популярная проприетарная программа распознавания текста компани

Описание слайда:

ABBYY FineReader Популярная проприетарная программа распознавания текста компании ABBYY Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг.

№ слайда 20 Процесс обработки FineReader Сканирование (сканер, цифровой фотоаппарат, цифрова

Описание слайда:

Процесс обработки FineReader Сканирование (сканер, цифровой фотоаппарат, цифровая видеокамера). Сегментация - выделение блоков на изображении. Распознавание – неоднозначно опознанные символы выделяются цветом. Проверка ошибок- можно провести проверку грамматики. Сохранение результатов в виде отформатированного или неотформатированного документа, или прямой передачи в другое приложение - WORD, Excel в буфер обмена Windows.

Скачать эту презентацию

Презентации по предмету

Системы оптического распознавания документов

Системы оптического распознавания документов

История обработки текстовых документов. Макет

Стили создания документов

Системы распознавания текста

Создание комбинированных документов ,Семейное дерево

Печать документов

Оформление информационно-справочных документов

Классификация и структура организационно - распорядительных документов

Общие нормы и правила оформления документов

Стиль официальных документов: требования к языку

Оформление организационных документов

Презентация на тему: Системы оптического распознавания документов

Локальные и глобальные компьютерные сети

Кодирование и обработка звуковой информации

Программа Блокнот

Циклы на языке Паскаль

Информационное общество. История развития

Типы алгоритмов. Повторение

Локальные и глобальные компьютерные сети

Кодирование и обработка звуковой информации

Программа Блокнот

Циклы на языке Паскаль

Информационное общество. История развития

Типы алгоритмов. Повторение

Сортировка и поиcк данных в электронных таблицах Excel

Растровая и векторная графика

Создание презентаций

Создание фигур в программе Microsoft PowerPoint 2010

Создание гипертекстового документа в Word

Массивы