Существуют специальные программы, которые умеют «читать» изображения с текстом. Конвертация заключается в том, что на основе алгоритма текст, изображенный на отсканированном документе, преобразовывается в предложения. Вся сложность в том, что на картинке программа видит не набор букв, а растр, точечную структуру. Все эти точки, имеющую различную форму, расшифровываются специальными утилитами, превращая его в обыкновенный текст, с которым можно в дальнейшем работать.
Программы распознавания текста применяются при переводе различной бумажной литературы и документов в электронный вид. Библиотеки и архивы таким же образом переводятся в цифровой вид.
Программы распознавания текста применяются при переводе различной бумажной литературы и документов в электронный вид. Библиотеки и архивы таким же образом переводятся в цифровой вид.
Автоматическая оцифровка с помощью программы выигрывает у ручного метода набора в скорости, поэтому этот метод так распространен. Мы расскажем вам о пяти лучших программах распознавания сфотографированных текстов.
ABBYY FineReader 10
FineReader — флагман среди программного обеспечения, распознающего тексты на картинках. Эта программа широко распространена среди обычных пользователей и профессионалов, занимающихся оцифровками. Популярность обусловлена качеством ее работы. FineReader отлично обрабатывает кириллицу и еще 178 языков.
Единственный недостаток программы, если можно так выразиться, ее платность. Но пользователи, опробовавшие ее работу в течение двух недель и отсканировавшие ряд страниц, покупают продукт, поскольку он, однозначно, стоит своих денег.
FineReader умеет «считывать» текст с любых изображений, причем не самого высокого качества. С помощью программы вы переведете в цифровой вид любой документ: от обычного изображения до сканированной страницы.
Плюсы:
- Четко распознает текст;
- Читает множество языков;
- Не предъявляет больших требований к качеству картинки, документа, фото.
Минусы:
- Бесплатная версия ограничена временем (две недели) и количеством отсканированных страниц (55).
OCR CuneiForm
CuneiForm оптически распознает тексты на графических файлах и приводит их в редактируемый вид. Утилита выпускается в одной версии, бесплатной, и отличается от предыдущей программы качеством распознавания. Но это не смущает, и многие используют бесплатный софт, считая, что его функциональные возможности отлично справляются с работой.
Любопытная информация! CuneiForm умеет читать не только графику с текстом, но и разнообразные таблицы. И в том числе, если таблицы идут сплошным текстом, без разлиновки.
С помощью этой программы вы не только переведете текст в цифровой вид, но и сохраните шрифт и размер высоты букв. База шрифтов CuneiForm обширна, утилита даже умеет распознавать отсканированные, отпечатанные на машинке, изображения.
Для более четкой расшифровки текста в утилите используются специализированные словари. Эти словари постоянно пополняются, поэтому у CuneiForm богатый запас слов.
Плюсы:
- Бесплатная версия программы;
- Текст корректируется для точности с помощью словарей;
- Расшифровывает любые изображения, даже некачественные;
- Сохраняет структуру документа, даже его форматирование.
Минусы:
- Погрешности в текстах;
- Поддерживается всего 24 языка.
WinScan2PDF
WinScan2PDF — компактная утилита, сканирующая любые документы. Она выпускается в виде переносимого файла, portable-версии, которую не надо устанавливать на компьютер и прочие устройства. Утилита мгновенно читает любой текст и сохраняет его только в PDF-документ.
Программой очень легко пользоваться даже самым неподготовленным пользователям. Чтобы получить необходимый результат, вам придется нажать всего лишь три кнопки:
- Выбрать графический файл;
- Указать место загрузки;
- Запустить процесс.
Программа способна быстро обрабатывать сразу много графических файлов, поэтому и так популярна среди пользователей: новичков и профессионалов.
Плюсы:
- Отсутствие дистрибутива;
- Мгновенная расшифровка текстовой графики;
- Минималистский, удобный интерфейс.
Минусы:
- Вес утилиты всего 55 Kb;
- Текст можно сохранить только в формате переносимого документа.
SimpleOCR
SimpleOCR — бесплатное приложение, распознающее отсканированный текст оптически, но только на иностранных языках. Русского языка, к сожалению, нет ни в пакете интерфейса, ни в списке поддержки. А в остальном утилита отлично справляется с работой, распознавая даже рукописные тексты.
Тексты, получаемые на выходе, отличаются высоким уровнем точности. Также с помощью утилиты можно извлечь графический файл и удалить шум. Еще одной отличительной особенностью является наличие встроенного редактора текста, что очень удобно в использовании.
Плюсы:
- Работает корректно, с высокой точностью;
- Умеет удалять шумы с графики;
- Позволяет сразу редактировать полученные тексты.
Минусы:
- Отсутствует русскоязычная поддержка.
Freemore OCR
Freemore — бесплатная, простая утилита, которая легко и быстро читает тексты с различных графических файлов, даже с нескольких сканеров одновременно, и переводит их в удобный формат. Помимо этого утилита умеет обрабатывать сразу много страниц.
В интерфейсе нет поддержки русского языка, но даже, несмотря на это, утилита распространена и популярна среди отечественных пользователей, поскольку очень проста в использовании.
Плюсы:
- бесплатная версия;
- шифрует и дешифрует файлы;
- позволяет просматривать свойства документа;
- простой, не перегруженный кнопками, интерфейс;
- корректный, высокой точности результат на выходе;
- читает сразу несколько сканеров.
Минусы:
- Пользовательский интерфейс не переведен на русский язык;
- Для расшифровки русских текстов необходимо загрузить дополнительно язык.
Комментарии
Отправить комментарий