К основному контенту

Распознавание напечатанного текста с картинки: рейтинг лучших программ и принципы их работы

Набор большого объема текста может занять достаточно много времени, даже если это всего лишь автоматическая перепечатка информации, например, с картинки, когда имеется фото печатного текстового материала.
Поэтому достаточно часто возникает необходимость автоматизировать этот процесс.
В этом материале будет рассмотрено, как производится автоматическое распознавание печатного текста с картинки и конвертация его в печатный формат.

Суть процедуры

О каком же процессе в данном случае вообще идет речь? Обработка картинки или фото для того, чтобы текст, запечатленный на ней, автоматически был переведен в текстовый формат.
Тоесть, технически процесс происходит следующим образом: пользователь загружает картинку на сервер, либо переносит ее в программу, софт обрабатывает изображение, используя особые алгоритмы, и выдает в виде файла или в окне программы сфотографированный текст в печатном виде.
В настоящее время разработано достаточно много таких разнообразных программ.
Они отличаются по функционалу совсем незначительно, но могут существенно отличаться по качеству обработки.
Некоторые программы допускают достаточно много ошибок в распознаваемом тексте, тогда как другие – распознают все практически идеально.
Качество распознавания зависит от изначального качества фото, но при прочих равных условиях большую роль играют алгоритмы работу и обширность базы используемого приложения или онлайн-сервиса.

<Рис. 1 Особенности>
Важно! Такие программы могут быть представлены самостоятельным инсталлируемым софтом, простыми мобильными утилитами, способными работать с карты памяти, онлайн-сервиса, приложениями для смартфона и/или планшета. Распространяется такой софт платно или бесплатно, некоторые платные программы имеют ограниченные демо-версии.     

Принцип действия

Как же работает такая программа? Какие алгоритмы используются для распознавания текста и как они взаимодействуют в софте? Чем объясняются отличия в качестве распознавания материалов разными программами?
Принцип действия программы такой:
1. В каждой программе имеется база данных, в которую занесен алфавит, при этом каждой букве, как строчной, так и заглавной, присваивается целая группа вероятных графических отображений этой буквы – различные шрифты, учет качества фото, поворота и угла камеры при съемке и т. д.;
2. Таким образом, после попадания в программу изображение анализируется с целью выявления имеющихся символов и определения их положения, то есть, фактически, определяется, где именно на фото расположены буквы;
3. Распознавание обнаруженных букв, по окончанию которого формируется печатный текст;
4. Распознавание особенностей форматирования, величины отступов и т. д. (только некоторые программы способны сохранять форматирование, при работе большинства доступных бесплатных сервисов этот пункт вовсе отсутствует);
5. Как только распознавание заканчивается, то, в зависимости от типа программы и принципов ее работы, готовый текст появляется в окне софта или создается текстовый файл с ним (того или иного формата, также в зависимости от программы).
Полученный таким образом материал остается только отредактировать.

<Рис. 2 Принцип>

Особенности

Каждая программа способна работать только с теми символами, которые были занесены в ее базу, только их она распознает.
В программу может быть внесено несколько алфавитов, как уже писалось выше, поэтому, при выборе подходящего софта проверьте, что бы он работал с языком, на котором напечатан текст на вашей картинке.
Если речь идет о не слишком популярных и визуально нестандартных языках, то найти подходящий софт может быть непросто.
Чем сложнее форматирование или расположение букв на фотографии, тем сложнее программе правильно распознать текст, и тем больше будет ошибок.
Ведь иногда в таком случае неточности могут возникнуть уже на стадии определения местоположения печатных символов на картинке.
Распознавание текста, напечатанного на нестандартном языке, происходит с ошибками. Причем, часто чем сложнее этот текст, тем больше ошибок может быть, так как алгоритмы распознавания могут в этом случае работать неточно.
При определении буквы программа использует определенный «алгоритм» сравнений с ее основными чертами – расположением и размером элементов (некоторые утилиты также учитывают соседние распознанные буквы и лексическую сочетаемость).
Благодаря этой особенности, даже если небольшая часть буквы стерлась или изменена, она все еще может быть распознана.
Единственный минус данного способа в том, что когда букву не удается распознать, задействуются все алфавиты из базы для определения, и в результате может быть обнаружено больше сходств с буквой, например, английского алфавита, хотя текст напечатан на русском.
Перед началом процесса распознавания, обратите внимание на качество фото.
Лучше всего определяется текст с отсканированных изображений документов, скриншотов.
Более или менее нормально может быть определен и сфотографированный на камеру текст.
Хуже всего распознаются материалы с фото плохого качества, сделанного под углом, особенно если имеет место сложное форматирование.
Художественные шрифты не распознаются.
<Рис. 3 Онлайн-сервис>

Преимущества и недостатки

Преимущества использования таких сервисов очевидны.
Основное из них – это существенная экономия времени на обработку материала.
И хотя текст, получаемый на выходе, может иметь даже очень низкое качество, редактирование его все равно займет, в большинстве случаев, меньше времени, нежели перепечатка «с нуля».
Какие же преимущества и недостатки имеют такие программы?
Позитив:
  • Значительная экономия времени, уходящего на автоматическую перепечатку текста;
  • Избежание ошибок в формулах и сложных символьных построениях, которые могут быть при ручной перепечатке материала (справедливо только в случае, если используется качественный софт, способный достоверно распознавать сложные символьные комбинации);
  • Распознавание и перенесение текста, который вы не можете напечатать на своей клавиатуре (например, текст с арабской вязью, иероглифами и другими символами, которые отсутствуют на традиционной русско-английской клавиатуры).
  • Хотя, строго говоря, преимуществ в использовании таких программ достаточно мало, они завоевывают все новых и новых поклонников, так как помогают экономить время (или создают иллюзию экономии, так как фактически на редактуру некачественно обработанного софтом текста уходит времени больше, чем на его изначальную перепечатку).
Негатив:
  • Ограниченность базы языков – то есть, определенная программа рассчитана на распознавание определенных символов, и часто, это могут быть символы только какого-нибудь одного языка. В других программах в базу может быть занесено несколько алфавитов, но, обычно, такой софт ограничивается 1-3 языками;
  • Большие сложности бывают при работе с текстом смещенного типа, то есть таким, который содержит как русские, так и английские символы. Вы можете выбрать только один язык текста и алфавит для распознавания, что ведет к тому, что все, напечатанное другим алфавитом распознаваться не будет. В зависимости от типа, сложности и качества софта эта проблема может быть выражена в большей или меньшей степени;
  • Потеря форматирования либо неспособность распознать особенности изначального оформления текста – выходной файл часто представляет собой почти файл Блокнота по оформлению;
  • Просто низкое качество распознавания, связанное с неверной настройкой или некачественной проработкой самого софта, когда буквы распознаются ошибочно;
  • Ошибки распознавания, связанные с изначальным низким качеством фото. Не любой софт работает с фото плохого качества и тщательно его обрабатывает;
  • Серьезные проблемы с распознаванием возникают в случаях, когда текст расположен блоками, распределенными по фото неравномерно или даже в две колонки – лучше всего этот софт распознает сплошной текст;
  • Качество распознавания может падать по мере добавления все новых и новых фото за один сеанс;
  • Иногда процесс обработки изображения может идти очень долго, так как его скорость падает по мере увеличения длительности нагрузки на программу;
  • Стандартное для почти всех программ, очень низкое качество распознавания «сложных» алфавитов, например, иероглифов или арабской вязи. Ошибки, причем достаточно крупные, в этом случае неизбежны;
  • Неверное распознавание символьных групп – ситуация, при которой две, расположенные рядом, буквы ошибочно распознаются программой как одна. Причем, при возникновении такой ошибки могут смешиваться символы различных алфавитов, и изначальное корректное сочетание иногда бывает сложно угадать. Встречается такая ошибка очень часто.
На самом деле, в настоящее время практически не существует таких программ, работающих действительно качественно. Тексту, полученному после обработки фото в таком редакторе, все равно нужна тщательная редактура. И такая редактура порой может занимать не меньше времени, чем изначальная перепечатка. Это не все недостатки такого подхода, но резюмируя, можно сказать, что наиболее серьезной проблемой считается низкое качество распознавания текста в целом. Так как именно из-за него приходится производить длительную вычитку и редактуру материала.

<Рис. 4 Методы>

Сфера применения

Какие же группы пользователей работают с таким софтом, и для кого он будет удобен?
Он подходит, например, студентам, которым нужно перенести большое количество информации из печатной книги в текстовый документ, редакторам, работающим с большими объемами текстов (хотя к рукописям такие программы не применимы).
Также софт пригодится при составлении документа или нормативного акта по образцу, который уже имеется в напечатанном виде и т. п.

<Рис. 5 Результат>

Функционал

Функционал у данных программ достаточно стандартный – он позволяет произвести загрузку фото, выбор языка, запуск обработки и получение готового текста.
В некоторых утилитах текст отображается в окне, в других – оформляется в файл указанного или установленного по умолчанию формата, иногда файл также может быть создан по запросу.
В некоторых платных приложениях могут быть реализованы и другие функции, например, улучшение качества фото с целью увеличения распознаваемости текста.

<Рис. 6 Функционал онлайн-сервиса>

Программы

Какие же программы используются для распознавания?
Они делятся на две группы: платные и бесплатные установочные программы, платные и бесплатные мобильные утилиты.

<Рис. 7 FineReader>

Требующие установки

Такой софт подойдет тем, кто постоянно работает с изображениями с текстом.
Кроме того, такой софт, обычно, наиболее функциональный.
Таблица 1. Программы для распознавания текста с изображения
ПрограммаТип лицензииФункционалОсобенностиРейтинг
ABBYY FineReaderПлатноПолныйПодходит для профессионального распознавания текста4,0
CuneiFormБесплатноСуженныйНеплохой функционал, но меньший, чем в платных аналогах2,9
ABBYY PDF TransformerПлатноРасширенныйПрограмма предназначена для выполнения широкого спектра работ с файлами PDF, в том числе и с распознаванием текста со сканов3,4
Readiris ProПлатноБолее узкий, по сравнению с другими платными аналогамиДовольно неудобное меню и управление, из-за которого программа не пользуется популярностью3,0
Очевидно, что выбор подходящего софта зависит от того, какие требования к нему предъявляет пользователь. Однако, в большинстве случаев, непрофессионалы вполне могут обойтись бесплатными программами для периодического использования.   

Не требующие установки

Качественных мобильных утилит достаточно мало.
Они нужны тем, кто часто работает за разными компьютерами для того, чтобы не устанавливать программу на каждый.
Наиболее популярным таким софтом является утилита VueScan.

<Рис. 8 CuneiForm>
Она распространяется бесплатна и способна обрабатывать изображения с текстом, полученные со сканеров.
Обладает достаточно широким функционалом, не ограничивающимся только распознаванием текста.
Совместима с любыми, даже устаревшими, моделями сканеров.

Комментарии

Популярные сообщения из этого блога

Как подключить телефон к телевизору — все способы

Здравствуйте. Думаю, вы будете согласны со мной в том, что смотреть фото и видео в большом формате всегда увлекательнее и проще. На телевизоре легко воспроизвести мультимедийные файлы, кроме того, телефонную память можно использовать в качестве флешки.  Существует несколько вариантов того, как подключить телефон к телевизору, все зависит от вашей техники и наличия кабелей соединения. Давайте попытаемся со всем этим разобраться. Долой провода! Поддержка технологии Wifi Direct есть сегодня почти во всех телевизорах, имеющих функцию беспроводного соединения, и уж тем более ее имеют практически все телефоны. Благодаря этой технологии девайсы соединяются между собой без точки доступа. При этом TV видит телефон не как простой накопитель, а как мультимедийное устройство. Процесс сопряжения двух этих аппаратов происходит следующим образом: В первую очередь включаем на мобильном гаджете Вай Фай Директ. С любой версией операционки этот режим располагается в настройках бесп...

Как узнать IP-адрес компьютера с помощью PowerShell Windows

Когда пользователь Windows ищет IP-адрес своего компьютера, PowerShell может быть хорошим вариантом для обнаружения. Это действительно не требует больших усилий, чтобы узнать интернет-протокол с помощью этого инструмента. IP-адрес хоста - очень важный код для связи устройства с другими. Кроме того, некоторые веб-сайты не позволяют показывать их содержимое без адресов. Таким образом, очень важно знать способ получения  IP-адреса с помощью PowerShell.  Существует две основных целей IP-адреса: Точное определение узла, особенно сетевого интерфейса хоста. Предоставление местоположения хоста внутри сетевой арены, а также путь, через который устройство может взаимодействовать с другими. IP - это численное представление всех устройств, которые подключены к компьютеру с помощью интернет-протокола. Это позволяет компьютеру взаимодействовать с другими устройствами посредством IP-сети, такой как Интернет. Если вы являетесь пользователем Windows, вы можете ...

10 способов увеличить скорость домашнего Wi-Fi

Хотя Wi-Fi — это, бесспорно, очень удобно, но зачастую беспроводной интернет заставляет понервничать. Тем, кто страдает от медленной скорости, плохого качества сигнала, а также других проблем, стоит знать, что есть способы увеличить скорость Wi-Fi у себя дома. Итак, что же нужно сделать. 1. Стандарт N Использовать последние технологии Wi-Fi. Один из лучших способов убедиться, что домашняя сеть работает настолько быстро и надежно, насколько это возможно, заключается в использовании современных аппаратных средств. Главное, что нужно знать: беспроводные стандарты A, B и G являются старыми и медленными, и только стандарт N может обеспечить самую высокую скорость. Нужно убедиться, что беспроводной маршрутизатор и сетевая карта поддерживают стандарт N. 2. Максимальный охват Найти идеальное место для маршрутизатора. Хотя маршрутизаторы могут выглядеть уродливо, но это не значит, что их нужно прятать за телевизором. Чтобы обеспечить лучший сигнал, нужно установить роутер на открытом месте, что...