А вы любите перепечатывать текст?
Всем привет! Сегодня я специально для вас рассмотрю одну офигенскую программу для распознавания текста с изображения! В прошлом, я как-то писал подобную статью. В ней я обозревал программу и онлайн сервис для распознавания. Если честно, то программа оказалась не очень, а сервис «упал». В итоге те, кто заинтересовались остаются в минусе. Не хорошо как-то получается. Коль уж на то разговор пошел, то вот ссылка на ту самую статью. Может кому-нибудь поможет.
Решил в общем еще одну статью написать, в которой будет рассмотрена другая программа для распознавания текста с изображений! В будущем, возможно будет пост, в котором я рассмотрю онлайн сервисы, не исключено. Но на сколько я знаю, их не так уж и много — 2 сервиса на весь рунет. Первый тот, что «пал», второй в этой статье мелькнет. Если больше найду, то будет очень хорошо. Отпишусь вам в виде поста.
Рассматриваемая программа в этой статье имеет множество плюсов! Я от нее в восторге! Советую пользоваться всем, у кого есть возможность ее приобрести. Она не бесплатная, но есть и пробная версия на сколько я знаю. Стоит не дешево, но приобретя не пожалеете однозначно. Ну конечно же можно и за бесплатно получить. Если кто понял, то вперед. Если нет, то извините. Может как-нибудь напишу пост об этом, так что если хотите, то подписывайтесь, дабы не пропустить. Ждать долго придется, даже очень.
В обзоре постараюсь сильно не заморачиваться на мелочах, лучше рассмотрим основные функции. Поясню кое-что, чтобы было понятней. Окей? Окей… К концу поста вы будете иметь представление об этой программе. И приобретая ее, вы уже будете знать, что вы не выкидываете деньги на ветер.
Сразу хочу упомянуть еще о двух программах, которые выполняют те же функции. Одна распознает текст с загруженной картинки, другая только при помощи сканера. Вот они: RiDoc, Scanitto. Я не стал их рассматривать, так как это просто жесть. Одна не хочет изображение открывать, другая вообще сканер не видит. Ну я плюнул, не стал заморачиваться. А ведь разработчики за них еще и деньги просят! Да ну их нафиг.
ABBYY FineReader 12 Professional — лучшая программа для распознавания текста с картинки
Программа просто шикарная! Полный набор функций, что дает преимущество перед другими. Распознание текста – отличное. Не хуже всяких сервисов. Кстати о сервисах. У разработчиков данной программы, также есть сайт для подобной работы. Вот ссылка. Только там ограничение на число распознанных слов или букв. Что-то в этом роде. Чтобы убрать ограничение нужно зарегистрироваться (регистрация в любом случае) и оплатить понравившийся тариф. Но по мне так, лучше программа. К тому же она не требует подключения к интернету.
Возможности программы
А теперь о возможностях. Программа способна распознавать текст с картинок, фотографий, PDF файлов, а также распознавать документы в режиме Online при помощи сканера. В конечном итоге мы можем сохранить в перечень файловых расширений. Каких? Смотрим на нижний скриншот.
Вот это и есть тот самый перечень расширений: .docx, .doc, .odt, .xlsx, .xls, .pdf, .htm, .txt, .rtf, .csv, .pptx, .epub, .fb2, .djvu. Здесь все, что необходимо для моей работы! Все нужные расширения! Даже лишние найдутся. Думаю еще пост сделать, в котором будет полный список расширений windows и описание к ним.
Касательно интерфейса – приятный. Ниже дан скриншот с главным меню программы, так сказать. Судите сами как вам на видок 🙂
Сразу разметил, что и где. А именно: «Вкладки», «Левые плитки», «Правые плитки». На скрине все видно. Сейчас эти названия я и буду использовать.
Итак, на тех плитках, где написано «Сканировать» (левые плитки), означает, что программа будет задействовать сканер для распознавания текста и сохранять в файл определенного формата (расширения). Формат зависит от того, какой вы его выберите при сохранении (кликнуть: Файл — Сохранить как...) или изначально на какую плитку нажмете. Еще раз, но другими словами. Берете книгу, распечатанный документ или тп. То, на чем есть текст в общем. Кладете документ на сканер и запускаете его. Далее нажимаете на одну из левых плиток в программе. Сканер просканирует, а ABBYY FineReader распознает текст с полученного изображения. А далее просто сохраните как удобно.
Правые плиточки предназначены для запуска распознавания текста именно с изображения, которое у вас на жестком диске. Так же можно использовать фотографии. К примеру вы увидели кой-то документ и решили, что он вам необходим в дальнейшем. Вы фотографируете его с телефона, а дома можете распознать текст с этой фотки, чтобы что-то переделать или вообще убрать. Это меня и радует, что довольно хорошо распознает с различных фотографий, пусть даже плачевного качества.
По мимо этого вы можете распознавать файлы с расширением PDF. Конечно же во вкладке «Основное» вы этого не найдете, но вот во вкладке «Другое» — там это есть. Чтобы было понятней на счет PDF, приведу жизненный пример.
Пример: Вы скачали книгу «Колобок» в формате PDF. Оказалось, что кто-то просканировал оригинальную книгу, тем самым получив некие изображения. После чего он объединил их в одно целое создав файл в формате PDF. Ну то есть готовую электронную книгу. Далее этот некто «выкинул» книжку на просторы интернета, а вы ее скачали. Что получается? Получается, что там простые изображения текста, которые попросту нельзя скопировать! Хотя с такой книги можно будет сделать скриншот иллюстраций, и использовать картинку, как душе угодно. Хоть на рабочий стол в виде фонового изображения. Изображение, оно и есть изображение. Но вот текст... Здесь одни из часто используемых свойств – возможность редактирования и копирования! Изображение тоже можно редактировать и копировать, но согласитесь, что с текстом это происходит намного чаще ежели наоборот.
Вот поэтому разработчики и придумали функцию распознанием PDF файлов. Теперь вы можете открыть файл PDF и распознать текст. Сохранить вы можете в тот же самый формат, но с одним немаловажным отличием. Теперь есть возможность копирования текста! Это в некотором смысле конвертирование.
Я пробовал конвертировать книгу примерно в 200 страниц. Оперативки жрет, хоть стой хоть падай. Это большой минус. А что делать? Это от самой книги зависит. Смотря какое качество: цветная или нет, показатель dpi. DPI (dots per inch — точек на дюйм) — это численное выражение растрового изображения. Так что сначала нужно сжать книжку, а потом уже распознавать. Я пока не пробовал так делать, но думаю все таки поможет. Пусть не на 100%, думаю на 20% — 30% точно.
Было бы гораздо логичней изначально использовать ABBYY FineReader. То есть распознавать текст по мере сканирования оригинальной книжки. Пользоваться левыми плитками.
С PDF разобрались, а с простыми изображениями и фотографиями? Подробно я не расписывал и не буду. Принцип то тот же самый. Открыли, распознали, сохранили как вам необходимо, закрыли. Все. Просто с PDF дольше возиться. В этом и заключается основное отличие.
Программа обалденная еще тем, что есть возможность распознать текст и сохранять его в HTML формат. HTML файлы можно открывать с помощью браузера. То есть в конечном счете я получаю некую веб-страницу у себя на компьютере, со всеми тегами HTML разметки. Пока не знаю зачем оно мне надо, но блин реально классная функция. Мне как владельцу веб-ресурса, это может пригодиться однозначно. Есть пару мыслишек, раскрывать пока не буду.
Немного о важных мелочах
Про возможности я уже рассказал. Теперь чуть чуть углублюсь в тонкости. Поговорим про области выделения. Это как бы и мелочи и не мелочи. Поэтому включил в пост, чтобы вы сразу поняли что к чему.
Допустим вы открыли изображение, для распознавания. Программа в свою очередь на автомате все просканирует, распознает и выдаст. Но бывает так, что ABBYY FineReader не захватывает какую-то область текста с распознаваемого изображения. Чтобы это исправить можно отредактировать эту область, то бишь расширить. Это зеленая область, область выделения текста.
По мимо данной области (области выделения текста), еще существуют области: картинка, фоновая картинка, таблица. Их тоже можно расширять, удалять, сужать. Если на распознаваемом изображении есть таблица, то вы можете ее выделить, нажав на соответствующую кнопочку. Тогда ABBYY FineReader будет правильней распознавать выделенную область. Но это в том случае, если программа не до выделила. Просто приходится немного подправлять, если на распознаваемом изображении плохо виден текст. Чаще всего это можно увидеть на фотографиях, в остальных случаях все путем. Если конечно это не PDF книжка сделанная на основе фотографий.
У каждой области существует свой цвет. Текст – зеленый, картинка – красный, а таблица – синий. Все просто.
После распознавания, текст уже можно будет начать редактировать прямо в ABBYY FineReader. В левом окне будет оригинал, а в правом окне уже редактор. У редактора тоже есть пару кнопочек, но с ними вы не запутаетесь.
Это все, что я хотел до вас донести, почти. Есть еще видео с официального сайта. Возможно вы что-то не поняли — просмотрите его.

Очень надеюсь, что пост вам понравился. Думаю данная программа для распознавания текста вам определенно поможет. Если есть какие-либо вопросы, то можете отписать в комментариях, я отвечу. Ну а на этом все, подписывайтесь на мой блог. Дальше только интересней. Думаю конкурсы вскоре буду проводить. Так что не пропускайте всю жесть на блоге. Еще что-то хотел... А, да! Всегда рад всяческому общению, поэтому можете добавляться ко мне в друзья вконтакте. Ну все, всем бай!
С уважением, Антропов Алексей
Интересный обзор программы.
Нужная вещь.
Надо будет приобрести. По вашим словам и по официальному видеоролику вроде норм)
Делала несколько раз попытки в разных программах. Получается много ошибок. Легче перепечатать текст, чем исправлять ошибки. Хотя, спорить не буду, может быть кому-то понравится ваша идея.