Программы для редактирования сканированных документов

5 бесплатных программ для сканирования и распознавания текста

Программы для редактирования сканированных документов

Программы для распознавания текста позволяют конвертировать сфотографированные или отсканированные документы непосредственно в предложения.

Дело в том, что текст на изображении представлен в виде растра, набора точек. Упомянутый софт осуществляет превращение набора точек в полноценный текст, доступный для редактирования и сохранения.

Распознавание букв призвано оптимизировать процесс оцифровки бумажных печатных или рукописных книг, документов.

Такой метод оцифровки на порядки превосходит скорость ручного набора с изображения. Широко применяется при оцифровке библиотек и архивов. Далее рассмотрим пятерку лучших представителей семейства подобных программ.

ABBYY FineReader 10

FineReader безоговорочный лидер среди всех программ, распознающих текст на изображении. В частности, софта, более четко обрабатывающего кириллицу нет. Вообще в активе FineReader 179 языков, текст на которых распознается чрезвычайно успешно.

Единственное обстоятельство, которое может разочаровать пользователей, состоит в том, что программа платная. Бесплатно распространяется только пробная версия на 15 дней. За этот период разрешено сканирование 50-ти страниц.

Дальше за пользование программой придется платить. FineReader легко «кушает» любое более-менее качественное изображение. Источник при этом совершенно неважен. Будь то фотография, скан страницы или любая картинка с буквами.

Достоинства:

  • точное распознавание;
  • огромное количество языков чтения;
  • толерантность к качеству изображения-источника.

Недостаток:

  • пробная версия на 15 дней.

OCR CuneiForm

Бесплатная программа для считывания текстовой информации с изображений. Точность распознавания на порядок ниже, чем у предыдущей рассматриваемой программы. Но как для бесплатной утилиты, функционал все-таки на высоте.

Интересно! CuneiForm распознает блоки текста, графические изображения и даже различные таблицы. Более того, считыванию поддаются даже неразлинованные таблицы.

Программа может прочитать и сохранять шрифт и кегль распознаваемого текста. В базе шрифтов содержится большинство используемых печатных шрифтов. Поддерживается даже распознавание текста вышедшего из печатной машинки.

Для обеспечения точности к процессу распознавания подключаются специальные словари, которые пополняют словарный запас из сканируемых документов.

Достоинства:

  • бесплатное распространение;
  • использование словарей для проверки правильности текста;
  • сканирование текста с ксерокопий плохого качества.

Недостатки:

  • относительно небольшая точность;
  • небольшое количество поддерживаемых языков.

WinScan2PDF

Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.

Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и, собственно, запуска программы.

Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.

Достоинства:

  • портативность;
  • быстрая работа;
  • простота в использовании.

Недостатки:

  • минимальный размер;
  • единственный формат файлов на выходе.

SimpleOCR

Отличная небольшая программа для распознавания текстов с изображений. Поддерживает даже чтение рукописей. Беда в том, что русский не входит ни в языковой пакет интерфейса, ни в список поддерживаемых для распознавания языков.

Однако если необходимо отсканировать английский, датский или французский, то лучшего бесплатного варианта не найти.

В своей области программа обеспечивает точную расшифровку шрифтов, удаление шума и извлечение графических изображений. К тому же в интерфейс программы встроен текстовый редактор, практически идентичный WordPad, что значительно повышает удобство использования программы.

Достоинства:

  • точное распознавание текста;
  • удобный текстовый редактор;
  • удаление шума с изображения.

Недостатки:

  • полное отсутствие русского языка.

Freemore OCR

Программа позволяет оперативно извлекать текст и графику с изображений. Софт поддерживает работу с несколькими сканерами без потери производительности. Извлеченный текст может быть сохранен в формате текстового документа или документа MS Office.

Кроме того предусмотрена функция многостраничного распознавания.

Распространяется Freemore OCR бесплатно, однако, интерфейс только на английском. Но это обстоятельство никак не влияет на удобство пользования, потому как организованы элементы управления интуитивно понятным образом.

Достоинства:

  • бесплатное распространение;
  • возможность работы с несколькими сканерами;
  • достойна точность распознавания.

Недостатки

  • Отсутствие русского языка в интерфейсе;
  • Необходимость загрузки русского языкового пакета для распознавания.

Источник: //pomogaemkompu.temaretik.com/930401132721474208/5-besplatnyh-programm-dlya-skanirovaniya-i-raspoznavaniya-teksta/

Все программы для сканирования документов

Программы для редактирования сканированных документов

На сайте softforscan.ru представлены все известные программы для сканирования документов, которые можно скачать абсолютно бесплатно. Данные программные решения значительно расширяют возможности стандартных инструментов, интегрированных в операционную систему.

Программы для сканирования позволяют редактировать полученные файлы, а также сохранять их в различных форматах, например в формате PDF. Данные программные средства подходят для всех известных моделей сканеров: Canon, HP, LG, Samsung, Epson и другие. Многие из представленных программ для сканирования в этом списке, имеют русский язык.

Если у вас возникли сложности или проблемы, вы можете воспользоваться бесплатным помощником и задать свой вопрос.

Abbyy Finereader

Abbyy Finereader – лучшая программа для сканирования документов, разработанная российской компанией ABBYY. При помощи данного инструмента можно выполнить сканирование и распознавание текста с различных бумажных источников, в том числе газет и текстов, набранных на печатных машинках.

Finereader позволяет сохранять файлы во всех популярных форматах, а в версии 11 имеется возможность сохранения в формате djvu. Abbyy Finereader отлично поддерживает 192 языка, в 43 из которых поддерживается проверка орфографии.

Данной программой пользуются более 20 миллионов человек по всему миру.

Лицензия программыплатная, доступна демо версия
Ограничение30 дней, 100 страниц
Языкрусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Vuescan

Vuescan – приложение, значительно расширяющее возможности стандартных инструментов, встроенных в операционную систему Windows. Благодаря собственному механизму взаимодействия сканера с компьютером, Vuescan позволяет решить все проблемы с подключением устаревших моделей сканеров.

Также следует отметить большое количество настроек цветовой гаммы, а также возможность сохранения файлов в формате RAW. Данная возможность позволяет максимально передать качество профессиональных фотографий.

При помощи Vuescan пользователь может запустить пакетное сканирование и тем самым обработать большое количество документов.

Лицензия программыУсловно-бесплатная
ОграничениеВодяные знаки
Языкрусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Winscan2PDF

Winscan2PDF – портативная бесплатная программа для сканирования документов, при помощи которой можно выполнить сканирование и сохранить файл в формате PDF. Достоинством данного приложения является простой интерфейс и высокая скорость работы.

Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Cuneiform

Cuneiform — свободно распространяемая программа для распознания текстов, разработанная российской компанией Cognitive Technologies. Приложение отлично распознает тексты на бумажных носителях с возможностью последующего редактирования.

Также Cuneiform имеет большое количество инструментов для сканирования изображений. Cuneiform поддерживает более 20 языков, в которые входят следующие: русский, английский, немецкий, французский, испанский, итальянский и многие другие.

Особенностью приложения является открытый код, что дает возможность разработчикам со всего мира постоянно дорабатывать и улучшать его.

 
Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Naps2

Naps2 – небольшая и очень удобная программа для сканирования, обладающая русским языком и высокой скоростью работы. Благодаря поддержке функции OCR (оптическое распознавание текста), при помощи Naps2 можно сканировать, а затем распознавать тексты с возможностью последующего редактирования.

Naps2 дает возможность сохранения различных профилей конфигурации, благодаря чему, пользователь может гибко настроить параметры для каждого вида файлов, а затем по мере необходимости переключаться между ними. В программе имеется менеджер сканеров, при помощи которого можно легко управлять всеми сканерами, подключенными к компьютеру.

Еще одним достоинством приложения является поддержка пакетного сканирования, а также возможность загружать ранее отсканированные документы.

Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкРусский, Английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Canon MF Toolbox

Canon MF Toolbox – небольшая программа для сканирования, предназначенная для работы со сканерами фирмы Canon.

При помощи утилиты Canon MF Toolbox можно значительно увеличить производительность, а также оптимально настроить сканер для работы с различными типами материалов.

Canon MF Toolbox обладает простым интерфейсом, при помощи которого можно выполнить сканирование буквально в несколько кликов, а затем сохранить материал в практически любом формате.

Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Scan2PDF

Scan2PDF – бесплатная программа для сканирования документов в формат PDF, обладающая высокой скоростью работы, а также интуитивно-понятным интерфейсом и наличием русского языка. Также в программе имеется встроенный конвертор, при помощи которого можно переконвертировать практически любой файл в формат PDF.

Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Scanitto PRO

Scanitto PRO – удобная утилита, не перегруженная ненужными опциями, благодаря чему, можно осуществить сканирование буквально в один клик. Из возможностей программы нужно отметить следующие:

  • сохранение файлов в многостраничные PDF и TIFF файлы
  • выбор области сканирования
  • широкие настройки цветовой гаммы при работе с изображениями

Scanitto PRO поддерживает следующие форматы: bmp, jpeg, tiff, png, pdf, jp2.

Лицензия программыУсловно-бесплатная
Ограничение30 дней
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Scanitto LITE

Scanitto LITE – удобный инструмент, способный значительно облегчить процесс сканирования.

При помощи Scanitto LITE вы можете отсканировать текстовый документ или графический файл буквально в один клик, а затем сохранить файл удобном для вас формате.

Также Scanitto LITE поддерживает прямую печать, что существенно экономит время пользователя. Из достоинств данного приложения, необходимо отметить следующее:

  • Интуитивно-понятный интерфейс
  • Наличие русского языка
  • Совместимость со всеми TWAIN сканерами
  • Наличие прямой печати
  • Поддержка большого количества форматов
Лицензия программыУсловно-бесплатная
ОграничениеФункциональные ограничения
ЯзыкРусский, Английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Scanlite

Scanlite – простая и очень удобная программа для сканирования документов, обладающая удобным интерфейсом. Scanlite позволяет выполнить сохранение в двух популярных форматах – PDF и JPEG. Приложение достаточно просто использовать, при запуске сканер будет выбран автоматически, пользователю нужно будет только указать имя файла и выбрать место для его сохранения.

Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкРусский
Операционная системаWindows XP/Vista/7/8/8.1/10

Readiris PRO

Readiris PRO – мощная система распознавания текстов с печатных носителей (OCR), обладающая высокой точностью и производительностью. Readiris позволяет сохранить файлы в следующих популярных форматах: Word, Excel, RTF, TXT, PDF, Djvu.

Readiris PRO поддерживает 137 языков, среди которых имеется русский и украинский языки.

Основные возможности приложения:

  • Высокая точность распознавания текстов
  • Сохранение структуры и форматирования исходников
  • Распознавание специальных символов, формул и штрих-кодов
  • Поддержка PDF и DJVU
  • Совместимость с Microsoft Office, OpenOffice и StarOffice
Лицензия программыПлатная
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Ridoc

Ridoc – программа для создания электронных копий документов, обладающая большим количеством дополнительных опций. При помощи Ridoc можно организовать работу сканера с автоматической подачей листов, что позволит отсканировать большое количество файлов без участия пользователя.

Ridoc поддерживает большое количество форматов, среди которых имеются следующие — tiff, bmp, jpeg, png. Также следует отметить возможность прямой печати отсканированных документов, а также возможность отправки материалов по электронной почте.

Ridoc поддерживает русский язык, поэтому пользователю не составит никакого труда разобраться в данном приложении.

Лицензия программыУсловно-бесплатная
Ограничениерезультат с надписью “No registration”
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Paperscan

Paperscan – бесплатная программа для сканирования изображений, позволяющая передать максимальное качество исходной фотографии или рисунка. Несмотря на то, что приложение в основном рассчитано на работу с графическими форматами, с его помощью можно организовать работу и с текстовыми файлами.

Интерфейс Paperscan не перегружен ненужными опциями, поэтому разобраться в нем сможет даже новичок. В программу встроен модуль управления сетевыми сканерами, поэтому её можно использовать в локальной сети.

Paperscan имеет широкий набор инструментов для редактирования цветовой гаммы, например: преобразование в черно-белые изображения, настройка яркости, контраста и насыщенности, также имеется большая библиотека фильтров и эффектов для редактирования изображений.

Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкАнглийский
Операционная системаWindows XP/Vista/7/8/8.1/10

Nitro Pro

Nitro Pro — набор инструментов, при помощи которого можно выполнять весь спектр операций по обработке PDF файлов, к их числу относится и сканирование, а затем сохранение в формате PDF. Приложение поддерживает пакетный режим, что позволяет работать с большим количеством материалов.

Nitro Pro позволяет выполнять слияние двух и более документов в один файл. Особенностью данного приложения является возможность зашифровывать файлы, тем самым обеспечить максимальную защиту собственных данных.

В приложение интегрирован конвертор, при помощи которого можно выполнить конвертирование файлов более чем из 300 форматов в формат PDF.

Лицензия программыПлатная, имеется вылеченная версия
ОграничениеОтсутствует
ЯзыкРусский, английский
Операционная системаWindows XP/Vista/7/8/8.1/10

Scantool

Scantool – инструмент для получения изображений со сканера, имеющий ряд дополнительных опций, среди которых имеются следующие:

  • Разворот изображений
  • Настройка контраста
  • Черно-белый режим
  • Режим градации серого

В настройках пользователь может задать следующие параметры – формат (A4, A5, A6), степень сжатия и путь сохранения. Сохранение выполняется в двух форматах – PDF и JPEG.

Лицензия программыБесплатная
ОграничениеОтсутствует
ЯзыкАнглийский
Операционная системаWindows XP/Vista/7/8/8.1/10

Данный список программ для сканирования документов будет постоянно пополняться, и в случае обнаружения действительно качественных продуктов, они сразу же будут в него добавлены.

Если у вас появились сложности при работе с данными инструментами, вы можете задать вопрос системному администратору, который совершенно бесплатно ответит на любой ваш вопрос и постарается решить возникшую проблему.

Источник: //softforscan.ru/

Программа для редактирования сканированных документов: какая лучше?

Программы для редактирования сканированных документов

В ходе работы с документацией и базами данных возникает немало существенных проблем. И речь идет не о массе ошибок, которые можно найти в документах, требующих из-за этого создания нового файла с исправлениями, но и в простой человеческой лени.

В принципе, лень всегда являлась двигателем прогресса, поскольку людям всегда хочется все сделать быстрее, чтобы избавиться от лишних забот, а дабы отдыхать было можно как можно больше, следует делать работу еще и качественно.

В этом случае вопрос касается того, что многие документы для полного занесения в какую-нибудь базу данных или общий реестр требуют набора текста по-новому, а это начинает не просто утомлять, но и надоедать. Для такого случая существует сканер и программа для редактирования сканированных документов.

Что делает сканер?

В целом, сканер – это устройство, которое переносит текст из напечатанного документа (газета, журнал, книга и т. д.) на компьютер, делает он это в виде изображения.

В некоторых устройствах есть специальные программы, которые контролируют процесс сканирования, при этом существует возможность выбрать даже формат, в который преобразуется исходник.

В стандартном случае это фактически просто снимок какого-то документа, редактирование которого невозможно в силу того, что символы не могут быть распознаны.

Вы сможете свободно управлять полученным документом, редактируя и видоизменяя весь или часть текста в целом, лишь в случае, если используется специализированная программа для редактирования отсканированных документов. Эти утилиты занимаются распознаванием изображения и переводом их в текст, который можно обрабатывать и редактировать. Существует множество программ подобного рода, и каждая из них имеет свои нюансы.

Старый добрый ABBYY FineReader

Пожалуй, самая распространенная программа для редактирования отсканированных документов с гордым названием ABBYY FineReader – это целый пакет редакторов, который позволяет производить всевозможные манипуляции с отсканированным изображением.

Высокий результат работы достигается за счет того, что программа может распознать документ любого качества (даже если вы просто сделали фото на камеру мобильного телефона), а также из-за возможности распознавания многоуровневых файлов, которые содержат таблицы, рисунки и прочие мелкие детали.

При этом в ходе распознавания можно задать язык, что помогает ABBYY FineReader выбрать правильные символы сравнения, благодаря чему программа выдает текст с наименьшим количеством погрешностей.

Помимо прочего, данный редактор отлично справляется с документами формата PDF. Таким образом, если у вас есть файл такого формата, то редактирование сканированных документов PDF будет проходить быстро и без лишних усилий.

Сам внешний интерфейс интуитивно понятен и не требует дополнительных навыков, такая доступность для пользователя любого уровня и повлияла на его популяризацию. Да и после распознавания вы можете сравнить полученный результат и откорректировать огрехи, допущенные программой, прямо в меню редактора.

Сам же результат сохраняется как отдельный документ, который вы можете изменять, как вам заблагорассудится.

Хитрости работы с PDF-форматом

Редактирование сканированных документов – дело монотонное, а если исходником служит PDF-файл, то тут есть свои хитрости.

Дело в том, что редактор вида FineReader весьма хорош в этом деле, но его стоимость зачастую отталкивает пользователя и заставляет искать аналоги.

Поэтому есть ряд отдельных утилит, которые позволяют производить узкоспециализированную работу, нацеленную на файлы PDF-формата.

PDFill PDF Tools

PDFill PDF Tools – бесплатная программа для редактирования сканированных документов с расширением PDF.

Она содержит ряд дополнительных опций, таких как объединение или разъединение документов, редактирование или полное удаление содержимого, преобразование PDF-файла в изображения и наоборот.

Также здесь можно создавать списки, редактировать встроенные изображения, выравнивать текст и многие другие настройки, которые привычны любому пользователю пакета Microsoft Word или его аналогов.

Данная программа абсолютно бесплатна и предназначена для любого уровня пользования (частного, корпоративного и т. д.). Интерфейс здесь, конечно, не самый дружелюбный, но набор функций и отладок все это восполняет с лихвой. Вот только русскоязычного меню пока нет, поэтому, если с английским не сложилось, придется повозиться со словарем.

Free PDF Editor

Еще одна бесплатная утилита, которая позволяет редактировать PDF-файлы. Тут более понятный и удобный интерфейс.

Да и программа поддерживается многими операционными системами, единственный минус заключается в том, что готовый документ отредактировать нельзя. Зато можно сканировать прямо в эту программу, и уж тогда работать полным ходом.

Правда, придется повозиться с созданием виртуального принтера, поскольку иначе такая программа для редактирования сканированных документов попросту не будет работать.

OCR-редактор

Если же вернутся к началу и вести речь о бесплатных аналогах FineReader, то существует программа для редактирования документов doc под названием OCR Form. Достаточно полезная утилита, особенно если вам доводится работать с несколькими языками (в наличии поддержка свыше 20-ти самых распространенных языков).

Она отлично справляется с полиграфией или документами плохого качества, но что касается рукописного текста, то здесь все не так гладко. Конечно, распознать такой текст OCR может, но вот качество этого распознавания пока оставляет желать лучшего.

Что же касается внешнего вида, то тут ему могут позавидовать многие редакторы – все предельно просто: открываете файл и сканируете, потом сохраняете в подходящем формате – и дело с концом.

Популярность утилита заработала благодаря возможности самообучения, так называемой адаптивной системе распознавания, что позволят осуществлять распознавание все лучше и лучше при каждом новом запросе.

Еще одна из семейства OCR

Редактирование сканированных документов – кропотливое занятие, поэтому не удивительно, что для хорошего результата некоторые пользователи ищут другие методы. В таких случаях есть возможность воспользоваться еще одной утилитой – SimpleOCR.

Из названия понятно, что это приложение, которое похоже на предыдущее – OCR, но в более упрощенном и совершенном виде.

Здесь для вас есть возможность ручного добавления слов за счет встроенного редактора, возможность редактирования текста прямо в окне утилиты, а также работа с целыми пакетами данных (можно загрузить сразу несколько файлов, которые будут распознаваться).

Но внешний вид может слегка сбить с толку, тут уж придется немного почитать о самой программе и принципах ее работы. В противном случае вместо отличного редактора вы можете получить бесполезную программу для редактирования сканированных документов, которая занимает пространство на вашем компьютере.

А если документ – картинка?

Иногда, когда вы проводите редактирование сканированных документов jpg-формата, есть необходимость выделить не текст, а именно картинку (схему, таблицу, график и прочее). А тут уже вопрос совершенно иной.

Ведь при распознавании текста задача ставится совсем по-другому. Теперь нужно не просто распознать изображение, а еще и привести его в эстетичный вид. К примеру, если отсканировать схему из книги, то будут видны отпечатки чернил с других листов.

Чтобы избавиться от этих «помех», следует прибегнуть к помощи графически редакторов.

Одним из таких может быть старый добрый Paint, но в мире, где правит технологический прогресс, первичные позиции в этом вопросе отдают старому доброму Photoshop’у, поскольку это и быстрее, и удобнее.

Редактирование сканированных документов в “Фотошопе” позволяет избавляться от пятен и «грязи», изменять цвета рисунков, варьировать их контрастность и яркость при помощи наборов всевозможных фильтров.

К тому же уроков к тому, как сделать ту или иную операцию, предостаточно, поэтому не нужно быть «гением “Фотошопа”», достаточно просто захотеть.

Существует еще масса других редакторов, которыми вы можете воспользоваться, также прекрасными аналогами могут быть и онлайн-утилиты, которые позволяют распознавать сканированный текст, даже не занимаясь подбором какого-либо другого специализированного программного обеспечения. В целом, любая программа для редактирования сканированных документов имеет право на жизнь и на то, чтобы вы ее оценили.

Источник: //fb.ru/article/167999/programma-dlya-redaktirovaniya-skanirovannyih-dokumentov-kakaya-luchshe

8 лучших программ и веб-сервисов для сканирования и распознавания текста

Программы для редактирования сканированных документов

Наверное, каждому знакома ситуация, когда скан документа, например, страницы книги, необходимо преобразовать в печатный текст. Для этого существуют специальные программы, но основная их масса очень мало кому известна. На слуху у всех, пожалуй, только ABBYY FineReader.

Действительно, FineReader вне конкуренции. Это лучшая программа для сканирования и распознавания текста на русском языке, однако выпускается она исключительно в платных версиях и стоит весьма недешево.

Многие ли готовы выложить за самую бюджетную лицензию почти 7 000 рублей, если собираются обрабатывать одну-две книги в год?

Если вы считаете покупку дорогостоящего коммерческого продукта неоправданной, почему бы не воспользоваться аналогами, среди которых есть бесплатные? Да, они не так богаты функциями, но со многими задачами, которые, как считают многие, «по зубам» только FineReader, справляются вполне успешно. Так давайте познакомимся с несколькими доступными альтернативами. И заодно посмотрим, чем они отличаются от общепризнанного эталона.

ABBYY FineReader

Чтобы сравнивать другие программы с ABBYY FineReader, выясним, чем же он так хорош. Вот перечень его основных функций:

  • Работа с фотографиями, сканами и бумажными документами.
  • Редактирование содержимого файлов pdf — текста, отдельных блоков, интерактивных элементов и прочего.
  • Конвертация pdf в формат Microsoft Word и обратно. Создание pdf-файлов из любых текстовых документов.
  • Сравнение содержимого документов на 35 языках, например, отсканированного бумажного и электронного (не во всех редакциях).
  • Распознавание и преобразование сканированных текстов, таблиц, математических формул.
  • Автоматическое выполнение рутинных операций (не во всех редакциях).
  • Поддержка 192 национальных алфавитов.
  • Проверка орфографии распознанного текста на русском, украинском и еще 46 языках.
  • Поддержка 10 графических и 10 текстовых форматов входных файлов, не считая pdf.
  • Сохранение файлов в графическом и текстовом форматах, а также в виде электронных книг EPUB и 2.
  • Чтение штрих-кодов.
  • Интерфейс на 20 языках, включая русский и украинский.
  • Поддержка большинства существующих моделей сканеров.

Возможности программы великолепны, но для домашних пользователей, которые не обрабатывают документы в промышленных объемах, избыточны.

Впрочем, тем, кому нужно распознать лишь несколько страниц, компания ABBYY предоставляет услуги бесплатно — через веб-сервис FineReaderOnline.

После регистрации доступна обработка 10 страниц отсканированного или сфотографированного текста, в дальнейшем — по 5 страниц в месяц. Больше — за доплату.

Стоимость самой недорогой лицензии FineReader для установки на компьютер — 6990 рублей (версия Standard).

Веб-сервис Free-OCR.com

Free-OCR.

com (OCR — Optical character recognition, оптическое распознавание символов) — бесплатный Интернет-сервис для распознавания отсканированных или сфотографированных текстов, сохраненных в формате графического изображения (jpg, gif, tiff, bmp) или pdf. Поддерживает 29 языков, включая русский и украинский, причем пользователь может выбрать не один, а несколько, если их содержит исходный текст.

Free-OCR не требует регистрации и не имеет каких-либо ограничений по количеству загруженных документов. Ограничивается только размер файла — до 6 Mb. Многостраничные документы сервис не обрабатывает, точнее, игнорирует всё, кроме первого листа.

Скорость распознавания сканированного текста довольно высока. Лист А4 с фрагментом книги на русском языке был обработан примерно за 5 секунд, но вот качество не порадовало.

Крупные шрифты — как в детских книжках, он распознает на 100%, а средние и мелкие — примерно на 80%.

С англоязычными документами дела обстоят несколько лучше — мелкий и неконтрастный шрифт распознался правильно примерно на 95%.

Веб-сервис Free Online OCR

Free Online OCR — еще один бесплатный веб-сервис, очень похожий на предыдущий, но с расширенным функционалом. Он:

  • Поддерживает 106 языков.
  • Обрабатывает многостраничные документы, в том числе на нескольких языках.
  • Распознает тексты на сканах и фотодокументах множества типов. Помимо 10 форматов графических изображений, обрабатывает документы pdf, djvu, doxc, odt, архивы zip и сжатые файлы Unix.
  • Сохраняет выходные файлы в одном из 3 форматов: txt, doc и pdf.
  • Поддерживает распознавание математических уравнений.
  • Позволяет повернуть изображение на 90-180° в обе стороны.
  • Правильно распознает текст в нескольких столбцах на одной странице.
  • Может распознать один выбранный фрагмент.
  • После обработки предлагает скопировать файл в буфер обмена, скачать на компьютер, загрузить на сервис Google Docs или опубликовать в Интернете. Также доступна возможность сразу перевести текст на другой язык, используя Google Translate или Bing Translator.

Надо отдать должное Free Online OCR и за то, что он неплохо читает картинки низкого разрешения и малой контрастности. Результат распознавания всех скормленных ему русскоязычных текстов отказался стопроцентным или близким к этому.

Free Online OCR, по нашему мнению, одна из лучших альтернатив FineReader, но бесплатно он обрабатывает только 20 страниц (правда, не указано, за какой период). Дальнейшее использование сервиса стоит от $0,5 за страницу.

Microsoft OneNote

Программа для создания заметок Microsoft OneNote, исключая очень старые и последнюю — 17 версии, тоже содержит функционал OCR. Он не такой продвинутый как в специализированных приложениях, но тоже пригодный к использованию, если нет других вариантов.

Чтобы распознать текст с изображения с помощью OneNote, вставьте картинку в файл («Рисунок» — «Вставить»), нажмите на нее правой клавишей мышки и выберите «Копировать текст из рисунка».

После этого вставьте скопированный текст в любое место заметки.

По умолчанию языком распознавания назначен английский. Если вам нужен русский или какой-либо другой, измените настройку вручную.

Качество распознавания русскоязычного текста в Microsoft OneNote оставляет желать лучшего, поэтому его нельзя назвать полноценной заменой FineReader. Да и обрабатывать в нем большие многостраничные документы весьма неудобно.

Readiris

Программа Readiris бельгийской компании-разработчика I.R.I.S — вот это действительно настоящий конкурент российскому ABBYY FineReader. Мощная, быстрая, кроссплатформенная, основанная на фирменном OCR-движке, используемом производителями Adobe, HP и Canon, она великолепно распознает даже самые трудночитаемые тексты. Поддерживает 137 языков, среди которых есть русский и украинский.

Особенности и функции Readiris:

  • Самая высокая скорость обработки файлов среди приложений такого класса, рассчитано на большие объемы.
  • Сохранение форматирования исходного текста (шрифты, кегль, стиль написания).
  • Одиночная и пакетная обработка файлов, поддержка многостраничных документов.
  • Распознавание математических уравнений, специальных символов и штрих-кодов.
  • Очистка текста от «шумов» — линий, помарок и т. п.
  • Интеграция с различными облачными сервисами — Google Документы, Evernote, Dropbox, SharePoint и некоторыми другими.
  • Поддержка всех современных моделей сканеров.
  • Форматы входных данных: pdf, djvu, jpg, png и другие, в которых сохраняют графические изображения, а также полученное непосредственно со сканера.
  • Форматы выходных данных: doc, docx, xls, xlsx, txt, rtf, html, csv, pdf. Поддерживается конвертация в djvu.

Интерфейс программы русскоязычный, использование интуитивно понятно. Она не предоставляет пользователям возможности редактировать содержимое файлов pdf, как FineReader, но с главной задачей — распознаванием текстов, на наш взгляд, справляется отлично.

Readiris выпускается в двух платных версиях. Стоимость лицензии Pro составляет 99,00€, Corporate — 199€. Почти как у ABBYY.

Программы для редактирования сканированных документов

Программы для редактирования сканированных документов

Приветствую всех читателей блога SoftHardware.ru! Полгода назад я рассказывал о программах для редактирования PDF документов, а сегодня мы будем говорить о программах для редактирования отсканированных документов.

Люди, много работающие с печатными материалами, часто сталкиваются с ситуациями, когда нужно перенести текст или изображение из печатного носителя в цифровой – из книги в компьютер. При наличии сканера эту проблему можно решить очень просто, однако помимо сканирования необходимо также распознать текст или изменить картинку.

Выполнить эту задачу поможет программа для редактирования сканированных документов – о таких программах я и расскажу в этой статье.

Ввиду особенностей своей работы, сканер переносит текст из книги, журнала, газеты в компьютер в виде изображения – можно сказать, «фотографирует» его.

Соответственно, внесение изменений в такой текст сразу же после сканирования не представляется возможным – текстовый редактор не сможет распознать символы (данную проблему я рассматривал в статье Бесплатные программы для сканирования документов). Решить проблему, как после сканирования редактировать текст, смогут специальные OCR-приложения.

Наиболее функциональной и распространенной утилитой для выполнения данной задачи является ABBYY FineReader, однако она имеет существенный недостаток – достаточно высокую стоимость. Мы же рассмотрим бесплатный аналог.

Поделиться:
Нет комментариев

    Добавить комментарий

    Ваш e-mail не будет опубликован. Все поля обязательны для заполнения.