Intereting Posts
Каковы операторы управления и перенаправления оболочки? Какая системная цель или служба заполняет / dev / disk / by-uuid на el7? Как отключить срок действия пароля без chage? Попытка перенаправить <enter> и второй ответ на скрипт linux shell Как я могу гарантировать, что настраиваемая переменная среды будет установлена ​​до того, как cron выполнит задачу? Ищите процесс с заданным именем установка ffmpeg-php на centos использование функции скрипта вместо ввода с клавиатуры Как найти информацию репо для настройки yum? Получение информации об использовании памяти процесса из / proc / pid / smaps Печатать начало и конец между двумя шаблонами, исключая конец диапазона Antergos linux продолжает замораживать Как передать результат поиска grep в новый файл vi Каков рекомендуемый способ проверки запущенных сервисов? Измените каталог по умолчанию для одной конкретной программы, не изменяя ее путь

Программное обеспечение OCR для уравнений для получения файла LaTeX

Прежде всего, я прошу прощения, если это не подходящее место, чтобы спросить об этом, но я не мог придумать нигде (возможно, переполнение стека?).

Во всяком случае, я ищу программное обеспечение оптического распознавания символов (OCR) для обработки моих заметок. Дело в том, что иногда в середине есть уравнение, поэтому я искал программное обеспечение, которое может обрабатывать текст и уравнения вместе, которые я могу запустить в своей системе Linux.

В конечном итоге моя цель – создать файл LaTeX, поэтому было бы не больно, если бы результат был уже в LaTeX, но я думаю, что это слишком много.

Я не мог найти что-либо в Интернете, что сделал это, но я думаю, что это главным образом потому, что я не использую правильные условия поиска (английский язык не является моим основным языком). Я нашел этот вопрос, но это с 4 лет назад, и я думаю, что с тех пор это изменилось.

Если бы я смог получить одно хорошее программное обеспечение для обработки текстовой части заметок, а другое – для обработки части уравнений в примечаниях, я смог бы собрать их все вместе.

Кто-нибудь знает способ сделать это?

Мое мнение: забудьте об этом. Программы OCR для Linux – это все (gocr, tesseract, cuneiform, ocrad) довольно плохо, даже на отсканированных шрифтах с засечками, по моему опыту. Вы можете полностью забыть об этом, чтобы распознать почерк.
И я действительно буду счастлив, если кто-нибудь докажет мне, что я неправ.

Даже в большой коммерческой программе для других платформ, таких как Finereader (хорошо, поскольку это позволяет обучать плохо распознанные части для получения лучших результатов при больших сканированиях и экспорте в более [бинарные] форматы) или Acrobat (OK, но никаких функций, просто немых, но хорошо, признание), вы не получите приемлемых результатов с почерком.
Также у вас не будет возможности распознать математические формулы ни с одним из них, даже с сканированными книгами.

(Я знаю, что некоторые планшеты приходят с распознаванием рукописного ввода, но не знают названия продуктов для этого лично …)

Это не зависит от Linux, но http://myscript.com/ имеет приложение для распознавания рукописного ввода, которое является полуприличным. Однако не уверен в OCR.