Как скопировать текст с изображения в pdf-файл?

Я могу просмотреть PDF-изображение с текстом, используя средство просмотра evince, но я не могу выбрать текст в изображении для копирования и вставки. Как скопировать текст из изображения в pdf-файл?

2 Solutions collect form web for “Как скопировать текст с изображения в pdf-файл?”

Вам нужно OCR (Optical Character Recognition) чтобы иметь возможность извлекать текст из изображений. Если вы используете Google OCR вы найдете много онлайн- OCR software которое пытается извлечь текст из изображений. Я лично никогда не использовал так сильно, чтобы сказать, насколько они успешны. Вы заметите, что некоторые из них принимают файлы изображений в качестве входных данных, и в этом случае вам придется преобразовать PDF в формат изображения (инструменты для этого доступны также в Интернете).

Если вы более технически склонны, есть Python библиотека pytesser которые могут быть полезны.

Capture2Text – это инструмент с открытым исходным кодом, который выполняет OCR на screenshot и выводит результат в буфер обмена, поэтому почти похоже, что вы копируете текст с изображения. Вероятно, это ваш лучший выбор.

Если вы не можете получить какой-либо OCR для работы, как было предложено Harvinder, вам не повезло. Если это изображение в формате PDF, это ничем не отличается от изображения в формате JPEG или PNG или любого другого изображения.

Даже если вы обнаружите, что пакет OCR работает для вас, вы можете получить очень плохие результаты. Я потратил больше времени на редактирование OCR'd PDF, чем это потребовалось бы для повторного ввода текста.

  • Как установить a .jpg с центром в .pdf (с использованием определенных размеров и границ страницы)?
  • Конвертирование SWF в PDF
  • Какая команда позволяет мне читать pdf-файл из stdin?
  • Командная строка: как вы поворачиваете файл PDF на 90 градусов?
  • Каков программный пакет для создания PDF-документов на ОС Debian и OpenBSD?
  • Сравнить документы PDF со встроенными ссылками?
  • evince: Плохая печать PDF-файлов
  • Экспортировать комментарии только от Okular Pdf-reader (спутывание)
  • Какая программа сохранит заполняемый PDF-файл?
  • Не удается распечатать в PDF с помощью cups-pdf; используется для работы, теперь «не удалось установить режим файла» печать как не-root
  • Экспортировать дисплей терминала в PDF
  • Interesting Posts

    Ловушка очистки для команды ssh на нескольких удаленных хостах

    Удалить последний символ строки, используя строковое манипулирование в сценарии оболочки

    Archlinux: modprobe: неверный параметр – 'l'

    Запустить mplayer с помощью x11 из текстовой консоли?

    Как найти связь между интерфейсом крана и его файловым дескриптором?

    Название терминала показывает sudo, но я хочу, чтобы команда sudo'ed

    Заменить образ в PDF с помощью командной строки

    Неподходящие перенаправления локальных запросов неправильным образом

    Рекурсивный файл chmod и dir на debian ведет себя по-разному с CentOS

    dd для клонирования с меньшим sdcard

    tar: как я могу исключить промежуточные каталоги, но включать каталоги листьев?

    md5sum команда двоичный и текстовый режим

    как установить GRUB в ESP с помощью efibootmgr?

    Есть ли способ отправить пакеты через одного интернет-провайдера и получить ответы через другой?

    Какова самая полная версия MS Word?

    Linux и Unix - лучшая ОС в мире.