Сканирование файла PDF

Я хочу отсканировать документ в формате pdf, используя команду linux shell. Если я хочу напечатать / отобразить только имя авторов и название статьи, есть ли какой-либо конкретный способ сделать это?

  • Bash для вызова PHP, дождитесь завершения процесса PHP?
  • оценка команд двойной блокировки в выражении состояния bash
  • Сценарий оболочки для разблокировки гнома-ключа для школьного интернета при входе в систему
  • Вывод Shell Script не записывается в файл должным образом
  • Сохранять временную историю через скрипт
  • Добавление 2 переменных в файл в сценарии ожидания
  • Как проверить, какие строки из файла A отсутствуют в файле B, не отображая ничего, что присутствует в файле B, а не в файле A?
  • Как сохранить журнал «uptime record» в Debian?
  • One Solution collect form web for “Сканирование файла PDF”

    Вам может быть интересна утилита pdfinfo которая находится в poppler-utils , по крайней мере, на debian и fedora. С помощью:

    Pdfinfo печатает содержимое словаря «Инфо» (плюс другая полезная информация) из файла Portable Document Format (PDF). Словарь «Инфо» содержит следующие значения:

    название тема ключевые слова автор создатель дата создания дата модификации


    Ниже приведен пример вывода документа для команд AIX:

     $ pdfinfo aixcmds2.pdf Title: AIX Version 6.1 Commands Reference, Volume 2 Subject: Keywords: Author: IBM Creator: XPP Producer: Acrobat Distiller 7.0 (Windows) CreationDate: Mon Jul 9 15:38:26 2007 ModDate: Mon Jul 9 15:38:26 2007 Tagged: yes UserProperties: no Suspects: no Form: none JavaScript: no Pages: 746 Encrypted: no Page size: 612 x 792 pts (letter) Page rot: 0 File size: 8588481 bytes Optimized: yes PDF version: 1.3 

    Если вы хотите только автора («IBM» в этом примере), вы можете сделать, например,

     pdfinfo aixcmds2.pdf | sed -n 's/^Author: *//p' 

    или если вы хотите название и автора, с заголовками:

     $ pdfinfo aixcmds2.pdf | sed -n '/^\(Author\|Title\):/p' Title: AIX Version 6.1 Commands Reference, Volume 2 Author: IBM 
    Interesting Posts

    Запуск определенных событий для устройств

    Автоматическая загрузка SFTP с завитком

    как найти, какой репо делает один пакет RPM,

    cgroups / systemd: Как создать группу для дерева процессов

    Перенаправить вывод ошибки grep в файл

    Удалять файлы старше 5 дней в UNIX (дата в имени файла, а не в метке времени)

    выходной хвост, когда выполняется другой процесс

    Как заставить запуск системы не дожидаться запуска определенного сервиса systemd

    обнаружение и исправление ошибок на уровне программного обеспечения для необработанного хранилища

    Kali Linux не может найти sbin / init

    Scanimage работает, но Xsane или любой другой пользовательский интерфейс не

    Что это за ошибка SSH в отношении «неправильного идентификатора RSA1» и «неуказанного сбоя GSS»?

    При чтении из файла выберите конкретные поля и сравните их с другим файлом в Unix bash?

    Множественный оператор, который включает специальные символы, используя при возникновении ошибок

    Внешняя аутентификация пользователя в сеансе PAM / сеансе PAM в сеансе PAM

    Linux и Unix - лучшая ОС в мире.