Сканирование файла PDF

Я хочу отсканировать документ в формате pdf, используя команду linux shell. Если я хочу напечатать / отобразить только имя авторов и название статьи, есть ли какой-либо конкретный способ сделать это?

  • Как сделать несколько подстрок сразу заменить в bash?
  • В чем разница между «и»?
  • start-stop-daemon возвращается всегда 0 (успех)
  • Найти все размеры и ширину файлов изображений в каталоге
  • файлов больше среднего размера каталога?
  • как я могу копировать файлы, которые хранятся в одной переменной
  • Как передать массив скрипту bash?
  • Почему точка посередине пути?
  • One Solution collect form web for “Сканирование файла PDF”

    Вам может быть интересна утилита pdfinfo которая находится в poppler-utils , по крайней мере, на debian и fedora. С помощью:

    Pdfinfo печатает содержимое словаря «Инфо» (плюс другая полезная информация) из файла Portable Document Format (PDF). Словарь «Инфо» содержит следующие значения:

    название тема ключевые слова автор создатель дата создания дата модификации


    Ниже приведен пример вывода документа для команд AIX:

     $ pdfinfo aixcmds2.pdf Title: AIX Version 6.1 Commands Reference, Volume 2 Subject: Keywords: Author: IBM Creator: XPP Producer: Acrobat Distiller 7.0 (Windows) CreationDate: Mon Jul 9 15:38:26 2007 ModDate: Mon Jul 9 15:38:26 2007 Tagged: yes UserProperties: no Suspects: no Form: none JavaScript: no Pages: 746 Encrypted: no Page size: 612 x 792 pts (letter) Page rot: 0 File size: 8588481 bytes Optimized: yes PDF version: 1.3 

    Если вы хотите только автора («IBM» в этом примере), вы можете сделать, например,

     pdfinfo aixcmds2.pdf | sed -n 's/^Author: *//p' 

    или если вы хотите название и автора, с заголовками:

     $ pdfinfo aixcmds2.pdf | sed -n '/^\(Author\|Title\):/p' Title: AIX Version 6.1 Commands Reference, Volume 2 Author: IBM 
    Interesting Posts

    Соответствие строки EXACT в файле и обновлении IP-адреса

    С помощью «find /» пропустите каталоги, такие как «/ proc», «/ sys» и аналогичные

    Использование awk для хранения двоичного числа в текстовом файле в виде строки, а затем преобразование в шестнадцатеричное

    Как установить псевдоним для определенного файла или каталога?

    Как передать аргументы скрипту, которые были сгенерированы другим скриптом

    Как измерить время простоя для миграции VM

    Как обрабатывать исключительную страницу при распределении смежных страниц кеша в Linux

    Как я могу проверить первый запущенный процесс? Я могу видеть как init, так и linuxrc в корневой папке

    Лучший способ применить формулу к определенному столбцу входного файла и передать все остальные столбцы как-есть

    Расширение текстового формата в VI

    Какие порты я должен открыть для apt-get для работы?

    NFS медленно после обновления ubuntu с 14.04 по 16.04

    Как безопасно отменить поиск dns на ip в сценарии оболочки

    Выходные данные команды scp / sftp как для стандартного вывода, так и для файла на сервере linux

    Что такое общий способ выяснить, имеет ли ядро ​​ext4 (или другие) ошибки?

    Linux и Unix - лучшая ОС в мире.