Поиск ключевого слова в файле PDF

Я хочу найти конкретное ключевое слово в pdf-файле, используя оболочку linux. Как я буду использовать команду grep для этого?

One Solution collect form web for “Поиск ключевого слова в файле PDF”

Вы не будете. PDF – это двоичный формат, поэтому вам нужно сначала преобразовать его в текст. Grep может выполнять поиск данных, но нет оснований полагать, что PDF, который при открытии в программе просмотра PDF имеет строку foo , фактически содержит foo в исходных двоичных данных. В источнике может быть написано совсем по-другому.

Простое решение – установить pdftotext и использовать его. Он должен быть доступен в репозиториях вашего дистрибутива. В системах на базе Debian вы можете установить их с помощью:

 sudo apt-get install poppler-utils 

Затем вы можете выполнить поиск через свой файл PDF с помощью:

 pdftotext foo.pdf - | grep keyword 
  • Предотвращать передачу SSH-клиента переменной TERM на сервер?
  • Как я могу проверить, какие терминальные определения доступны?
  • Как запустить программу, перенаправить ее вывод и отобразить вывод на экране?
  • Плоский терминал UI, работает на OSX не на Linux
  • Поиск истории команд
  • параметр ядра init = / bin / bash не работает? (RHEL7, тест RHCSA)
  • Можно ли отправлять escape-последовательности цветового кода перед входом в систему?
  • Передача порта ssh через псевдотерминал
  • Как экспортировать / импортировать цветовую схему терминала Ubuntu 16.04
  • Перезапуск X в CentOS 5
  • Как получить более длинный заголовок xterm в zsh
  • Linux и Unix - лучшая ОС в мире.