textutil конвертировать PDF в txt, производя искаженный вывод

Я пытаюсь преобразовать файлы PDF в текстовые файлы, используя textutil . Я не делаю, если есть специальные типы PDF-файлов, которые могут и не могут быть преобразованы. Файлы, которые я пытаюсь преобразовать, находятся в формате, доступном для поиска, который, как я полагаю, является минимальным требованием. Когда я конвертирую файл, текстовый документ заполняется искаженным выходом. Вот мой код:

 textutil -convert txt example.pdf 

Вот некоторые из первых строк, в случае, когда это помогает определить, где я ошибаюсь:

 %PDF-1.3 %ƒÂÚÂÎßÛ†–ƒ∆ 4 0 obj << /Length 5 0 R /Filter /FlateDecode >> stream xÌõYè‹∏«flı)8>2”„å,R%Ÿªõ¯fixs9ôM‚<YÅ`„Ô‰W,J¢'íF3”@^2Z›<ädˇ:(ˇl>òüçuπ´Í¶ñ¶nõº.⁄⁄ 4>~˘œ?Ã_ÕøÕ”W_≠˘Ù'·fl◊OL.ò´øÂKI5ÖÀª∫*≥O_ÃÀk”'aH|\1OØØù ±Ê˙'sqv0◊ˇ2oÆ√Vñ©˘÷Êmy2jæ»;P+Ú¢(*s˝ikó3>z¸ãõæ8;èè˙΄·ê—z~=| ¯D˝rËî)WÈå<˝¡ÒˇnÆfl/3¿'UnõÆ4~∫Á;Ú”µ≠J˙4‰JWùîgz8€]êªA@g¸≠kRŸ¯‹÷ùàëeÁÔπUŸÓ÷Ü´≤Œ 

Я предполагаю, что это связано с некоторой функцией кодирования, а не с моей областью знаний, поэтому любая помощь будет принята с благодарностью!

One Solution collect form web for “textutil конвертировать PDF в txt, производя искаженный вывод”

Ссылаясь на страницу руководства TEXTUTIL (1), кажется, что формат pdf не находится между форматами, управляемыми этой утилитой: fmt is one of: txt, html, rtf, rtfd, doc, docx, wordml, odt, or webarchive

В Linux / Unix установка скриптового продукта, такого как XPDF / pdftotext, может быть допустимым решением, например, уже высказанным комментарием.

Для тех, кто в OS X, возможно извлечь текст из PDF с помощью встроенного OS X automator action (… см. этот ответ или последний 4 'этого урока ), тогда рассмотрим, что рабочий процесс автомата может быть «сценарием» с помощью команды автомата CLI

  • Найти ссылки и их позиции в формате PDF
  • Как конвертировать PDF-файл в DVD-фильм?
  • `convert`ing * .gif to file.pdf зависает / задерживает систему
  • Есть ли какой-то PDF-файл для преобразования текста?
  • Экспортировать комментарии только от Okular Pdf-reader (спутывание)
  • Как создать пустой PDF-файл из командной строки?
  • Распечатайте n строк до и m строк после совпадения с pdfgrep
  • Сравнить документы PDF со встроенными ссылками?
  • Печать на пользовательском размере бумаги / добавление формата бумаги в PPD
  • Как преобразовать справочную страницу troff с символами UTF-8 (чешский, если быть точным) в PDF
  • собирать и печатать несколько страниц в одном PDF-файле в Linux
  • Linux и Unix - лучшая ОС в мире.