Intereting Posts
CentOS: предупредить всех пользователей настольных компьютеров от comand-line Установите Linux Distro на USB Stick ssh: Использовать случаи отпечатков пальцев и randomart Повторение сообщения dmesg Резервное копирование и восстановление списка установленных пакетов и источников APT Как заставить шрифт .psf работать на консоли Linux? Невозможно просмотреть установленные каталоги в chroot Установите яркость экрана: xbacklight не работает на HDMI, xrandr -brightness не прилипает $ HOME readonly: / usr / bin / xauth: тайм-аут в файле блокировки /home/fooftp/.Xauthority Поиск текстового файла с помощью одной строки с использованием регулярных выражений Совместимый беспроводной маршрутизатор? Команда AIX 'rm' не имеет параметра '-v' для подробного вывода Что именно происходит, когда за трубой следует командная группировка? Почему vim возвращает ненулевой код выхода, если я выйду сразу после открытия? zsh-newuser-install не работает

Поврежденный PDF: открывает отлично, но pyPdf поручает с AssertionError

Я получил PDF-сообщение в электронном письме, и я хочу его обрезать и повернуть, потому что он имеет две страницы на листе. Попытка решения на страницах Split в pdf У меня были проблемы с «AssertionError» в pyPDF и «Предупреждение: оператор потока не был прерван действительным EOL». в ImageMagick. Кажется, что pdftk застрял в бесконечном цикле и никогда не заканчивает обработку файла.

Вот ошибка pyPDF :

 Traceback (most recent call last): File "./un2up.py", line 48, in <module> split_pages(sys.argv[1],sys.argv[2]) File "./un2up.py", line 14, in split_pages for i in range(input.getNumPages()): File "/usr/lib64/python2.7/site-packages/pyPdf/pdf.py", line 431, in getNumPages self._flatten() File "/usr/lib64/python2.7/site-packages/pyPdf/pdf.py", line 596, in _flatten catalog = self.trailer["/Root"].getObject() File "/usr/lib64/python2.7/site-packages/pyPdf/generic.py", line 480, in __getitem__ return dict.__getitem__(self, key).getObject() File "/usr/lib64/python2.7/site-packages/pyPdf/generic.py", line 165, in getObject return self.pdf.getObject(self).getObject() File "/usr/lib64/python2.7/site-packages/pyPdf/pdf.py", line 647, in getObject assert idnum == indirectReference.idnum AssertionError 

Я попытался открыть его в Adobe Reader и сохранить копию, но файл оказался тем же.

Файл открывается отлично для визуализации на evince , Adobe Reader и Google Диске.

Любая идея, как исправить файл, чтобы его можно было прочитать pyPdf ?

Использовать pypdf2 с pdf mode strict = false