Unix способ извлечь векторное изображение и его график из файла PDF?

Данные: одна тезис LHC 'стр. 16 , где изображение векторизовано (скорее всего, .eps). Я рассматриваю здесь ответ на поток. Программное обеспечение, необходимое для очистки данных от графика . Я не могу найти инструмент, который предназначен для извлечения образа .eps из файла PDF. Псевдокод всей моей системы

  1. Нейтрализовать файл PDF с помощью gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=newfile.pdf badfile.pdf ( источник )
  2. Найти собственное разрешение для извлечения векторного изображения из файла pdf. ( не уверен в этом, потому что не требуется масштабирование, 100% -ный уровень масштабирования изображения Adobe не может быть оптимальным с помощью скриншота)
  3. извлечение векторизованного изображения из файла pdf ( текущая цель )
  4. извлечь граф из .eps image

где делать все в одной и той же системе было бы здорово.

Открытые инструменты с (3)

Возможные форматы изображений: png / xpm / jpeg / tiff / pnm / ras / bmp / ​​gif

  • g3data но формат .eps
  • Engaude-digitizer активен здесь и более популярен, чем R digitize
  • R digitize была удалена из CRAN , так как никакая сила поддержки не была; но теперь в github tpoisot здесь и его обзор в блоге Люка. Оцифровка данных из старых сюжетов с использованием «оцифровки», но они пытаются вернуться в CRAN здесь билет. Здесь я столкнулся с рядом проблем с программным обеспечением. Одна большая слабость заключается в том, что они определяют их github, и никакая обратная связь не приветствуется.

Системы с (3) и (4)

  • скорее всего, R-пакет, который может делать обе вещи:

Инструменты только с (3) или (4) или без

  • Задача (4) может быть выполнена в Mathematica, как описано здесь, о том, возможно ли извлекать данные из графика eps, не генерируемого в Mathematica . Однако Mathematica не подходит для Task (3) в соответствии с devtalk.
  • Adobe Acrobat> Редактирование. Я не мог найти подходящего метода для этого. Кажется, что версия Linux в Ubuntu 16.04 отсутствует.

Из векторизованных и шагов (1-2)

Перетаскивание фигуры здесь не работает. Поэтому необходимо программно извлечь фигуру из pdf. Существует терминальный инструмент для того, который извлекает все изображения / eps / … из документа, но я понятия не имею, насколько хорошо они делают то, что делают. Я хотел бы найти здесь что-то, что просто полезно при извлечении образа .eps из файла pdf.

От растрированного до векторизованного и шагов (1-2)

Пример изображения для DavidLeBauer о вскрытии графика с осью x для обсуждения здесь

введите описание изображения здесь

и второй пример о точках, пересекающих две оси здесь для Дэвида

введите описание изображения здесь

Код

 % https://unix.stackexchange.com/q/281211/16920 gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=data_clean.pdf badfile.pdf % drag and drop picture from data_clean.pdf to your folder in Ubuntu 16.04 by having the default zoom level; I think zoom should not affect here the result of drag-and-drop % Result: image.png % g3data image.png % bug in 16.04: http://askubuntu.com/q/767982/25388 % open figure in ubuntu - Print to File > Ps. % Result: image.png.ps ps2eps image.png.ps % Result: image.png.eps % https://mathematica.stackexchange.com/q/85320/9815 %% Mathematica starts here (* Wolfram Language Test file *) fig = Import["image.png.eps"] Import["http://raw.github.com/AlexeyPopkov/shortInputForm/master/shortInputForm.m"] fig // shortInputForm % Run but get error: http://askubuntu.com/q/767992/25388 % NB this error comes too if I have no code in the editor. So something wrong in my way of doing this. I am amateur in Mathematica. 

Как вы можете извлечь изображение .eps и его график из файла pdf в Unix?

Для случая не существует достаточного поддерживаемого решения, потому что проблема в действительности является трудной обратной задачей. Решения Mathematica также имеют серьезные проблемы с реальными приложениями.