Извлечь формулы из PDF

Я изучаю машинное обучение, и литература богата формулами.

Я хочу иметь возможность извлекать формулы (которые, по-видимому, созданы TeX), либо:

  • .PNG изображения
  • Латекс

Я пробовал:

  • pdfimagespdfimages только растровые изображения (без формул)
  • pdf2html -c – формулы искажены

Linux и Unix - лучшая ОС в мире.