OCR, который выводит данные вероятности

Я хотел бы преобразовать печатные книги, которыми владею в аудио, сканируя их с помощью OCR, а затем запускаю текст через движок TTS. Эти заголовки недоступны в виде электронных книг.

Поскольку OCR может совершать небольшие ошибки, особенно при преобразовании изображений, содержащих старые шрифты, я хотел бы найти механизм OCR, который может помечать каждую область текста метаданными, описывающими воспринимаемую вероятность правильного соответствия или множество других возможностей. Например, см. Транскрипцию голосовой почты Google Voice, которая выделяет каждое слово в оттенках серого, что указывает на ранжирование вероятности слова с текстом.

Вы знаете какие-либо пакеты, которые предлагают это?