Как найти небританские символы, отличные от ASCII, не относящиеся к LaTeX для pdftex?

Я отлаживаю свой файл tex, устраняя все технические недостатки в системах. Я не могу найти что-то не так в моем документе с сообществом Tex здесь и мной, поэтому я думаю, что может быть что-то не-ASCII-символов, усложняющее pdflatex . Образец предупреждений LaTeX, которые меня и мои друзья не понимают, поскольку мы не понимаем происхождение

 Underfull \hbox (badness 1019) in paragraph at lines 4--10 \T1/lmr/m/n/12 (+20) Avail-able from [][]$\T1/lmtt/m/n/12 http : / / www . dyna med . com / login . aspx ? direct = true & site = [50] [51] [52] [53] Underfull \hbox (badness 1019) in paragraph at lines 332--338 \T1/lmr/m/n/12 (+20) Avail-able from [][]$\T1/lmtt/m/n/12 http : / / www . dyna med . com / login . aspx ? direct = true & site = ) (./deliminated.figures.tex [54] 

Вещи, которые я сделал, чтобы попытаться устранить все небританские символы, отличные от ASCII, в файлах .tex и .bib

  • Как извлечь из linux некоторые группы захвата, используя командную строку в режиме php / preg?
  • Использование grep / sort / find для извлечения уникальных значений
  • grep выходит из-за использования плунжера - могу ли я заставить grep не использовать столько бара?
  • Быстро найти все файлы, начинающиеся с заданной строки.
  • Распечатайте несколько строк до и после соответствия шаблону, исключая строки, соответствующие другим шаблонам
  • разница между. * и * в регулярном выражении
    1. Устранить символы, отличные от ASCII, в .tex и .bib

       # http://stackoverflow.com/a/9395552/54964 grep --color='auto' -P -n "[\x80-\xFF]" file.tex grep --color='auto' -P -n "[\x80-\xFF]" work.bib 

    Меня интересует, достаточно ли grep для поиска всех символов, отличных от ASCII.

    Инструменты проверены, но нет выгоды после ответа Гилла

    1. grep --color='auto' -P -n '[^\x00-\x7F]' file.tex
    2. grep -P "[\x80-\xFF]" file.tex
    3. perl -ane '{ if(m/[[:^ascii:]]/) { print } }' file.tex
    4. grep --color='auto' -P -n "[^[:ascii:]]" file.txt

    Вещи, которые я не уверен

    1. Ответ Жиля здесь LC_ALL=C grep '[^ -~]' file.tex но он находит синтаксические символы LaTeX как не-ASCII. Это правильно?

    TeXLive: 2016
    ОС: Debian 8.5
    Локаль: британский

  • grep два условия, один отрицательный, без трубопровода?
  • Как сопоставить конкретную форму необязательной последовательности из краткого руководства, включая варианты?
  • Как grep whitespace исключает новый символ?
  • Диапазон портов grep regex от netstat
  • Может кто-нибудь уточнить этот сценарий Bash
  • Только выходные результаты grep
  • One Solution collect form web for “Как найти небританские символы, отличные от ASCII, не относящиеся к LaTeX для pdftex?”

    [\x80-\xFF] включает только пункты кода от 128 до 255. В зависимости от языкового стандарта, в частности от кодировки символов, это может быть или не быть набором символов, отличных от ASCII. Это только в 8-битных кодировках. (На основе ASCII-8-битных кодировок, но вы вряд ли встретите что-нибудь еще.) В локалях, где символ не является одним байтом, включая UTF-8, который является стандартом де-факто, [\x80-\xFF] – это лишь небольшое подмножество символов, отличных от ASCII.

    Самый простой способ поиска символов, отличных от ASCII, – навязать языковой стандарт C. В локали C символ является байтом. Использование единой юниверса также делает некоторые версии GNU grep значительно быстрее.

     LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex 
    Linux и Unix - лучшая ОС в мире.