Как найти небританские символы, отличные от ASCII, не относящиеся к LaTeX для pdftex?

Я отлаживаю свой файл tex, устраняя все технические недостатки в системах. Я не могу найти что-то не так в моем документе с сообществом Tex здесь и мной, поэтому я думаю, что может быть что-то не-ASCII-символов, усложняющее pdflatex . Образец предупреждений LaTeX, которые меня и мои друзья не понимают, поскольку мы не понимаем происхождение

 Underfull \hbox (badness 1019) in paragraph at lines 4--10 \T1/lmr/m/n/12 (+20) Avail-able from [][]$\T1/lmtt/m/n/12 http : / / www . dyna med . com / login . aspx ? direct = true & site = [50] [51] [52] [53] Underfull \hbox (badness 1019) in paragraph at lines 332--338 \T1/lmr/m/n/12 (+20) Avail-able from [][]$\T1/lmtt/m/n/12 http : / / www . dyna med . com / login . aspx ? direct = true & site = ) (./deliminated.figures.tex [54] 

Вещи, которые я сделал, чтобы попытаться устранить все небританские символы, отличные от ASCII, в файлах .tex и .bib

  1. Устранить символы, отличные от ASCII, в .tex и .bib

     # http://stackoverflow.com/a/9395552/54964 grep --color='auto' -P -n "[\x80-\xFF]" file.tex grep --color='auto' -P -n "[\x80-\xFF]" work.bib 

Меня интересует, достаточно ли grep для поиска всех символов, отличных от ASCII.

Инструменты проверены, но нет выгоды после ответа Гилла

  1. grep --color='auto' -P -n '[^\x00-\x7F]' file.tex
  2. grep -P "[\x80-\xFF]" file.tex
  3. perl -ane '{ if(m/[[:^ascii:]]/) { print } }' file.tex
  4. grep --color='auto' -P -n "[^[:ascii:]]" file.txt

Вещи, которые я не уверен

  1. Ответ Жиля здесь LC_ALL=C grep '[^ -~]' file.tex но он находит синтаксические символы LaTeX как не-ASCII. Это правильно?

TeXLive: 2016
ОС: Debian 8.5
Локаль: британский

  • Извлечение IP-адреса из текста и сохранение его в переменной
  • Искать строку в файле один раз и печатать имя файла
  • Почему grep игнорирует двоичные файлы по умолчанию?
  • Получите первое соответствие шаблону в строке, не использующей разрез
  • grep отлично работает в командной строке, но ничего не возвращает в скрипте
  • Поиск строки во многих файлах на HP-UX
  • Как grep n-я подстрока между заданными разделителями?
  • поиск и замена с помощью grep (not sed)
  • One Solution collect form web for “Как найти небританские символы, отличные от ASCII, не относящиеся к LaTeX для pdftex?”

    [\x80-\xFF] включает только пункты кода от 128 до 255. В зависимости от языкового стандарта, в частности от кодировки символов, это может быть или не быть набором символов, отличных от ASCII. Это только в 8-битных кодировках. (На основе ASCII-8-битных кодировок, но вы вряд ли встретите что-нибудь еще.) В локалях, где символ не является одним байтом, включая UTF-8, который является стандартом де-факто, [\x80-\xFF] – это лишь небольшое подмножество символов, отличных от ASCII.

    Самый простой способ поиска символов, отличных от ASCII, – навязать языковой стандарт C. В локали C символ является байтом. Использование единой юниверса также делает некоторые версии GNU grep значительно быстрее.

     LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex 
    Linux и Unix - лучшая ОС в мире.