Как найти небританские символы, отличные от ASCII, не относящиеся к LaTeX для pdftex?

Я отлаживаю свой файл tex, устраняя все технические недостатки в системах. Я не могу найти что-то не так в моем документе с сообществом Tex здесь и мной, поэтому я думаю, что может быть что-то не-ASCII-символов, усложняющее pdflatex . Образец предупреждений LaTeX, которые меня и мои друзья не понимают, поскольку мы не понимаем происхождение

 Underfull \hbox (badness 1019) in paragraph at lines 4--10 \T1/lmr/m/n/12 (+20) Avail-able from [][]$\T1/lmtt/m/n/12 http : / / www . dyna med . com / login . aspx ? direct = true & site = [50] [51] [52] [53] Underfull \hbox (badness 1019) in paragraph at lines 332--338 \T1/lmr/m/n/12 (+20) Avail-able from [][]$\T1/lmtt/m/n/12 http : / / www . dyna med . com / login . aspx ? direct = true & site = ) (./deliminated.figures.tex [54] 

Вещи, которые я сделал, чтобы попытаться устранить все небританские символы, отличные от ASCII, в файлах .tex и .bib

  1. Устранить символы, отличные от ASCII, в .tex и .bib

     # http://stackoverflow.com/a/9395552/54964 grep --color='auto' -P -n "[\x80-\xFF]" file.tex grep --color='auto' -P -n "[\x80-\xFF]" work.bib 

Меня интересует, достаточно ли grep для поиска всех символов, отличных от ASCII.

Инструменты проверены, но нет выгоды после ответа Гилла

  1. grep --color='auto' -P -n '[^\x00-\x7F]' file.tex
  2. grep -P "[\x80-\xFF]" file.tex
  3. perl -ane '{ if(m/[[:^ascii:]]/) { print } }' file.tex
  4. grep --color='auto' -P -n "[^[:ascii:]]" file.txt

Вещи, которые я не уверен

  1. Ответ Жиля здесь LC_ALL=C grep '[^ -~]' file.tex но он находит синтаксические символы LaTeX как не-ASCII. Это правильно?

TeXLive: 2016
ОС: Debian 8.5
Локаль: британский

One Solution collect form web for “Как найти небританские символы, отличные от ASCII, не относящиеся к LaTeX для pdftex?”

[\x80-\xFF] включает только пункты кода от 128 до 255. В зависимости от языкового стандарта, в частности от кодировки символов, это может быть или не быть набором символов, отличных от ASCII. Это только в 8-битных кодировках. (На основе ASCII-8-битных кодировок, но вы вряд ли встретите что-нибудь еще.) В локалях, где символ не является одним байтом, включая UTF-8, который является стандартом де-факто, [\x80-\xFF] – это лишь небольшое подмножество символов, отличных от ASCII.

Самый простой способ поиска символов, отличных от ASCII, – навязать языковой стандарт C. В локали C символ является байтом. Использование единой юниверса также делает некоторые версии GNU grep значительно быстрее.

 LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex 
  • Поток grep из подпрограммы, а не файл хвоста
  • Как бы я grep для записи файла паролей без использования 'username'
  • Удалить строки из файла, который существует в другом файле с более новой меткой времени
  • Зачем получать эти «Разрешенные разрешения» в POSIX find-grep для чтения?
  • что означает «^ $ 1» в сценарии оболочки?
  • Команда, чтобы увидеть, находится ли слово в списке файлов и выводит, сколько файлов оно находится в
  • печатать различное количество строк до и после шаблона
  • Является ли GREP_OPTIONS = --color = всегда игнорируется?
  • Grep из многих ключевых слов по многим файлам: ускорение
  • Согласование многострочного шаблона с помощью sed, awk или grep
  • Почему это найти -L ... fgrep не удается?
  • Как объединить переключатели -v и -B в grep?
  • Interesting Posts

    Как выполняется процесс аутентификации с помощью солевого хеша в теневой работе

    Как подключиться к сеансу «screen» или начать новую команду

    brasero.toc.bin очень большой – почему?

    ALSA: отправка звука на два аудиоустройства

    Как отправить почту с несколькими вложениями?

    Настройка субдомена на сервере lighttpd

    почему я вижу ошибку «stdin: is not tty» при использовании x2go для удаленного подключения к нескольким дистрибутивам Linux Linux?

    гостевой подкаталог в / media?

    здравомыслящий не работает как санкционированный, но как корень он делает

    OpenVPN: малина pi AP для других pi w / VPN

    Нормально ли для `ldd -version` выйти 1?

    использование. в bash

    Не удается подключить сетевой диск.

    Как протоколировать вызовы с использованием сценария оболочки, когда в исполняемый файл имеется несколько символических ссылок

    ls & dircolors – различать символическую ссылку на каталог и символическую ссылку на обычный файл

    Linux и Unix - лучшая ОС в мире.