Что происходит, когда я пишу нетекстовый файл?

Когда я запускаю cat в файле, который не является только текстом, он возвращает большое количество символов (многие из которых выглядят как это). Что это за данные?

  • Как я могу добавить заголовок к файлу при использовании cat?
  • Будет ли cat * .txt конкатенировать файлы в алфавитном порядке?
  • Присоединение файлов с путаницей кошки
  • объединить файл с именем файла
  • Кошка с заголовками и номерами строк?
  • Разница между «cat» и «cat <
  • В чем разница в использовании Ctrl + D и Ctrl + C для завершения команды cat?
  • Кошка с заголовками и номерами строк?
  • Как я могу добавить заголовок к файлу при использовании cat?
  • Присоединение файлов с путаницей кошки
  • Разница между «cat» и «cat <
  • Будет ли cat * .txt конкатенировать файлы в алфавитном порядке?
  • 2 Solutions collect form web for “Что происходит, когда я пишу нетекстовый файл?”

    Большая часть данных в нетекстовом файле не может быть представлена ​​с использованием символов из любого из доступных наборов символов. Когда эти данные обрабатываются cat и отображаются на экране, они отображаются как или другие бессмысленные символы, поскольку нет другого способа их отображения.

    На самом деле не является «бессмысленным характером». Это символ замены Unicode. Он отображается в терминале с использованием кодировки UTF-8 при попытке отображения байта, который не является законным кодом UTF-8. Он может отображаться (но гораздо менее вероятно), когда шрифты, доступные для терминала, не предоставляют определенного юридического значения Unicode, но в этом случае более вероятно, что будет показан пробел.

    Как правило, коды 32-126 (US-ASCII, переносной набор символов POSIX) можно печатать. Коды 160-255 можно печатать в кодировке ISO-8859-1, но не как UTF-8, потому что они будут одним из двух или более байтов, составляющих кодированное Unicode значение UTF-8. Аналогично, коды 128-159 являются управляющими символами в ISO-8859-1 (и непечатаются), но в UTF-8 это один из двух или более байтов и т. Д.

    Если вы ставите нетекстовый файл, у него, вероятно, будут байты из диапазона 128-255, и они вряд ли будут иметь законные значения UTF-8. Итак, вы увидите .

    Дальнейшее чтение:

    • Возможность декодирования UTF-8 и стресс-теста
    Linux и Unix - лучшая ОС в мире.