Изменение кодировки текстового файла без указания исходной кодировки

Я хочу изменить кодировку кодировки для файла в unix с помощью одной команды, но поскольку это будет автоматизированный процесс, для меня невозможно узнать исходную кодировку.

Поэтому мне нужна команда, которая изменит кодировку на UTF-8 для любой исходной кодировки.

One Solution collect form web for “Изменение кодировки текстового файла без указания исходной кодировки”

Вы можете использовать iconv или recode для преобразования файла. Но вам нужно указать исходную кодировку.

Информация о кодировке источника должна откуда-то исходить. В текстовом файле нет информации о его кодировке. Некоторые типы форматированного текста содержат указание (например, заголовки в HTML или в LaTeX), но в целом вы сами по себе. Какую кодировку он использует для своего текстового файла, зависит от среды.

Вы можете попытаться угадать исходную кодировку. У этого есть только возможность работать, если у вас есть информация о файле – либо вы знаете, на каком языке он находится (например, вы знаете, что это на польском или английском языке), либо существует лишь небольшое количество потенциальных кодировок (например, это либо UTF-8 или латинский-1). См. Как я могу проверить кодировку текстового файла … Является ли он действительным и что это такое? и как мне перекодировать смешанный кодированный текстовый файл для некоторых возможностей, включая Enca и Perl Encode :: Guess . Вам нужно будет работать на основе вашего набора данных, может ли один из этих инструментов работать на вас.

  • Кодирование изменилось после запуска cat
  • Как исправить кодировку имени файла
  • opendir и readdir кодирующие строки за моей спиной?
  • некоторые кириллические имена файлов были повреждены при переходе с сервера на сервер
  • Окталы 302 240 вместе, по-видимому, соответствуют неразрывному пространству
  • Неправильное кодирование имени файла в KDE, но верно в GTK / tty1 /
  • Некоторые приложения не принимают некоторые символы из ключа «Создать»
  • Несколько вопросов о кодировке символов файловой системы в Linux
  • Как настроить medit для отображения UTF-8?
  • Команда для извлечения списка символов в заданном классе символов в текущей локали
  • Силовая линия Vim со сломанной кодировкой
  • Команда Unix для преобразования кодировки символов в CSV-файл
  • Linux и Unix - лучшая ОС в мире.