Intereting Posts
Как вводить / выбирать сеанс после выхода из системы без пароля в (Linux Mint) Xfce? Как управлять подсветкой клавиатуры с помощью горячих клавиш Как сделать grep, который исключает кучу труб? Кто-нибудь знает, где изменить это значение «bufsize»? (стримеры ST / mt LTO) ssh переходит к динамическому серверу через шлюз с ключом почему это так долго, чтобы прочитать несколько строк моего файла? Панель Tmux: Unzoom при переключении на другую панель Как отменить настройки ядра? Загрузочный раздел grub / systemd qemu + windows 10 странное поведение В порядке ли сортировка /etc/ld.so.conf / dev / tty * последовательные устройства находятся в группе «root» на секунду, прежде чем они переключаются на группу «dialout». Как заставить их начать в «дозвоне»? Какие данные хранятся в журнале файловой системы ext4? Как сохранить / dev / stdout целевое местоположение в сценарии bash? Скрипт SFTP не работает с заданием cron

Проблема с вставкой новой строки между странными html-символами в html-файле – UTF-8

Я использую следующую команду, чтобы вставить новые строки между символами в текстовом файле, чтобы сгенерировать один столбец символов:

sed 's/./&\n/g' file.txt 

Это работает для символов в ASCII; например, из:

 123 

чтобы:

 1 2 3 

Я не могу получить что-либо, чтобы работать с многобайтными символами, такими как Õöþùüê¡£¢¥Ÿ£€Ÿ£¡œãòá碜áòá , которые появляются на веб-страницах, которые я загружаю как HTML.

Какие-либо предложения?

Это часть решения, над которым я работаю, для другого вопроса, который я разместил, – в конечном итоге я пытаюсь создать сценарий для преобразования этих символов на английский язык, но мне нужно, чтобы каждый персонаж на своей линии.

Какие-либо предложения?

Прежде всего, это отлично работает для меня:

 echo "Õöþùüê¡£¢" | sed 's/./&\n/g' Õ ö þ ù ü ê ¡ £ ¢ 

Учитывая этот locale :

 locale LANG=sv_SE.UTF-8 LANGUAGE= LC_CTYPE="sv_SE.UTF-8" LC_NUMERIC="sv_SE.UTF-8" LC_TIME="sv_SE.UTF-8" LC_COLLATE="sv_SE.UTF-8" LC_MONETARY="sv_SE.UTF-8" LC_MESSAGES="sv_SE.UTF-8" LC_PAPER="sv_SE.UTF-8" LC_NAME="sv_SE.UTF-8" LC_ADDRESS="sv_SE.UTF-8" LC_TELEPHONE="sv_SE.UTF-8" LC_MEASUREMENT="sv_SE.UTF-8" LC_IDENTIFICATION="sv_SE.UTF-8" LC_ALL= действия locale LANG=sv_SE.UTF-8 LANGUAGE= LC_CTYPE="sv_SE.UTF-8" LC_NUMERIC="sv_SE.UTF-8" LC_TIME="sv_SE.UTF-8" LC_COLLATE="sv_SE.UTF-8" LC_MONETARY="sv_SE.UTF-8" LC_MESSAGES="sv_SE.UTF-8" LC_PAPER="sv_SE.UTF-8" LC_NAME="sv_SE.UTF-8" LC_ADDRESS="sv_SE.UTF-8" LC_TELEPHONE="sv_SE.UTF-8" LC_MEASUREMENT="sv_SE.UTF-8" LC_IDENTIFICATION="sv_SE.UTF-8" LC_ALL= 

Я предполагаю, что ваш locale не UTF-8. Попробуйте установить свой locale в UTF-8 и повторите попытку.