Tag: текстовая обработка

Как получить сетевую маску от bash?

Я хочу получить свою сетевую маску в Linux. Он выводится с ifconfig но я хочу извлечь строку.

Как получить только уникальные результаты без сортировки данных?

$ cat data.txt aaaaaa aaaaaa cccccc aaaaaa aaaaaa bbbbbb $ cat data.txt | uniq aaaaaa cccccc aaaaaa bbbbbb $ cat data.txt | sort | uniq aaaaaa bbbbbb cccccc $ В результате мне нужно отобразить все строки из исходного файла, удалив все дубликаты (а не только последовательные), сохраняя при этом исходный порядок операторов в файле . […]

Как удалить повторяющиеся строки в большом текстовом файле с несколькими GB?

Мой вопрос аналогичен этому вопросу, но с несколькими различными ограничениями: У меня есть большой \n ограничиваемый список слов – по одному слову в строке. Размер файлов варьируется от 2 ГБ до 10 ГБ. Мне нужно удалить любые повторяющиеся строки. Процесс может сортировать список во время удаления дубликатов, но не требуется. В этом разделе достаточно места […]

Как чередовать строки двух или более файлов?

Я попытался получить два файла в одном файле. Я попытался выполнить команду: cat file1 file2 но здесь данные file2 добавляются к file1 . Мне нужна file1 1-я строка, за которой следует первая строка file2 , а вторая строка file1 вторая строка file2 и т. Д. Может ли кто-нибудь сказать мне, как сделать это простым способом?

Сравнение бок о бок с более чем двумя файлами, содержащими числовые значения

У меня есть три файла, содержащие отсортированную последовательность чисел, по одной в строке: file1 1 2 3 file2 1 3 4 file3 1 5 Я хочу «выровнять» эти три файла бок о бок, как показано ниже: file1 file2 file3 1 1 1 2 3 3 4 5 Я пробовал с sdiff но он работает только […]

shell script / utility заменить 2 байта unicode в двоичном файле

У меня много больших файлов Unicode. Я хотел бы заменить каждую пару байтов Unicode новой байтовой парой Unicode. Например, исходный файл содержит «C3 B9 C3 AB C3 B8 C3 B0», и я хотел бы заменить его на «D7 A0 D7 A8 D7 9B D7 A9». Мне нужно было бы заменить каждый «C3 B9» на «D7 […]

Условно разбить столбцы на 2 строки?

У меня есть файл в формате: ⌚..⌛ watch..hourglass ⌨️ keyboard ⏏️ eject button Если некоторые строки содержат две записи. Я хочу разбить строки с 2 входами на 2 строки: ⌚ watch ⌛ hourglass ⌨️ keyboard ⏏️ eject button Есть ли быстрый способ сделать это? Мой скрипт: #!/usr/bin/env bash wget -O output.txt http://www.unicode.org/Public/emoji/6.0/emoji-data.txt sed -i '/^#/ […]

Объединение нескольких файлов с одинаковым заголовком

У меня есть несколько файлов с одним заголовком и разными векторами ниже. Мне нужно объединить их все, но я хочу, чтобы только заголовок первого файла был конкатенирован, и я не хочу, чтобы другие заголовки были объединены, так как они все одинаковы. например: file1.txt <header>INFO=<ID=DP,Number=1,Type=Integer> <header>INFO=<ID=DP4,Number=4,Type=Integer> A BC file2.txt <header>INFO=<ID=DP,Number=1,Type=Integer> <header>INFO=<ID=DP4,Number=4,Type=Integer> D EF Мне нужен вывод […]

Инструмент командной строки для «cat» попарно расширяет все строки в файле

Предположим, у меня есть файл (назовите его sample.txt), который выглядит так: Row1,10 Row2,20 Row3,30 Row4,40 Я хочу, чтобы иметь возможность работать с потоком из этого файла, который по существу является парной комбинацией всех четырех строк (так что мы должны в итоге получить 16 в общей сложности). Например, я ищу команду потоковой передачи (то есть эффективную), […]

awk: принудительное возвращение статуса?

Это продолжение моего предыдущего вопроса . Я проверяю количество полей в файле / etc / passwd, используя этот удобный снипп. В следующем примере поля пользователя fieldcount1 и fieldcount2 имеют неправильное количество полей: $ awk -F: ' NF!=7 {print}' /etc/passwd fieldcount1:x:1000:100:fieldcount1:/home/fieldcount1:/bin/bash:::: fieldcount2:blah::blah:1002:100:fieldcount2:/home/fieldcount2:/bin/bash: $ echo $? 0 Как вы заметите, awk выйдет с возвратом 0. С его […]

Linux и Unix - лучшая ОС в мире.