Tag: текстовая обработка

использование grep для подсчета уникальных идентификаторов с границей слов

У меня есть файл в следующем формате с миллионами строк KABC XXX 111 222 KDEF XXX 123 456 KGHI XXX 567 890 KABC XXX 124 267 KDEF XXX 190 478 KGHI XXX 095 609 KABC XXX 001 902 KDEF XXX 013 986 KGHI XXX 792 001 и т.д Есть еще много строк, но это просто […]

Как заменить несколько букв в многострочном слове, состоящем из цифр и букв в определенном формате?

У меня есть файл, в котором я хочу изменить весь код, который имеет следующий формат: n{,3}L{,2}n{,5} where n= [0-9] any number and L [a-zA-Z] any letter either capital or not Я хочу изменить A или a на AB и d или D в DK, что-то вроде этого: Annnnn–> ABnnnnn ; Dnnn–>DKnnn файл выглядит так: $ […]

Разбор JSON для определенных значений

У меня есть этот файл JSON в одной строке, содержащей тысячи записей, и я хочу скопировать его разделы, соответствующие конкретным именам домохозяйств или номерам карт. Приложен пример, содержащий 3 набора данных. Каждый уникальный раздел начинается с {"card и заканчивается на []} . Уникальная доступная для поиска детальность в каждом разделе – это имя домохозяйства "38BA1234" […]

Как перебирать последний октет IP в awk?

Я задаюсь вопросом, можно ли перебирать последний октет IP с awk , считая, что IP является переменной, полученной от bash stdin, что-то вроде: #!/bin/bash read IP awk -v IP="${IP}" 'BEGIN{FS="."} {for (i=1; i<=251; i++) { print $1 $2 $3 i } }' И выход будет выглядеть так: 192.168.1.1 192.168.1.2 …. 192.168.1.251 Обратите внимание, что это […]

Как отсортировать по 2 столбцам и сохранить верхнюю строку из каждой группы?

У меня есть два файла csv следующего формата: column1,column2,user,column4,column5,column…column14 Я хотел бы отсортировать файлы на основе пользователя в качестве первого ключа, а затем на основе столбца14 в порядке убывания, который представляет собой число, представляющее временную метку. Результат будет таким: file1: A,AA,jim,XX,YY,….,1485771395 A,AA,jim,XX,YY,….,1485771395 и т.д Я бы хотел, чтобы из этих файлов сохранялась только первая строка […]

Получить определенную строку ниже строки grepped

У меня есть сложная проблема, с которой я столкнулся У меня есть следующий текст в файле: create table "ctronsys".activity_codes ( code_list_id varchar(8), code_id varchar(10), record_type varchar(1), active_status_ind varchar(1), security_level varchar(1), short_description varchar(10), long_description varchar(30), record_class varchar(1), owner_id varchar(4), modify_user_id varchar(3), modify_date date, create_user_id varchar(3), create_date date ) in datadbs extent size 16 next size 16 […]

Изменение записей в файлах с фиксированной шириной

У меня есть несколько файлов с фиксированной шириной со структурой вроде этого: datafile3248.dat HEAD DESCRIPTION NAME 1 A 8 X NAME 2 A 8 X NAME 3 A 9 XX NAME 4 A 9 XX NAME 5 A 9 Y NAME 6 A 10 Y NAME 7 A 11 XY NAME 8 A 11 XZ […]

Найти первое появление каждого из этих шаблонов с помощью grep

Эта: cat /var/log/apache2/other_vhosts_access.log |grep -m 1 123.123.123.123 дает мне первое появление IP 123.123.123.123. Но как получить первое появление IP1 и первое появление IP2 и первое появление IP3 и …? Это, очевидно, не работает, но это дает идею: cat /var/log/apache2/other_vhosts_access.log |grep -m 1 123.123.123.123 AND 124.124.124.124 AND 125.125.125.125

Преобразование данных в столбцы

AC=126;AC_AFR=0;AC_AMR=0;AC_Adj=126;AC_EAS=120;AC_FIN=0;AC_Het=112; AC=12683;AC_AFR=4578;AC_AMR=559;AC_Adj=12680;AC_EAS=2104;AC_FIN=501;AC_Het=91966 У меня есть данные с одним из столбцов, которые выглядят так: ключи и значения. Я хотел бы преобразовать выбранные данные в столбец с заголовком, являющимся ключом и значениями в столбце. Не все строки имеют одинаковые данные. Некоторые строки не будут иметь полей, которые появляются в других строках. требуется выход: AC AC_AFR AC_AMR and […]

Не удается выполнить команду для определенного столбца с gawk

Я хочу выполнить определенную команду для первого столбца вывода wpa_cli scan_results . Эта команда, называемая mycmd , принимает MAC-адрес в качестве входных данных и возвращает MAC и OUI: # ./mycmd AC:EE:9E:11:22:33 AC:EE:9E:11:22:33 Samsung Electronics Co.,Ltd Чтобы изменить первый wpa_cli scan_results , я запускаю следующее: wpa_cli scan_results| sed 1d | gawk '{"./mycmd "$1| getline $1 }1' […]

Linux и Unix - лучшая ОС в мире.