Tag: awk

Проверка значений в текстовом файле

Есть ли простой способ проверить, существуют ли во втором столбце файла (файл 2) значения во втором столбце другого файла (файл 1), например, путем печати звезды рядом с соответствующей линией? Если возможно, используйте awk. Файл 1 A 1,2,3,4 B 15,16,17 Файл 2 A 3 B 18 Ожидаемый результат: Файл 3 A 1,2,3,4 * B 15,16,17 EDIT […]

Разделите значения для переопределения ключей и значений в новой строке

fILE1.TXT A 1 2 3 file2.txt A 1 A 2 A 3 Файл 2 можно преобразовать в файл 1, используя следующий код (первый столбец – первичный ключ): cat File2.txt| awk '{line="";for (i = 2; i <= NF; i++) line = line $i " "; table[$1]=table[$1] line;} END {for (key in table) print key "\t" table[key];}' […]

сопоставление образцов awk и файлы слияния

У меня 3 файла 1.csv и 2.csv и 3.csv 1.csv TELECOM_DEVELOPMENT_AFGHANISTAN_COMPANY,AFGHANISTAN,Alphanumeric_A_MSISDN_blocking,1 CABLE&WIRELESS_BARBADOS,BARBADOS,Alphanumeric_A_MSISDN_blocking,791 SIMINN_ICELAND_TELECOM,ICELAND,Alphanumeric_A_MSISDN_blocking,109373 CABLE&WIRELESS_SEYCHELLES,SEYCHELLES,Alphanumeric_A_MSISDN_blocking,2 CABLE&WIRELESS_JAMAICA,JAMAICA,Alphanumeric_A_MSISDN_blocking,85 2.csv SIMINN_ICELAND_TELECOM,ICELAND,SPAM_CHAIN_SMS_REJECT(Spam_Detection_and_Blocking),7795 CABLE&WIRELESS_SEYCHELLES,SEYCHELLES,SPAM_CHAIN_SMS_REJECT(Spam_Detection_and_Blocking),638 3.csv: TELECOM_DEVELOPMENT_AFGHANISTAN_COMPANY,AFGHANISTAN,Calling_Party_Address_Blocking,79 CABLE&WIRELESS_BARBADOS,BARBADOS,Calling_Party_Address_Blocking,30 MOBILKOM_LIECHTENSTEIN,LIECHTENSTEIN,Calling_Party_Address_Blocking,6 SYNIVERSE_ANSI,UNITED_STATES,Calling_Party_Address_Blocking,12 Я хочу объединить файлы, чтобы он распечатывал выходной файл, как показано ниже. TELECOM_DEVELOPMENT_AFGHANISTAN_COMPANY,AFGHANISTAN,Alphanumeric_A_MSISDN_blocking,1,NA,NA,Calling_Party_Address_Blocking,79 CABLE&WIRELESS_BARBADOS,BARBADOS,Alphanumeric_A_MSISDN_blocking,791,NA,NA,Calling_Party_Address_Blocking,30 SIMINN_ICELAND_TELECOM,ICELAND,Alphanumeric_A_MSISDN_blocking,109373,SPAM_CHAIN_SMS_REJECT(Spam_Detection_and_Blocking),7795,NA,NA CABLE&WIRELESS_SEYCHELLES,SEYCHELLES,Alphanumeric_A_MSISDN_blocking,2,SPAM_CHAIN_SMS_REJECT(Spam_Detection_and_Blocking),638,NA,NA CABLE&WIRELESS_JAMAICA,JAMAICA,Alphanumeric_A_MSISDN_blocking,85,NA,NA,NA,NA MOBILKOM_LIECHTENSTEIN,LIECHTENSTEIN,NA,NA,NA,NA,Calling_Party_Address_Blocking,6 SYNIVERSE_ANSI,UNITED_STATES,NA,NA,NA,NA,Calling_Party_Address_Blocking,12

Вам нужно сравнить два файла и распечатать все столбцы, а затем отобразить как NA, а затем присоединиться к другому файлу

Файл 1: 123, 234 345, 789 678, 900 Файл 2 123, abc 345, dnc вывод (все столбцы в файле1 и отсутствующее значение в файле два как NA): 123,234,abc 345,789,dnc 678,900,NA Выходной файл добавить с другим файлом Файл 3 123, 2014/10/20 678, 2013/02/30 Выходной файл 123,234,abc,2014/10/20 345,789,dnc,NA 678,900,NA,2013/02/30 Есть такие 10 файлов, которые мне нужно добавить […]

awk читать между двумя отдельными строками и отбрасывать остальные

Я использую awk чтобы просто читать текст между двумя строками «Проверить» и «Результат». Я использовал множество вариаций, найденных в Интернете, и до сих пор не может получить благоприятный результат. Я пробовал: awk "/Check:/,/Result:/ {print}" BMSCA209-040-transfer-report.18-Jun-2014.11:18.csv.tmp | more И я также попробовал: sed -n "/Check:/,/Result:/p" BMSCA209-040-transfer-report.18-Jun-2014.11:18.csv.tmp | more И до сих пор я не получаю то, […]

Извлечение с помощью grep / sed первого шаблона, а затем второго шаблона, который имел некоторые строки до и связанные с первым

Я пытаюсь извлечь определенную строку из файла .htm когда происходит шаблон («Событие 100» в моем примере ниже), но в то же время мне нужно получить еще один шаблон, который связан с первым, но который возникает из одна из линий над ней. Этот второй шаблон представляет собой время, в которое произошел первый шаблон: Пример: <AZ>207994</AZ> <AZ>09:10:41.9</AZ> […]

переупорядочить значения в одном столбце, не затрагивая другие столбцы, используя awk или sed

У меня есть файл csv в следующем формате: abc,124,123,2014-08-13,abc def,124,123,2014-08-13,abc ghi,124,123,2014-08-13,abc Теперь мне нужно изменить только 5-й столбец ( 2014-08-13 ), чтобы получить результат, как указано ниже abc,124,123,13/08/2014,abc def,124,123,13/08/2014,abc ghi,124,123,13/08/2014,abc Если возможно, предпочтительнее использовать однолинейные awk или sed решения.

Группировка данных и назначение алфавитных и числовых значений для новых категорий

У меня есть 4 столбца в моих данных с разделителями табуляции, мне нужно выполнить 2 шага. Группируйте данные в соответствии с комбинациями первых двух столбцов. Каждый раз, когда новая комбинация значений появляется в объединенных значениях (col 4) для определенной группы (col2), мне нужно назначить новую категорию для этой строки как в алфавитном, так и в […]

используя awk для подмножества файла fastq на основе длины последовательности

У меня есть файл fastq. Я объясню, что это. Это что-то вроде этого @SRR1024120.7 DBRHHJN1:259:D0PM7ACXX:1:1101:1386:1189 length=100 GATACAGGATGCCTGGGTCTAGGCTGTGTGACCTTGGGCCAGTTCCTCTC +SRR1024120.7 DBRHHJN1:259:D0PM7ACXX:1:1101:1386:1189 length=100 DDDFFDDBGFEHEHGIGC9F>HG9EH8?DF4?:DF<?3:D?DHIGGDDFH @SRR1024120.25 DBRHHJN1:259:D0PM7ACXX:1:1101:1752:1149 length=100 CTGCTGCTCATGCTCAT +SRR1024120.25 DBRHHJN1:259:D0PM7ACXX:1:1101:1752:1149 length=100 BDDDDD<<CC:C+AFFE @SRR1024120.42 DBRHHJN1:259:D0PM7ACXX:1:1101:2482:1096 length=100 AGCGTGTGCCACCCTACGCCGGC +SRR1024120.42 DBRHHJN1:259:D0PM7ACXX:1:1101:2482:1096 length=100 DD>DAA@AA@@?2C8AB)?@:DD @SRR1024120.1 DBRHHJN1:259:D0PM7ACXX:1:1101:1200:1120 length=100 AGACAGAAGGGGAGTACAGCTCTCTGGAACATGAGAGTGCAAGGGGTTGAGTGTTT +SRR1024120.1 DBRHHJN1:259:D0PM7ACXX:1:1101:1200:1120 length=100 DDDFFFCFGEHI@CGFADFGCCFFGHFGCFFFHGGDGHIFHDFGGI<BF=DHIHHH Теперь 4 строки соответствуют 1, поэтому @SRR1024120.7 DBRHHJN1:259:D0PM7ACXX:1:1101:1386:1189 length=100 GATACAGGATGCCTGGGTCTAGGCTGTGTGACCTTGGGCCAGTTCCTCTC […]

Как сопоставить другой столбец в файле 1 и file2 с awk?

У меня есть следующие два файла. Первый файл: 3184 2014-07-28 04:15 global.Remote-Access 10.111.8.25 81.245.6.25 tcp 3268 3035 2014-07-28 04:16 global.Remote-Access 10.111.8.12 81.245.6.25 tcp 3268 Второй файл: 1 Jul 28 04:12 2014-07-28 id967254(group3)[attribute1 attribute2] Tunneling: User with IP 10.111.8.12 10 connected 1 Jul 28 04:15 2014-07-28 id920767(group2)[attribute3 attribute4 …. attribute n] Tunneling: User with IP 10.111.8.25 […]

Linux и Unix - лучшая ОС в мире.