Tag: awk

awk: for-loop with break option

Я пытаюсь использовать awk для управления данными. У меня есть файл данных с двумя столбцами, и я бы хотел найти строку, содержащую определенное значение. Но есть несколько строк, которые содержат это значение, и я только хотел бы найти первый. Я попробовал его с помощью -loop и break но он не работает так, как я ожидал. […]

AWK: вложенное условное подмножество строк

У меня довольно конкретный вопрос, и я смог найти лоты в условном подмножестве с помощью awk, но никто из них не дает достаточно явного кода для обобщения моей ситуации. У меня есть файлы «ключи» и файлы «функции». Таблица «ключи» содержит две переменные: KEY и GROUP, пример игрушек ниже. KEY GROUP — —– 1 GROUP0 2 […]

Как совместить число в одном файле с именем в другом файле?

Хорошо, я надеюсь, что это подходящее место, чтобы спросить. У меня есть 2 файла. Первый файл имеет 4 поля: класс CRN #, идентификатор инструктора #, класс раздел #, количество учащихся. Пример: 0002 T00005 006 15 0004 T00004 012 26 . . etc Второй файл имеет 6 полей (насколько я могу судить): идентификатор инструктора, имя, фамилия, […]

объединить файлы csv, сохранить запятую внутри кавычек

У меня есть 3 csv-файла, которые я хочу добавить в первый столбец (столбец id) Каждый файл имеет те же 3 столбца Пример строки: id | timestamp | Name 3792318, 2014-07-15 00:00:00, "A, B" Когда я присоединяюсь к 3 CSV-файлам с помощью join -t, <(join -t, csv1 csv2) csv3 > out.csv Файл out.csv не имеет одинакового […]

переименуйте пакет файлов после чтения из исходного файла

У меня есть каталог, полный более тысячи файлов, и имена немного длинны (и ни один шаблон не найден в стиле именования). Я хотел бы упростить имена файлов. Например: Bioimage_23335989_Data_22317866_22317867_20140723_1002.pdb Bioimage_22335990_Data_22318490_22318491_20140723_1009.pdb Bioimage_23835970_Data_22317866_22317867_20140723_1005.pdb …..и так далее ! Я создал простой текстовый файл ( filelist.txt ), который читается следующим образом: 1.pdb Bioimage_23335989_Data_22317866_22317867_20140723_1002.pdb 2.pdb Bioimage_22335990_Data_22318490_22318491_20140723_1009.pdb 3.pdb Bioimage_23835970_Data_22317866_22317867_20140723_1005.pdb …..и так […]

два файла .csv сравниваются с помощью awk

Мне нужно сравнить два файла: File1.csv и File2.csv (разделенные ',') с помощью Awk Логика: Столбец PID в обоих файлах является ссылкой. Если для одного и того же «PID» в «File1.csv» и «File2.csv» и в обоих файлах значение «Значение» равно, то значение «File2.csv» для столбца «UTS» для этого столбца получает значение из «File1». csv 'column' RTS […]

Последняя строка неверна при разбиении файла на awk

У меня есть файл main.txt с данными, который выглядит так: 20130826,aaaaaaaaaaaaaa,bbbbbbb 20130826,sdfasdfasdfas,sdfasdfasd 20130826,dfasdfas,asdf2323 … 20130827,sfasdfasdfasd,sdfasdfwea Я использовал следующий фрагмент awk для разделения main.csv на меньшие файлы по дате. cat test01 | stdbuf -oL -eL awk -F',' '{print $2","$3 >> "data"$1".csv"; fflush()}' и я обнаружил, что для разбитого файла data20130826.csv последняя строка неполна, … 20130826,dfasdfas,asdf2323 2013082 […]

Извлечение информации о трассировке с помощью gawk

Я новичок в программировании awk и использую gawk для извлечения информации о трассировке из файла mrt, чтобы использовать его для анализа. Я успешно смог извлечь информацию трассировки из формата файла pcap, но не могу понять это для формата mrt. Позвольте мне объяснить, что я пытаюсь извлечь, показывая вам пример формата pcap. Мой входной файл pcap: […]

Объединение нескольких строк в один, используя awk

Я работаю с очень большим набором данных в формате: chr1 45162 . . CT chr1 45162 . . CT chr1 45162 A . . T chr1 45162 . . CT chr1 45257 A . . T chr1 45257 A . . T chr1 45413 A . . T chr1 46844 A . C . chr1 […]

Как сделать фильтр более эффективным

Я создал сценарий для сравнения списка пользователей из базы данных MSSQL со списком отключенных пользователей AD. Инструмент, который мы используем для аутентификации AD, возвращает данные в следующем формате (с большим количеством пробелов между столбцами), поэтому для сравнения (на python) данные должны быть проанализированы: User info (Level-2): ==================== Name: domain\username UPN: UserName@domain.local Generated UPN: NO DN: […]

Linux и Unix - лучшая ОС в мире.