Tag: текстовая обработка

Текстовый файл процесса – Извлечь данные, начиная с номера

У меня есть список контактной информации, которую мне нужно обрабатывать в формате .txt , разделенном,. Мы хотим сохранить коды SIC, которые начинаются с 65 что является недвижимостью. Команда должна проверять только правильное поле для данных, которое начинается с 65. Пожалуйста, имейте в виду, что число не всегда будет 6531 , оно просто должно начинаться с […]

Объединение нескольких полей отдельно на основе одной (ключевой) колонки

У меня есть тестовые данные, разделенные табуляцией: A 1 2 B 3 4 B 5 6 C 7 8 Я хочу объединить (заполнить) оба столбца # 2 и # 3 на основе повторяющихся значений в столбце 1, например: A 1 2 B 3;5 4;6 C 7 8 В настоящее время рабочий код, который я разработал […]

Bash: как распечатать дополнительный столбец, соответствующий IP-адресу для имени

Я использую netstat для сбора информации о подключенных IP-адресах. И у меня есть следующий формат: netstat -tn 2>/dev/null | awk '/:80 / {print $5}' | sed 's/.*::ffff://' | sed 's/:.*//' | sor t | uniq -c | sort -nr 5 81.133.113.200 4 80.229.142.126 2 94.136.36.29 2 92.19.231.69 2 85.159.56.230 2 83.70.246.152 2 81.131.118.236 2 185.106.92.42 […]

Создание текстового файла из других текстовых файлов

У меня есть текстовый файл, подобный этому word_1 root_of_word_A word_2 root_of_word_B word_3 root_of_word_C word_4 root_of_word_A И другой документ, подобный этому root_of_word_A root_of_word_1 root_of_word_B root_of_word_2 root_of_word_C root_of_word_3 Я должен заменить в первом документе другими словами второго документа, как это word_1 root_of_word_1 word_2 root_of_word_2 word_3 root_of_word_3 word_4 root_of_word_1 Я думал, что могу сделать что-то подобное с awk. […]

Обработка файлов CSV

У меня два файла csv, скажем, A и B. Я понял, что я случайно перепутал ситуацию, и теперь, чтобы отменить ошибку, я хочу написать сценарий оболочки, чтобы данные в третьем столбце файла A были записаны в четвертом столбце файла B и данных в четвертом столбце файл B должен быть записан в третьем столбце файла A. […]

Как суммировать определенные строки матрицы

Мне нужно суммировать матричные элементы определенных строк для каждого столбца. Пример матрицы приведен ниже (ввод). Таким образом, матрица имеет 4 столбца и 6 строк чисел. Мне нужно суммировать числа конкретных строк для каждого столбца. Другими словами, мне нужно суммировать элементы row1 + row2 + row5 и row3 + row4 + row6 для каждого столбца. Вход: […]

Необходимо отфильтровать данные на основе двух столбцов, имеющих много отношений, используя awk

У меня большой файл с 50-ю столбцами и 100K строк, разделенных символом |. Теперь $ 2 (col 2) имеет несколько типов значений $ 1 (col 1), что означает, что col 2 будет повторяться. Поэтому я отсортировал файл. Теперь мне нужно извлечь / отфильтровать файл результатов на основе нижеследующего условия: $ 1 – столбец 1 $ […]

Объединение совпадающих столбцов с двумя файлами или использование значения по умолчанию

Я пытаюсь переписать текстовый файл main.txt с изменениями из файла change.txt . Файл main.txt выглядит так: word_1 genre_A word_2 genre_A word_3 genre_B word_4 genre_C word_5 genre_A И change.txt выглядит так: genre_A root_A genre_C root_C Я хотел бы изменить те, которые находятся в файле change.txt в main.txt, чтобы получить что-то вроде этого: word_1 root_A word_2 root_A […]

Объединение содержимого нескольких CSV-файлов в один файл .csv

Я хочу написать скрипт, который объединяет содержимое нескольких CSV-файлов в один CSV-файл, т.е. добавляет столбцы всех других файлов в столбцы первого файла. Я попытался сделать это, используя цикл «для», но не смог продолжить его. Кто-нибудь знает, как это сделать в Linux?

как получить # файлов, скопированных с помощью rsync

Я использую rsync в скрипте (в OSX) для копирования с рейда на 2 резервных диска, что происходит, когда я запускаю скрипт, возможно, 10x-20x в день. Я пытаюсь выяснить способ анализа файла журнала rsync или что-то в этом роде, чтобы сообщить мне количество файлов, которые были скопированы. Вот моя команда rsync: rsync -auvh –delete –progress "$SourceTx" […]

Linux и Unix - лучшая ОС в мире.