Tag: текстовая обработка

AWK поможет заполнить остальную часть столбцов файлом в файле

Я пытаюсь получить AWK, заполняя следующий текстовый файл для «пустых» столбцов ». Основная идея поиска самой длинной строки с AWK NF и проверка, какая строка не имеет значения для этого столбца. Затем добавив x раз N / A для каждого пустого столбца. В этом примере выделено пространство ввода, но, конечно, его можно легко изменить для […]

Awk для удаления строки, если аргумент встречается в определенном столбце

Мне нужно прокрутить весь файл неизвестного размера и удалить любую строку, в которой данное слово (переданное как аргумент 1) появляется в указанном столбце. Кроме того, мне нужно отслеживать, сколько строк удалено. Я предполагаю, что это работа для awk, но у меня с ней много проблем. Я пробовал работать с awk-совпадением, но в дополнение к некоторым […]

Как редактировать файлы на месте при выполнении операции над значениями, соответствующими найденному шаблону?

Учитывая список файлов, содержащих случайный текст и многие даты в формате ISO в нем (например, «2012-07-02T10: 47: 24 + 02: 00»), как я могу найти все эти даты и добавить 2 часа к каждому из них? В идеале решение, которое учитывает тот факт, что день будет 24 часа, будет большим (то есть «02T23: 15 + […]

Проблема с пастой и стандартным выходом в linux

У меня есть два файла, которые я пытаюсь объединить, один файл: linux$ cat temp2 linear_0_A_B linear_0_B_A 103027.244444 102714.177778 103464.311111 102876.266667 103687.422222 103072.711111 103533.244444 102967.733333 103545.066667 102916.933333 103621.555556 103027.511111 104255.776536 103006.256983 103712.178771 102877.139665 103817.555556 103198.488889 103701.422222 103133.200000 И другой файл: linux$ cat temp linear_1_A_B linear_1_B_A 118620.444444 109212.355556 108408.488889 105744.444444 108136.311111 105174.933333 108627.688889 105390.044444 108356.577778 105412.888889 108559.204420 […]

Определите количество уникальных значений, а затем количество вхождений этих значений в файл

У меня есть файл данных, который содержит 15000 строк, но только 400 уникальных значений. Я ищу способ определить количество уникальных значений, а затем количество вхождений этих значений в файл. Я придумал следующее, но это очень медленно. Есть предположения? for value in `cat mylist.txt | uniq` do counter=`grep $value mylist.txt |wc -l` echo $value $counter done

Вложенный «awk» в цикле «while», проанализируйте два файла по строкам и сравните значения столбцов

Мне нужна помощь с комбинацией awk & while loop. У меня есть два простых файла со столбцами (обычные очень большие), один из которых представляет собой простые интервалы для ID = 10 (кодирующих областей (экзонов) для хромосомы 10 здесь): #exons.bed 10 60005 60100 10 61007 61130 10 61200 61300 10 61500 61650 10 61680 61850 и […]

Считайте и объедините последовательные паттерны

Я ищу короткий фрагмент, чтобы находить, подсчитывать и объединять последовательные дубликаты с использованием стандартных инструментов или обычного языка сценариев. Скажем, наш вклад: 1 2 2 2 7 22 abbcccccd dd 2 2 cc И в качестве вывода мы хотели бы иметь нечто похожее : 1 3*2 7 22 a 2*b 5*cd dd 2*2 2*c Важно […]

Регулярное выражение для соответствия последовательностям буквенно-цифровых символов

Любой способ использования grep / awk / perl для соответствия строкам в форме *.* = *.* (ie ac4df.bx5dfd8g = ce5def.dd5f7gdgf ) Где * означает 0 + буквенно-цифровой символ?

Помогите улучшить мои навыки AWK

Эта программа работает так, как я намеревался, но я чувствую, что использовал некоторые неуклюжие методы для получения желаемого результата (особенно с использованием команд печати и объявлений переменных) Может ли кто-нибудь улучшить этот скрипт, чтобы я мог видеть, где я мог бы улучшить? Кто-нибудь хочет показать мне какую-то сумасшедшую версию этого? Является ли настройка переменных в […]

Удалите последовательные строки в CSV с повторяющимися значениями в одном поле, но сохраните последнюю строку

У меня есть длинный файл CSV с двумя столбцами, который включает в себя прогон последовательных дубликатов: … 1500,1533 1554,1678 1554,1703 1554,1728 1593,1766 … Мне нужно удалить все эти дубликаты, кроме последнего, так что вывод для примера выше: … 1500,1533 1554,1728 1593,1766 … Также мне нужно сохранить остальные строки в файле в исходном порядке. Я попробовал […]

Linux и Unix - лучшая ОС в мире.