Tag: текстовая обработка

Как обрезать отказ от WHOIS?

Каков наилучший способ обрезать массовый отказ от конца выхода whois ? Это выглядит примерно так: >>> Last update of WHOIS database: 2017-01-30T20:17:39Z <<< For more information on Whois status codes, please visit https://icann.org/epp Access to Public Interest Registry WHOIS information is provided to assist persons in determining the contents of a domain name registration record […]

Обработать столбец с текстом, который имеет пробелы как 1 поле

У меня есть файл со следующим форматом: INTEGER INTEGER TEXT Текст является unicode и может иметь пробелы. Я пытаюсь использовать awk для печати первого INTEGER и TEXT в файле в определенном формате с использованием printf. Проблема: потому что ТЕКСТ в некоторых строках имеет пробелы, у $ 3 нет полного ТЕКСТА, поэтому строка разбивается на большее […]

Расширение параметра Shell

Я сделал следующее расширение оболочки параметра: trihead="$(cat ../FASTA_SEC/"$i".fa)" echo "${trihead#"${trihead%%[!A]*}"}" > ../FASTA_SEC/"$i".fa Я бы хотел подрезать ведущие A из второй строки файла fasta (своего рода простой текстовый формат .fa) вход будет примерно таким: >B4-0K032_18670_015 AAAAAAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCNNNGNNNTAGATACAAGCGAGCGGC и я хотел бы, чтобы результат был следующим: >B4-0K032_18670_015 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCNNNGNNNTAGATACAAGCGAGCGGC Кстати, кто-нибудь знает какую-то сторону, где объясняется расширение параметра оболочки?

Преобразование столбца с использованием даты и добавление в файл csv

У меня есть CSV, где в первом столбце есть строка, которая представляет дату и время. Я хотел бы добавить дополнительную колонку с тем, что datetime преобразуется в эпоху. Я попробовал следующее: awk -F "," 'BEGIN{ OFS="," } {$14=$(date -jf "%m/%d/%Y %H:%M:%S %p" $1 "+%s"); print}' mycsv.csv > test Я получил: awk: illegal field $(0%m/%d/%Y %H:%M:%S […]

Как извлечь значения, которые меньше 0 и точка из определенных столбцов, и распечатать всю строку с помощью awk

У меня есть файл с разделителями табуляции, я хочу извлечь «экзонические» записи из второго столбца, «несинхронные SNV» записи из третьего столбца и значения, которые меньше (<1) и точки (.) Из столбца 4-го, 5-го, 7-го Chr Func.refGene ExonicFunc.refGene 1000g2015aug_eas 1000g2015a avsnp147 ExAC_ALL chr1 intergenic synonymous SNV . . . . chr1 exonic nonsynonymous SNV 1.2 . […]

получить все строки, имеющие значение столбца, большее порога

У меня есть файл с большим количеством строк и столбцов, но число столбцов не одинаково во всех строках. Я хочу извлечь все строки с дельта-значением больше 0.02 Point Fanout cap trans delta incr Path ———————————————————- row1 1 0.02 0.01 0.00 0.03 0.04 row2 2 0.04 row3 1 0.01 0.02 0.04 0.05 0.06 row4 0.03 row5 […]

Подсчитайте количество слов, используемых в ответе, следуя строке вопроса

Пример ввода: Question1: What kind of cake do you like? Anything with sprinkles Пример вывода: Question1: What kind of cake do you like? 3 Anything with sprinkles Единственными маркерами являются «Questionx:» и «?». Ответы всегда следуют за вопросами. Этот крик awk для меня, (find /? $ /), Но я не могу получить многострочный аспект, чтобы […]

Как выполнить трассировку стека с помощью grep и regex?

У меня есть трассировка стека: 17/04/26 15:29:03 INFO HttpMethodDirector: Retrying request 17/04/26 15:29:03 ERROR NetworkClient: Node [192.168.5.5:9200] failed (Connection refused (Connection refused)); no other nodes left – aborting… 17/04/26 15:29:03 INFO HttpMethodDirector: I/O exception (java.net.ConnectException) caught when processing request: Connection refused (Connection refused) 17/04/26 15:29:03 INFO HttpMethodDirector: Retrying request 17/04/26 15:29:03 ERROR NetworkClient: Node [192.168.5.5:9200] […]

Как получить nth до n + ath байт по всем строкам, формируя текстовый файл в * nix?

У меня большой текстовый файл (> 200 МБ). Я хочу читать [n, n + a] байты по всем строкам. Предположим, что в исходном текстовом файле есть 1000 строк. Выходной файл будет 1000 строк. Что я знаю head -c349 original.text|tail -c28 > output.txt . Однако это выводит только одну строку. Как я могу iterate все строки? […]

Awk: как объединить содержимое строк с дублирующимся идентификатором в первом поле

У меня есть файл с двойным значением в первом поле. Файл имеет в общей сложности 4 поля. Я хочу объединить значение оставшихся 3 полей. Входной файл: 123|abc123||GFD 234|xyz456|tsdrf34526|KLD 123||cdft091|GFD 123|abc123|cdft091|GFD 456|sdf872||LHG Желаемый результат: 123|abc123|cdft091|GFD 234|xyz456|tsdrf34526|KLD 456|sdf872||LHG Может ли кто-нибудь помочь?

Linux и Unix - лучшая ОС в мире.