Tag: текстовая обработка

Изменение символа с другим шаблоном в текстовом файле

У меня есть текстовый файл. Это большой текстовый файл, и этот файл содержит некоторые шаблоны, например: (1), (3), (1,2,3), (1,2,3,4,5,6,7,8,9) …а вот так, (Fig1) (Fig1,Fig2), (Table-1, Table-2) etc. Я хочу, чтобы этот вывод [1], [3], [1,2,3], [1,2,3,4,5,6,7,8,9], (Fig1) (Fig1,Fig2), (Table-1, Table-2) Я имею в виду, что я хочу изменить () на [], который содержит только […]

Вставьте новую строку после разбитой последовательности чисел awk / unix / shell scripting

У меня огромный файл для обработки, и мне не удалось получить именно то, что мне нужно. Обратите внимание, что я не знаю заранее, сколько раз это происходит в одном файле (например, может случиться> 1000 раз на файлы). Ниже приведен мой входной файл (с разделителем TAB), где $ 1 – номер строки. Разбитая последовательность чисел встречается […]

обмен словами с awk вокруг символа / текста ("to")

У меня есть файл, который, например, говорит: Aa Bb C Y… "TO" Bb Cc ZJ >> sd "TO" Dd Ee ZHS DFF "TO" Ff Но я хочу так: Bb "TO" Aa Bb C Y… Dd "TO" Cc ZJ >> sd Ff "TO" Ee ZHS DFF Поэтому я могу поменять тексты на «TO» …

Скрипт сопоставляет буквенный шаблон по нескольким строкам?

У меня есть многострочная строка в переменной $PAT . $PAT необходимо искать в файле $FILE . Если $PAT находится в $FILE , ему необходимо распечатать файл с удаленным $PAT . Если $PAT не найден, то ничего не печатайте. Неизвестно, если $PAT содержит любые специальные символы, и он должен соответствовать буквально. Например, если $PAT является //\/\\|* […]

найти определенную строку и удалить всю структуру

У меня есть вертикальный файл, где каждое слово (токен) находится на отдельной строке в 4 столбцах. Существуют также метаструктуры <doc> , <s> , … Документы выглядят следующим образом: <doc name="sth" url="http"> <p> <s> Here here k1gInSc1 here is be k1gMnPc2 be aa k2eAgMnPc1d1 a sentence sentence k1gMnPc1 sentence <g/> . . kIx. </s> </p> </doc> […]

Полоскать наиболее часто используемые слова из текста

У меня есть простая проблема, но, к сожалению, я не знаю, с чего начать (я только начинаю). Итак, что я хочу сделать, это в конечном итоге увеличить мой словарный запас. У меня появилась идея лишить наиболее часто используемые слова из новостей. Я нашел список из 5000 наиболее часто используемых слов и сохранил его. После того, […]

Как использовать grep для возврата строк с шестнадцатеричным числом в заданном диапазоне?

Если у меня есть, скажите: blah;PC=1234abcd PC=4444bbcd;blah PC=0000abcd;;foo PC=1234abff Как grep для строк с значениями ПК в заданном диапазоне, скажем 1234ab00 до 1234b0ff . Опция – range применима только к регулярному 0-9a-A , который, очевидно, не будет работать для шестнадцатеричных диапазонов.

Grep для поиска шаблона в файле

Я хочу использовать grep для поиска шаблона из одного файла во втором. Мой файл шаблонов выглядит примерно так: K02217 K07448 KO8980 Файл для поиска: >aai:AARI_24510 proP; proline/betaine transporter; K03762 MFS transporter, MHS family, proline/betaine transporter >aai:AARI_26600 ferritin-like protein; K02217 ferritin [EC:1.16.3.1] >aai:AARI_28260 hypothetical protein >aai:AARI_29060 ABC drug resistance transporter, inner membrane subunit; K09686 antibiotic transport […]

Grep один вкладыш для удаления блоков случайного текста

Использование сценария для резервного копирования некоторых маршрутизаторов Cisco и сравнения конфигураций запуска и запуска. Мой результат поврежден некоторыми сертификатами ssl, которые он возвращает – я хочу удалить их. Данный: ********* ERROR running diff on: AVE-1941-LAN config files Code: 0 *************** certificate self-signed 01 | certificate self-signed 01 nvram:IOS-Self-Sig#1.cer 30820253 308201BC A0030201 02020101 300D0609 2A864886 F70D0 […]

удалять только определенные текстовые вхождения из строки с помощью sed

У меня есть текстовый файл, который содержит много строк такого типа: /*[17:51:27][1 ms]*/ UPDATE `country` SET `region_id` = '4' WHERE `country_id` = '36'; Есть ли способ, которым я могу использовать sed для удаления комментариев только , так что это все, что начинается с /* и заканчивается на */ ? Это сделало бы линию: UPDATE `country` […]

Linux и Unix - лучшая ОС в мире.