Tag: текстовая обработка

Как вставить пробел каждые четыре символа в длинной строке?

У меня длинная строка, в которую я хочу вставить пробел каждые 4 символа, на одной одиночной строке сплошного текста, чтобы было легче читать, что это самый простой способ сделать это? также я должен иметь возможность вводить линию из трубы. например echo "foobarbazblargblurg" | <some command here> дает foob arba zbla rgbl urg

Удалить пробел для набора строк в редакторе Vim

У меня есть следующий текст в файле: sample text some random text even more random text text with no indent worst indention Мне нужно удалить пустое пространство перед каждой строкой. Для одной строки я делаю 0dw Я могу повторить ту же команду, используя. а путем ручной навигации к следующим строкам. Но есть ли способ применить […]

Мне нужно найти все домашние каталоги пользователей, перечисленные с помощью grep из / etc / passwd

У меня есть вопрос, похожий на другой на этом сайте, где человеку приходилось находить список всех пользователей, использующих grep или awk из / etc / passwd. Это сработало для меня, но я попытался перевести его, чтобы найти и перечислить их домашние каталоги. Я уже знаю, что вы не можете сделать это в одной строке, поэтому […]

Групповая команда uniq?

Я ищу команду для получения из файла в этом формате: hello 32 hello 67 hi 2 ho 1212 ho 1390 ho 3000 В этот формат (дедуплицировать, взяв последнюю строку «группы»): hello 67 hi 2 ho 3000 На данный момент я использую фрагмент Python и pandas: df = pd.read_csv(self.input().path, sep='\t', names=('id', 'val')) # how to replace […]

Как найти повторяющиеся строки в текстовом файле, в то время как некоторые могут быть прокомментированы или иметь разные токены в начале?

У меня есть текстовый файл с линиями, которые представляют собой смесь следующим образом: ### Comments # Comments 86.242.200.81 banana.domain.net # comment 86.242.200.3 orange.domain.net 31.28.225.81 monkey.anotherdomain.net 51.18.33.4 puffin.domainz.com #31.28.220.80 monkey.anotherdomain.net # comment 86.242.201.3 orange.domain.net Как найти дубликаты host.domain? В этом случае есть два: monkey.anotherdomain.net и orange.domain.net Принимая во внимание, что .. Отслеживание комментариев после ввода необходимо […]

Как подсчитать дублированные последние столбцы, не удаляя их?

У меня есть файл, который содержит 4 столбца. Я хочу сравнить последние три столбца и подсчитать, сколько раз они происходят, не удаляя ни одну из строк. Я просто хочу, чтобы граф присутствовал перед каждой строкой. Мой файл выглядит следующим образом: ID-jacob 4.0 6.0 42.0 ID-elsa 5.0 8.0 45.0 ID-fred 4.0 6.0 42.0 ID-gerard 6.0 8.0 […]

Почему использование цикла оболочки для обработки текста считается плохой практикой?

Использует ли цикл while для обработки текста, который обычно считается плохой практикой в ​​оболочках POSIX? Как отметил Стефан Хазелас , некоторые из причин, почему не используется оболочка оболочки, являются концептуальными , надежными , четкими , эффективными и безопасными . Этот ответ объясняет аспекты надежности и четкости : while IFS= read -r line <&3; do printf […]

Как обрабатывать текстовый файл с несколькими столбцами для получения другого текстового файла с несколькими столбцами?

У меня есть текстовый файл: a aa aaa b bb bbb c cc ccc d dd ddd e ee eee f ff fff g gg ggg h hh hhh i ii iii j jj jjj Как я могу обработать его и получить файл с двумя столбцами, например: a aa aaa b bb bbb c cc […]

Используя «grep», чтобы найти строки, содержащие все три указанных символа в любом порядке

У нас есть документ, содержащий строки, и мы должны найти, если [a | b | c] появляется по крайней мере один раз в каждой строке независимо от того, какой порядок. Например: Входные данные: abc bca cab hhfdhdhfabjfdjdjff acjfdjdfjdf fhfhfhfabcjdfjdjfk ahfhfbkjfjdjffc Желаемый результат (четвертая строка отсутствует, поскольку она содержит только a и b но нет c […]

Насколько разумны утилиты unix?

Утилиты Unix, такие как sort, find, grep, diff и др., Очень удобны для выполнения быстрых задач, иногда без написания кода вообще. Я хотел знать, какие алгоритмы они используют внутри себя и как разумно решить конкретный алгоритм для конкретной задачи? Например, если сортировка получает огромный входной файл, будет ли он использовать разные алгоритмы для разных размеров […]

Linux и Unix - лучшая ОС в мире.