Tag: текстовая обработка

Почему команда вставки не работает для конкатенации двух столбцов файлов, когда символы более 511?

Я использую команду вставки, чтобы объединить два столбца CSV- файлов. Эти оба файла являются огромным файлом, и когда я запускаю команду вставки, как показано ниже, где запятая (,) является разделителем: paste -d',' file1.csv file2.csv > file3.csv Команда не дает результата paste: line too long Тем не менее, я искал то же самое по Интернету и […]

Самый простой способ переупорядочить столбцы и управлять текстовым файлом

Изучение Linux в школе и работа над управлением текстовыми файлами на данный момент. Если вы ищете несколько ярлыков здесь и там по пути. В настоящее время у меня есть текстовый файл с контентом, например: First Last 111 E. Road New York NY First2 Last2 222 w. Road Newark NJ Мы должны написать сценарий для изменения […]

замена набора персонажей PIPE

У меня есть файл, который разделен тремя ТРУБАМИ (|||). Например, имя ||| url ||| date ||| amount ||| Я пытаюсь сделать 2 вещи вывести конкретный столбец в другом файле, скажем – количество, которое будет разделено в новом файле (это 4-й столбец в файле) замените все 3 трубы запятой, поэтому новые файлы выглядят так: имя, URL, […]

Удалить строки из файла, который существует в другом файле с более новой меткой времени

У меня есть 2 файла в точно таком же формате и те же данные, за исключением 1 колонки. Пример строки файла 1: "1/30/2017 11:14:55 AM",Valid customer,jim.smith,NY,1485771295 Пример строки файла 2: "1/26/2017 8:02:01 PM",Valid customer,jim.smith,NY,1485457321 Конечно, файлы имеют другие строки, но меня интересует следующее: Я хочу удалить из файла 2 все строки, которые относятся к одному […]

Как я могу напечатать нечетные и четные строки в виде столбца с помощью AWK?

У меня есть выход из R, и мне нужно правильно распечатать его. Мне нужно напечатать нечетные и четные строки как соответствующие столбцы. Исходный файл 4 4 4 4 4 -3.592311e+00 -3.360352e+00 -3.063397e+00 -3.660137e+00 8.053911e+00 4 4 4 4 4 1.077868e+01 -2.455155e+00 6.214082e+00 5.311552e+00 5.311552e+00 10 10 10 10 10 -4.394679e+00 -2.527588e+00 7.716434e+00 5.001199e+00 2.653916e+00 10 […]

Как печатать строки, если два поля имеют одинаковые значения?

Я новичок в unix, у меня есть вопрос относительно подмножества данных, я был бы признателен за любую помощь. У меня есть входной файл 23G, содержащий миллионы строк, но я хочу сохранить только те строки, где первый и четвертый столбцы идентичны (имена лесов). вот первые несколько строк моего набора данных: tscaffold94_798049_802097 999 NA tscaffold94_798049_802097 999 NA […]

Идеи для анализа результатов netstat для активных подключений

У меня есть несколько удаленных устройств, которые создают обратные подключения ssh обратно на мой сервер, так что я ssh для них и управляю ими удаленно. Они подключаются ко мне через пользовательский порт. Когда я делаю netstat -an | grep 127.0.0.0.1: netstat -an | grep 127.0.0.0.1: на моем сервере я получаю список устройств, которые в настоящее […]

Извлечь unix-совместимый файл-путь с пространством из вывода команды

команда : du -sh $HOME/* | grep '[0-9]G\>' | sort -k 1rn | head -1 дает мне: 41G /Users/user/Big folder Как я могу извлечь путь для повторного использования в моем сценарии? du -sh $HOME/* | grep '[0-9]G\>' | sort -k 1rn | head -1 | awk '{ print $2 }' Выйдет /Users/user/Big Что непригодно, где […]

Сравните два файла больше, чем значение

У меня есть запрос на предупреждение использования диска каждые 30 минут. Вещь – это последний вывод, который должен проверять старое предупреждение, чтобы избежать повторного отправки такого же предупреждения. #!/bin/bash #export maillist=mailxxx@gmail.com export maillist=mailxxx@gmail.com; #df -PH | grep -vE '^Filesystem|none|cdrom'|awk '{ print $5 " " $6 }' | while read output; df -PH | grep -vE […]

удалить TAG / TAA / TGA

У меня есть файл в указанном ниже формате. Мне нужно удалить стоп-кодоны (TAG / TAA / TGA) все, что соответствует TAG или TAA или TGA. поиск должен быть кратным трем. (например, он должен искать каждые три буквы, и если он найдет стоп-кодоны, их следует отбросить atg ccc tca aga ). Я искал различные формы для […]

Linux и Unix - лучшая ОС в мире.