сравнение строк с awk vs во время чтения строки

У меня есть два файла, один с 17k строк и еще один с 4k строк. Я хотел сравнить позицию 115 с позицией 125 с каждой строкой во втором файле, и если есть совпадение, напишите всю строку из первого файла в новый файл. Я придумал решение, где я читаю файл, используя 'cat $ filename | при чтении LINE '. но это займет около 8 минут. есть ли другой способ, например, использовать awk для сокращения времени процесса.

мой код

cat $filename | while read LINE do #read 115 to 125 and then remove trailing spaces and leading zeroes vid=`echo "$LINE" | cut -c 115-125 | sed 's,^ *,,; s, *$,,' | sed 's/^[0]*//'` exist=0 #match vid with entire line in id.txt exist=`grep -x "$vid" $file_dir/id.txt | wc -l` if [[ $exist -gt 0 ]]; then echo "$LINE" >> $dest_dir/id.txt fi done 

One Solution collect form web for “сравнение строк с awk vs во время чтения строки”

Следующее должно работать, обновляться, чтобы удалить пробел:

 #!/usr/bin/awk -f # NR is the current line number (doesn't reset between files) # FNR is the line number within the current file # So NR == FNR takes only the first file NR == FNR { # Mark the current line as existing, via an associative array. found[$0]=1 # Skip to the next line, so we don't go through the next block next } { # Take the columns we're looking for cols = substr($0,115,11) # Strip whitespace (space and tab) from the beginning (^) and end ($) gsub(/^[ \t]+/,"", cols) gsub(/[ \t]+$/,"", cols) # Check the associative array to see if this was in the first file # If so, print the full line if(found[cols]) print; } 

Поместите его в файл и вызовите один из следующих

 awk -f script.awk patterns.txt full.txt ./script.awk patterns.txt full.txt 
  • использование awk для распаковки файлов в каталоге
  • обратные ссылки в regex `rename`
  • Извлечение данных из текстового файла
  • Shellscript для удаления определенных тегов в файле HTML
  • Как я могу сортировать список с уровнем major.minor.patch и иногда rc правильно?
  • Замените в верхнем регистре на нижний регистр, кроме первой буквы каждого слова в определенной строке
  • Извлечь часть строки, используя grep
  • Как ограничить MAX MIN длиной строки?
  • Источник «gsed: не может читать: нет такого файла или каталога»?
  • Использование sed для замены слов
  • Как заменить строку в файле?
  • Interesting Posts

    Как переключить tty со сценарием / cronjob

    Как отключить ведение журнала wpa_supplicant в syslog

    Обновляется ли dnsmasq при работе в качестве сервера dhcp?

    Проблемы с Antergos MariaDB

    Сортировка списка и отдельных элементов с запятыми вместо строк новой строки

    Как установить файл deb, с помощью dpkg -i или apt?

    Команда Echo с оператором AND не выходит

    Существуют ли какие-либо терминалы linux, которые могут обрабатывать все комбинации клавиш?

    Извлечь подстроку, используя регулярное выражение в файле Unix

    btrfs: ls перечисляет один и тот же файл дважды в каталоге

    записывать все аудиовходы одновременно с iscord

    Movie Player требует дополнительных плагинов для декодирования этого файла

    Абсолютный контроль трекпада от относительного отслеживания

    Попросив свой сценарий принять аргументы, содержащие пробелы

    добавление к удаленному файлу через SSH приводит к линейному расширению

    Linux и Unix - лучшая ОС в мире.