Articles of биоинформатика

Перенаправление совпадений sed в отдельные файлы

У меня есть файл, содержащий список имен последовательностей ДНК и другой, содержащий последовательности ДНК. Они выглядят так: $ cat list.txt seq1 seq3 $ cat sequences.txt >seq1 AAAAA AAAAA >seq2 CCCCC CCCCC CCCCC >seq3 TTTTT Я хочу получить только seq1 и seq2 (перечислены в list.txt) и перенаправить их на отдельные файлы. Как видите, каждая последовательность имеет […]

Как написать доступ к файлу по умолчанию /etc/init.d

Я пытаюсь установить программное обеспечение Proteios в Ubuntu 16. Одним из требований для этого программного обеспечения является (*) Доступ для записи в $ SERVICE_PATH (по умолчанию /etc/init.d) Как мне этого добиться?

извлечь строки, которые соответствуют списку слов в другом файле

У меня есть файл 1, который имеет эти строки: ATM 1434.972183 BMPR2 10762.78192 BMPR2 10762.78192 BMPR2 1469.14535 BMPR2 1469.14535 BMPR2 1738.479639 BMS1 4907.841667 BMS1 4907.841667 BMS1 880.4532628 BMS1 880.4532628 BMS1P17 1249.75 BMS1P17 1249.75 BMS1P17 1606.821429 BMS1P17 1606.821429 BMS1P17 1666.333333 BMS1P17 1666.333333 BMS1P17 2108.460317 BMS1P17 2108 И в файле 2 есть список слов: ATM BMS1 Итак, […]

Соответствует, если столбец частично соответствует другому столбцу

Я пытаюсь сравнить столбцы одного и того же файла. Таблица выглядит так: GA AA GG CC TT CT CT CC TT GG GG AA Я хочу сравнить первый и второй столбцы с остальными и посмотреть, содержат ли они часть первого или второго столбца. Что-то вроде этого: awk ‘$1 == ^$3 || $2 == ^$3 {print […]

удаление строки переменной во многих файлах

У меня есть много файлов, которые содержат похожие строки: >33100_Pseudomonas_etcetera1 texttexttext >33632_Pseudomonas_etcetera2 texttexttext >36406_Pseudomonas_etcetera3 texttexttext и мне нужны такие выводы: >Pseudomomas_etcetera1 texttexttext >Pseudomomas_etcetera2 texttexttext >Pseudomomas_etcetera3 texttexttext Я уверен, что есть простое решение sed, которое я не могу понять, Примечания: Символы всегда состоят из пяти цифр, за которыми следует подчеркивание, за которым следует Pseudomonas_etcetera. Эта строка […]

Добавление дополнительной информации в строку

У меня есть файл GTF, как это: ChrI Coding_transcript gene 8451772 8509212 . – . gene_id “UMM-S589-0.12-gene-1” ChrI Coding_transcript exon 8501974 8509212 . – . gene_id “UMM-S589-0.12-gene-1” ChrI Coding_transcript exon 8491643 8501928 . – 0 gene_id “UMM-S589-0.12-gene-1” Теперь я хочу добавить больше информации в колонку 9, чтобы она выглядела следующим образом: ChrI Coding_transcript exon 8501974 […]

Найдите любую строку в VI, которая имеет что-то кроме ATCG

У меня есть файл геномных данных длиной около 5 миллионов строк, в котором должны быть только символы A, T, C и G. Проблема в том, что я знаю, насколько большим должен быть файл, но он немного больше. Это означает, что что-то пошло не так в анализе, или есть строки, которые содержат что-то кроме геномных данных. […]

Intereting Posts