Nano Hash - криптовалюты, майнинг, программирование

Выполнить команду для пары файлов (разные типы файлов) с соответствующей строкой символов

У меня есть список файлов:

catfish.fa
polar.fa
catfish.ids.txt
polar.ids.txt

Я хочу запустить эту команду для каждого файла с соответствующей строкой символов. Так, например, я хотел бы запустить это:

cat catfish.fa | seqkit grep -f catfish.ids.txt > catfish.output.fa

Сходным образом...

cat polar.fa | seqkit grep -f polar.ids.txt > polar.output.fa

Как я могу запустить эту команду для каждой пары файлов в каталоге и параллельно? Спасибо за вашу помощь!

05.01.2019

Ответы:


1

Это будет запускать одно задание на ядро ​​ЦП параллельно:

parallel 'cat {} | seqkit grep -f {.}.ids.txt > {.}.output.fa' ::: *fa

Могу я предложить вам сначала запустить --dry-run, чтобы вы могли видеть, что будет запущено?

parallel --dry-run 'cat {} | seqkit grep -f {.}.ids.txt > {.}.output.fa' ::: *fa

Также рассмотрите возможность потратить 20 минут на чтение глав 1+2 книги GNU Parallel 2018 (распечатать: http://www.lulu.com/shop/ole-tange/gnu-parallel-2018/paperback/product-23558902.html онлайн: https://doi.org/10.5281/zenodo.1146014). Ваша командная строка будет любить вас за это.

05.01.2019
  • Спасибо за ваш отличный ресурс. Когда я попробовал это, терминал просто вернул ›. Я использую macOS, и параллельная команда установлена. 05.01.2019
  • Конец ' отсутствовал. Исправлено. 05.01.2019
  • Да, я продолжал смотреть на него и думал, что ему не хватает '. Спасибо за помощь, ваша книга превосходна. Я потрачу время на его изучение. 05.01.2019

  • 2
    #!/bin/bash
    
    for f in *.fa
    do
       filename="${f%.*}"
       if [ -e ${f}.ids.txt ]
       then
          cat ${f}.fa  | seqkit grep -f ${f}.ids.txt >${f}.output.fa
       fi
    done
    

    filename="${f%.*}" извлекает имя файла без расширения, см. объяснение здесь. Целью if является выделение только файлов, оканчивающихся на .fa, которым соответствует файл .ids.txt. Если вы хотите, чтобы все выполнялось параллельно для каждой пары, добавьте & в конец файла cat ${f}.fa .... (Остерегайтесь генерировать слишком много параллельных задач!)

    05.01.2019

    3

    С помощью расширения параметров в bash:

    for file in *.fa; do seqkit grep -f "${file%%.*}.id.txt" >"${file%%.*}.output.fa" <"$file" & done
    
    05.01.2019
    Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..