Tôi có nhiều tệp .fasta (được đặt tên là mã vạch*_consensus.fasta) giống như sau:
>|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCACAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTTGCAGCCAACTCCCATGGTGTGTGACGGG
|>consensus_cl_id_107_total_supporting_reads_6 LN:i:1440 RC:i:6 XC:f:1.000000
GACTTCAGCCCAGTCATTAGTCCTACCATGGACCCCCATATTACTAGAGGAGCTTCCGATATTACTAACTCCCATGCCGTGACGGGCG
|>consensus_cl_id_116_total_supporting_reads_5 LN:i:1314 RC:i:558 XC:f:1.000000
AGAACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCTACCTTCGGGGGAGCGGCGGACGGGTTAGTAACGCGTGGGAATAT
Tôi muốn sao chép/lặp lại mỗi hai dòng n số lần, như được chỉ định sau 'tổng số lần đọc hỗ trợ'. Vì vậy, ví dụ, tôi muốn nhân đôi hai dòng đầu tiên 12 lần, hai dòng thứ hai 6 lần, v.v.
Với awk, tôi đã quản lý để chọn mọi dòng bắt đầu bằng '>' và dòng tiếp theo:
awk '/>/{nr[NR]; nr[NR+1]} NR trong nr' barcode01_consensus.fasta
Nhưng tôi không thể tìm ra cách in số n lần này với một biến.
Bất kỳ sự giúp đỡ nào cũng được đánh giá cao.
Đã cập nhật:
Vì vậy, tôi muốn tập tin cuối cùng trông giống như:
|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCACAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTT
|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCACAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTT
|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCACAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTT
....x 12 lần....