Tôi có một bảng (.tsv) như sau:
s__Methanobrevibacter_smithii k__Archaea p__Euryarchaeota c__Methanobacteria o__Methanobacteriales f__Methanobacteriaceae g__Methanobrevibacter s__Methanobrevibacter_smithii
s__Methanosphaera_stadtmanae k__Archaea p__Euryarchaeota c__Methanobacteria o__Methanobacteriales f__Methanobacteriaceae g__Methanosphaera s__Methanosphaera_stadtmanae
s__Candidatus_Methanomassiliicoccus_intestinalis k__Archaea p__Euryarchaeota c__Thermoplasmata o__Methanomassiliicoccales f__Methanomassiliicoccaceae g__Methanomassiliicoccus s__Candidatus_Methanomassiliicoccus_intestinalis
s__Actinobaculum_sp_oral_taxon_183 k__Vi khuẩn p__Actinobacteria c__Actinobacteria o__Actinomycetales f__Actinomycetaceae g__Actinobaculum s__Actinobaculum_sp_oral_taxon_183
s__Actinomyces_graevenitzii k__Bacteria p__Actinobacteria c__Actinobacteria o__Actinomycetales f__Actinomycetaceae g__Actinomyces s__Actinomyces_graevenitzii
Tôi chỉ muốn giữ lại từ sau dấu gạch dưới thứ ba và xóa mọi thứ khỏi cột đó. Ngoài ra, muốn xóa dấu gạch dưới thứ 4 và mọi thứ sau đó trong cột đầu tiên, giữ nguyên các cột khác. Tôi muốn có được một đầu ra như sau:
s__Methanobrevibacter_smithii k__Archaea p__Euryarchaeota c__Methanobacteria o__Methanobacteriales f__Methanobacteriaceae g__Methanobrevibacter s__smithii
s__Methanosphaera_stadtmanae k__Archaea p__Euryarchaeota c__Methanobacteria o__Methanobacteriales f__Methanobacteriaceae g__Methanosphaera s__stadtmanae
s__Candidatus_Methanomassiliicoccus k__Archaea p__Euryarchaeota c__Thermoplasmata o__Methanomassiliicoccales f__Methanomassiliicoccaceae g__Methanomassiliicoccus s__intestinalis
s__Actinobaculum_sp k__Bacteria p__Actinobacteria c__Actinobacteria o__Actinomycetales f__Actinomycetaceae g__Actinobaculum s__sp
s__Actinomyces_graevenitzii k__Vi khuẩn p__Actinobacteria c__Actinobacteria o__Actinomycetales f__Actinomycetaceae g__Actinomyces s__graevenitzii
Bất cứ ai có thể xin vui lòng giúp tôi làm điều đó?
Cảm ơn nhiều