當前位置:成語大全網 - 新華字典 - fastq 文件處理

fastq 文件處理

2021/03/22

結果是壹個列表,包括此目錄下所有的文件的全稱 及 文件擴展名(.txt,.fasta,.gz等)

循環輸出每壹個文件名

若文件名格式壹致,如為 sample_name.fastq.gz ,可使用 正則表達式 獲取想要的信息

若目標目錄 下不是文件而是文件夾,可循環上壹步獲取所需要文件夾內的內容

隨後可以處理 fastq.gz 文件

f'{sample}'可以填入變量,是形成壹段固定格式的字符串,與 '{0}'.format(sample) 相同,但更簡略壹點

如 fastq.gz 文件

根據上面得到的 .fastq.gz 的絕對路徑,讀成字典

可以根據關鍵的 id 獲取序列

或者 構建壹個字典 統計壹下 fastq.gz 文件中 序列的 數量

若是多個樣本的 fastq.gz 文件

這樣就可以多個樣本壹起統計啦

可是,這樣構建的字典裏面是無序的,怎樣把序列按 數量 排個序呢

對於單個樣本:

實際上變成了 由 壹對鍵值對 組成的元組 組成的 列表

可以根據 每個 元組的 第二位,也就是 數量進行 排序

排列完還是個列表

可以輸出妳想要的前多少個

對於多個樣本,也差不多

簡直壹毛壹樣有沒有