2021/03/22
結果是壹個列表,包括此目錄下所有的文件的全稱 及 文件擴展名(.txt,.fasta,.gz等)
循環輸出每壹個文件名
若文件名格式壹致,如為 sample_name.fastq.gz ,可使用 正則表達式 獲取想要的信息
若目標目錄 下不是文件而是文件夾,可循環上壹步獲取所需要文件夾內的內容
隨後可以處理 fastq.gz 文件
f'{sample}'可以填入變量,是形成壹段固定格式的字符串,與 '{0}'.format(sample) 相同,但更簡略壹點
如 fastq.gz 文件
根據上面得到的 .fastq.gz 的絕對路徑,讀成字典
可以根據關鍵的 id 獲取序列
或者 構建壹個字典 統計壹下 fastq.gz 文件中 序列的 數量
若是多個樣本的 fastq.gz 文件
這樣就可以多個樣本壹起統計啦
可是,這樣構建的字典裏面是無序的,怎樣把序列按 數量 排個序呢
對於單個樣本:
實際上變成了 由 壹對鍵值對 組成的元組 組成的 列表
可以根據 每個 元組的 第二位,也就是 數量進行 排序
排列完還是個列表
可以輸出妳想要的前多少個
對於多個樣本,也差不多
簡直壹毛壹樣有沒有