首先,確保安裝了所需的庫:
pip安裝pandas openpyxl請求
然後創建壹個名為download_fasta.py的Python腳本並輸入以下代碼:
導入操作系統
進口熊貓作為pd
導入請求
def download _ fasta(URL,輸出文件名):
response = requests . get(URL)
如果響應狀態代碼== 200:
使用open(output _ filename,‘w‘)作為文件:
文件。寫入(響應。文本)
否則:
打印(f“錯誤{response.status_code}:無法下載{url}“)
def main():
excel _ file =‘example . xlsx‘?#您的Excel文件名
URL _ column =‘A‘?URL所在的列
output _ dir =‘fasta _ files‘?#用於下載FASTA文件的文件夾
OS . make dirs(output _ dir,exist_ok=True)
df = PD . read _ excel(excel _ file,engine =‘openpyxl‘,usecols =【URL _ column】)
對於索引,df.iterrows()中的行:
url =行【0】
output _ filename = OS . path . join(output _ dir,f‘fasta _ { index+1 })。fasta’)
下載_ fasta(URL,輸出_文件名)
打印(f“下載{url}到{輸出文件名}“)
if __name__ == "__main__ ":
主()
確保用您的Excel文件名替換example.xlsx,並用相應的列名替換URL所在的列。該腳本將創建壹個名為FASTA_files的文件夾,並將從每個網站下載的FASTA文件保存為fasta_1.fasta、fasta_2.fasta等。
運行腳本:
python download_fasta.py
該腳本將自動讀取Excel表中的網址,從每個網址下載FASTA文件,並將其保存在fasta_files文件夾中。請註意,該腳本假設所有URL都是有效的FASTA文件鏈接,因此在實際使用中可能需要根據您的需求進行調整。