有壹串dna序列存儲為壹個文件,名為dna.txt。寫壹個python程序,打印出所
破譯的過程其實挺簡單 現在我們知道,DNA的信息儲存是由3連密碼子儲存的,總***四種核苷酸,在DNA裏是A T C G 在RNA裏是A U C G 在轉錄的時候T和U是對等的,所以我們可以把它也看成是壹種核苷酸.它們每三個壹組,通過不同的排列組合方式,表達壹種氨基酸,所以基因鏈可以通過讀取三連密碼子,來進行破譯.在最初破譯三連密碼子的時候,有壹個確定的方向,就是肯定壹定數量的核苷酸的排列組合,對應的壹個氨基酸信息,方向確定之後,接下來的工作就是確定密碼子的數量,也就是說,幾個堿基對應壹個氨基酸,現已知道構成蛋白質的氨基酸***20種,那麽四種堿基不可能壹壹對應,如果是2種堿基排列,則有16種組合,也不夠,那麽接下來就是3種堿基的排列,總***有64種組合,可以完全覆蓋20種氨基酸,如果是4種堿基,則有256種組合,雖然也完全覆蓋了20種氨基酸,但是數量太過懸殊,從壹切節約的生命原則來看,未免信息量過大,會造成信息儲存的傳遞的負擔.所以當初的科學家暫定是3種堿基的組合為壹個密碼子.說實話,這有些運氣的成分.當然,這種運氣是被後來的事實驗證了的.接下來就是確定各種堿基組合分別對應的是哪種氨基酸,這是個繁瑣的工作,其實原理很簡單,就是人工合成壹段DNA,然後用來表達,看這段DNA序列最後合成的是哪種氨基酸.比如 首先要確定的是密碼子“AAA”的信息 那麽我們就合成壹段序列“AAA AAA AAA AAA AAA AAA AAA”將其翻譯成蛋白之後,發現這壹段序列由7個賴氨酸組成,那麽就可以相信,賴氨酸是由三個A編碼的.當然,用64個密碼子表示20種氨基酸,肯定會有重復,這就是密碼子的簡並性,就是會有多個密碼子表示壹個氨基酸,具體就不細說了.