構建進化樹的過程包括:
分子系統發育分析:* *是壹種用於研究物種或序列的進化和系統分類的方法。壹般的研究對象是堿基序列或氨基酸序列,通過數理統計算法計算生物之間的進化關系。最後,根據計算結果,將其可視化為系統進化樹。
我們模擬了壹個項目,用兩個人的基因和兩個老鼠的基因構建了壹個系統進化樹。結果如下:
如妳所見,上面有壹堆標簽。讓我們看看它們是什麽意思:
所有分支的同壹個祖先稱為根。
根據根源可分為:
有根的樹:上圖是有根的樹,從中可以找到相同的祖先。
無根之樹:顧名思義,沒有根,就找不到相同的祖先。例如,直樹將在後面提到
每個節點代表壹個分類單元,可以是屬、種群等。在物種和基因家族、同源物等方面。
然而,還有另壹種解釋:
這種解釋將節點分為外部節點和內部節點:
外部節點也稱為葉節點,即最外面的人類基因1、人類基因2等。,代表分析中涉及的序列樣本。
我們使用藍色標簽的內部節點代表假設的祖先。
也稱為分支,是指由兩個或多個生物或序列組成的進化關系。
妳可以用這個來看同源性。例如,上圖中的人類基因1和人類基因2可能是旁系同源基因,而人類基因1和小鼠基因1可能是直向同源基因。
與分析序列相關的生物序列,但具有遠緣遺傳關系。
也被稱為遺傳變異,進化距離。壹般會標註在分支線上,代表進化分支的變化程度。支線越短,差異越小,進化距離越近。例如人類基因1與人類基因2的遺傳變異為0.21+0.22=0.43。遺傳變異實際上代表了基因組序列中每個位點的堿基替換頻率,計算方法很簡單:變異=突變堿基數/總堿基數(%)。我們常用的形式通常表示為0-1的小數,代表100個堿基位點的變化。
從水平分支和長度可以看出,進化譜系隨時間而變化,進化分支越長,分支對應的物種或基因的變化越大。例如,對應上圖,我們可以描述人類基因1在進化時間上早於其他基因,而小鼠基因2在進化時間上最晚。
有趣的是,根據基因序列相似性和進化時間的假設,通過轉換這種進化距離可以獲得分子鐘。例如,它可以用來分析病毒的進化樹,甚至推斷第壹代病毒產生的時間點。
生物或序列之間差值的單位長度相當於進化樹的規模。
它通常標記在節點上,以評估分支機構的可信度。
Bootstrap值對於我們的後續分析非常重要,尤其是在系統進化樹的評估中。
Bootstrap通常用於測試系統發育樹評估。
自舉測試,Bootstrap test,又稱自我發展和自助法。實際上,這是壹種放回抽樣統計方法。通過重復采樣數據集,構建多個進化樹來檢查給定樹的分支可靠性。
然後在構建樹時設置重復采樣的次數。現在壹般文章要求Bootstrap采樣值》;1000。
雖然根據嚴格的統計學概念,自膨脹值需要大於95%才更可信。
然而在實際應用中,我們壹般認為壹個節點的自舉值》:70,這個分支是可靠的。特別是在微生物等相似度較大的分類中,當大於50%時通常被認為是可信的(小於50%將不顯示)。
如果低自舉值更接近分支的末端,則意味著相似性太高而無法區分。
如果低自舉值更接近根,則意味著相似性太低。
優點是顯而易見的,即它可以清晰地顯示樣本之間的進化距離和進化分支。缺點是效果不刺眼。
有時它可以這樣顯示,這樣相對更酷:
直樹
更酷壹點:
彎曲樹
本質上,樹形圖是極坐標圖。這種圖可以說是進化樹最耀眼的展示,在分析樣本數量較多時更有效。然而,致命的缺點是可讀性差,例如,很難橫向比較進化距離。因此,它適用於展示不同的物種或基因樣品。
這種圖用於構建根不確定的進化樹。它可以對具有高相似性的樣本序列進行聚類。因此,它更適用於親緣關系較近的物種或差異較小的基因樣本。