附加數據庫:企業管理器-右鍵單擊“數據庫”-所有任務-選擇您的。附加數據庫的mdf文件名-確定-如果提示您沒有。ldf文件,無論是否創建該文件,請選擇“是”以查詢analyzer中的方法:sp_attach_db“數據庫名稱”以及數據文件和日誌文件。
冗余數據至少會導致以下三種潛在錯誤:
首先,如果壹組DNA或氨基酸序列包含大量非常相關的序列家族,則相應的統計分析將偏向這些家族,並且這些家族的特征將在分析結果中被誇大。
其次,在對數據樣本進行采樣時,序列不同部分之間的顯著相關性可能會有偏差和不正確。
最後,如果將這些數據用於預測,這些序列將使預測方法(如人工智能方法)偏離。因此,過於苛刻地去除“過於相似的序列”可能會導致壹些有價值的信息被刪除,應該在數據大小和無冗余之間找到合理的平衡。