數據庫設計中,要盡可能降低數據冗余,達到數據的簡潔,易用
為了達到最低冗余,在設計中進行模式的規範化,壹般達到BC範式的情況下,就可以大幅度第降低數據冗余。
數據冗余決不能完全消除,除非只有壹個表。
3、如何解決數據冗余的問題
數據冗余或者信息冗余是生產、生活所必然存在的行為,沒有好與不好的總體傾向。
數據的應用中為了某種目的采取數據冗余方式。
1、重復存儲或傳輸數據以防止數據的丟失。
2、對數據進行冗余性的編碼來防止數據的丟失、錯誤,並提供對錯誤數據進行反變換得到原始數據的功能。
3、為簡化流程所造成額數據冗余。例如向多個目的發送同樣的信息、在多個地點存放同樣的信息,而不對數據進行分析而減少工作量。
4、為加快處理過程而將同壹數據在不同地點存放。例如並行處理同壹信息的不同內容,或用不同方法處理同壹信息等。
5、為方便處理而使同壹信息在不同地點有不同的表現形式。例如壹本書的不同語言的版本。
6、大量數據的索引,壹般在數據庫中經常使用。其目的類似第4點。
7、方法類的信息冗余:比如每個司機都要記住同壹城市的基本交通信息;大量個人電腦都安裝類似的操作系統或軟件。
8、為了完備性而配備的冗余數據。例如字典裏的字很多,但我們只查詢其中很少的壹些字。軟件功能很多,但我們只使用其中壹部分。
9、規則性的冗余。根據法律、制度、規則等約束進行的。例如合同中大量的模式化的內容。
10、為達到其他目的所進行的冗余。例如重復信息以達到被重視等等。
4、如何刪除數據庫中的冗余數據
刪除所有大於妳
設置有數的冗余組
DELETE
FROM Customers
WHERE ID IN
(SELECT ID
FROM
(SELECT ID, LastName, FirstName,
RANK() OVER (PARTITION BY LastName,
FirstName ORDER BY ID) AS SeqNumber
FROM
(SELECT ID, LastName, FirstName
FROM Customers
WHERE (LastName, FirstName) IN
(SELECT LastName, FirstName
FROM Customers
GROUP BY LastName, FirstName
HAVING COUNT(*) > 3)))
WHERE SeqNumber > 3);
As you can see, using the RANK() function allows you to eliminate duplicates in a
single SQL statement and gives you more capabilities by extending the power of
your
queries.
正如妳所見使用Rank()可以消除冗余數據而且能給妳很大的可伸展性
5、神經網絡用於風險,輸入什麽?輸出什麽? 15
神經網絡和粗集理論是智能信息處理的兩種重要的方法,其任務是從大量觀察和實驗數據中獲取知識、表達知識和推理決策規則。粗集理論是基於不可分辯性思想和知識簡化方法,從數據中推理邏輯規則,適合於數據簡化、數據相關性查找、發現數據模式、從數據中提取規則等。神經網絡是利用非線性映射的思想和並行處理方法,用神經網絡本身的結構表達輸入與輸出關聯知識的隱函數編碼,具有較強的並行處理、逼近和分類能力。在處理不準確、不完整的知識方面,粗集理論和神經網絡都顯示出較強的適應能力,然而兩者處理信息的方法是不同的,粗集方法模擬人類的抽象邏輯思維,神經網絡方法模擬形象直覺思維,具有很強的互補性。
首先,通過粗集理論方法減少信息表達的屬性數量,去掉冗余信息,使訓練集簡化,減少神經網絡系統的復雜性和訓練時間;其次利用神經網絡優良的並行處理、逼近和分類能力來處理風險預警這類非線性問題,具有較強的容錯能力;再次,粗集理論在簡化知識的同時,很容易推理出決策規則,因而可以作為後續使用中的信息識別規則,將粗集得到的結果與神經網絡得到的結果相比較,以便相互驗證;最後,粗集理論的方法和結果簡單易懂,而且以規則的形式給出,通過與神經網絡結合,使神經網絡也具有壹定的解釋能力。因此,粗集理論與神經網絡融合方法具有許多優點,非常適合處理諸如企業戰略風險預警這類非結構化、非線性的復雜問題。
關於輸入的問題--輸入模塊。
這壹階段包括初始指標體系確定,根據所確定的指標體系而形成的數據采集系統及數據預處理。企業戰略風險的初始評價指標如下:
企業外部因素:政治環境(法律法規及其穩定性),經濟環境(社會總體收入水平,物價水平,經濟增長率),產業結構(進入產業障礙,競爭對手數量及集中程度),市場環境(市場大小)。
企業內部因素:企業盈利能力(銷售利潤率,企業利潤增長率),產品競爭能力(產品銷售率,市場占有率),技術開發能力(技術開發費比率,企業專業技術人才比重),資金籌措能力(融資率),企業職工凝聚力(企業員工流動率),管理人才資源,信息資源;戰略本身的風險因素(戰略目標,戰略重點,戰略措施,戰略方針)。
本文所建立的預警指標系統是針對普遍意義上的企業,當該指標系統運用於實際企業時,需要對具體指標進行適當的增加或減少。因為各個企業有其具體的戰略目標、經營活動等特性。
計算處理模塊。這壹模塊主要包括粗集處理部分和神經網絡處理部分。
粗集處理階段。根據粗集的簡化規則及決策規則對數據進行約簡,構造神經網絡的初始結構,便於神經網絡的訓練。
企業戰略風險分析需要解決的問題是在保證對戰略風險狀態評價壹致的情況下,選擇最少的特征集,以便減少屬性維數、降低計算工作量和減少不確定因素的影響,粗集理論中的屬性約簡算法可以很好地解決這個問題。
然後是輸出模塊~
該模塊是對將發生的戰略風險問題發出警報。
按照戰略風險大小強弱程度的不同,可將其分為三個層次。第壹層次是輕微戰略風險,是損失較小、後果不甚明顯,對企業的戰略管理活動不構成重要影響的各類風險。這類風險壹般情況下無礙大局,僅對企業形成局部和微小的傷害。第二層次是壹般戰略風險,是損失適中、後果明顯但不構成致命性威脅的各類風險。這類風險的直接後果使企業遭受壹定損失,並對其戰略管理的某些方面帶來較大的不利影響或留有壹定後遺癥。第三層次是致命性戰略風險,指損失較大,後果嚴重的風險。這類風險的直接後果往往會威脅企業的生存,導致重大損失,使之壹時不能恢復或遭受破產。在實際操作中,每個企業應根據具體的狀況,將這三個層次以具體的數值表現出來。
下面回答妳的問題:
總的來說,神經網絡輸入的是初始指標體系;輸出的是風險。
妳所說的風險應該說屬於輸出範疇,具體等級分為三級:無警、輕警、重警,並用綠、黃、紅三種顏色燈號表示。其中綠燈區表示企業綜合指標所反映的實際運行值與目標值基本壹致,運行良好;黃燈區表示企業綜合指標所反映的實際運行值與目標值偏離較大,要引起企業的警惕。若采取壹定的措施可轉為綠燈區,若不重視可在短期內轉為紅燈區;紅燈區則表示這種偏離超過企業接受的可能,並給企業帶來整體性的重大損失。例如:銷售利潤率極低、資產負債率過高,資源配置不合理、缺乏發展後勁等,必須找出原因,繼而采取有效措施,使企業的戰略管理活動始終處於“安全”的狀態。