當前位置:成語大全網 - 書法字典 - 八大最佳數據中心開源挖掘工具?

八大最佳數據中心開源挖掘工具?

數據挖掘,又稱數據挖掘和數據挖掘。它是KDD(Knowledge-discovery in databases)中的壹個步驟,是對大量數據進行挖掘和分析並從中提取信息的過程。其中壹些應用包括市場細分-例如識別從特定品牌購買特定產品的客戶的特征,欺詐檢測-識別可能導致在線欺詐的交易模式等等。本文中,長平電腦培訓整理了八款最佳的數據挖掘開源工具。

1、Weka

WEKA作為壹個開放的數據挖掘平臺,在新的交互界面上聚集了大量可以承擔數據挖掘任務的機器學習算法,包括數據預處理、分類、回歸、聚類、關聯規則和可視化。

2、RapidMiner

RapidMiner是世界領先的數據挖掘解決方案,在很大程度上采用了先進的技術。它的數據挖掘任務涉及的範圍很廣,包括各種數據藝術,可以簡化數據挖掘過程的設計和評估。

3、橙色

Orange是壹個基於組件的數據挖掘和機器學習軟件套件。其功能是壹個友好、強大、快速、多功能的可視化編程前端,用於瀏覽數據分析和可視化。Python綁定了腳本開發的基礎。它包含壹系列完整的數據預處理組件,並提供數據核算、轉換、建模、模型評估和探索功能。它采用C++和Python開發,其圖形庫采用跨平臺Qt框架開發。

4、Knime

KNIME(KonstanzInformationMiner)是壹個用戶友好的、智能的和發展良好的開源平臺,用於數據集成、數據處理、數據分析和數據探索。

5、工程

JHepWork是壹套完整的面向對象的科學數據分析框架。Jython宏用於顯示壹維和二維直方圖的數據。該程序包括許多工具,可用於與二維和三維科學圖形進行交互。

6、阿帕奇馬胡特

ApacheMahout是ApacheSoftwareFoundation(ASF)開發的壹個全新的開源項目。它的主要目標是創建壹些可擴展的機器學習算法,供開發者在Apache的許可下自由使用。該項目已經發展到第二年,目前只有壹個公開版本。Mahout包含許多實現,包括聚類、分類、CP和進化程序。此外,通過使用ApacheHadoop庫,Mahout可以有效地擴展到雲中。

埃爾基

elki(index-structures支持的gkdd應用程序開發環境)主要用於聚類和發現離群點。ELKI是壹個類似weka的數據挖掘平臺,用java編寫,有GUI圖形界面。可用於發現異常值。