WEKA的本地非Java版本主要用於分析農業領域的數據。這個工具基於Java。
版本非常復雜,應用於許多不同的應用程序,包括數據分析和可視化以及預測建模算法。與RapidMiner相比,優點是它在GNU中。
它在通用公共許可證下是免費的,因為用戶可以根據自己的喜好選擇定制它。
WEKA支持各種標準的數據挖掘任務,包括數據預處理、收集、分類、回歸分析、可視化和特征選擇。添加序列建模後,WEKA將變得更加強大,但目前不包括在內。
2、快速采礦機
該工具用Java語言編寫,通過基於模板的框架提供高級分析技術。這個工具最大的優點是用戶無需編寫任何代碼。它是作為服務提供的,而不是作為本地軟件。值得壹提的是,該工具在數據挖掘工具排行榜中排名第壹。
此外,除了數據挖掘之外,RapidMiner還提供了數據預處理和可視化、預測分析和統計建模、評估和部署等功能。更重要的是,它還提供了來自WEKA(壹種智能分析環境)和R腳本的學習方案、模型和算法。
RapidMiner是在AGPL開源許可下發布的,可以從SourceForge下載。SourceForge是開發者開發和管理的集中場所,大量開源項目落戶於此,包括維基百科使用的MediaWiki。
3、NLTK
說到語言處理任務,沒有什麽能打敗NLTK。NLTK提供了壹種語言處理工具,包括數據挖掘、機器學習、數據捕獲、情感分析和其他語言處理任務。
妳只需要安裝NLTK,然後將壹個包拖到妳最喜歡的任務中,就可以做其他事情了。因為它是用Python語言編寫的,所以您可以在其上構建應用程序並自定義其小任務。
4、橙色
Python之所以受歡迎,是因為它簡單易學且功能強大。如果妳是壹名Python開發人員,當談到尋找工作工具時,沒有什麽比Orange更好的了。它是壹個基於Python語言的強大的開源工具,適合初學者和專家神。
此外,您肯定會喜歡這個工具的可視化編程和Python腳本。它不僅有機器學習的組件,還有生物信息和文本挖掘,可以說充滿了數據分析的各種功能。
5、KNIME
數據處理有三個主要部分:提取、轉換和加載。而KNIME可以做到這三點。KNIME
為您提供用於處理數據節點的圖形用戶界面。它是壹個用於數據分析、報告和綜合的開源平臺,還通過其模塊化數據的精簡概念集成了各種計算機。
機器學習和數據挖掘的組成部分已經引起了商業智能和金融數據分析的關註。
KNIME基於Eclipse,用Java編寫,易於擴展和補充插件。它的附加功能可以隨時添加,並且大量數據集成模塊已包含在核心版本中。
6、R-編程
如果我告訴妳R項目,壹個GNU項目,是由R(簡稱R-programming)自己編寫的,妳會怎麽想?它主要由c。
c語言和FORTRAN語言,並且許多模塊是由R編寫的,R是壹種用於編程語言和軟件環境的統計計算和繪圖的免費軟件。
r語言廣泛應用於數據挖掘、統計軟件開發和數據分析。近年來,易用性和可擴展性也大大提高了R的受歡迎程度。除了數據之外,它還提供統計和映射技術,包括線性和非線性建模、經典統計測試、時間序列分析、分類、收集等。