當前位置:成語大全網 - 成語詞典 - 文本分析技術特點是什麽?

文本分析技術特點是什麽?

由於詞意庫是自學習形成,因此不需要預先設置龐大的詞典庫,而且最重要的是,學習是持續性的,系統對詞意的理解會隨著外界的變化而變化,並能不斷增添新創詞匯。 由於同壹個詞,對於不同的人,詞意可能是不同的,因此可以根據每個用戶的習慣形成自己的子詞意庫,可使用子詞意庫對文本進行二次分析,產生個性化結果。 系統的學習分為兩種方式: 知識學習 系統自動在互聯網上進行,無特定目的地吸收網上各種信息,並對收集到的信息進行分析後作為知識保留,整個過程無需人工幹預,可壹天 24 小時不間斷地進行。 經驗學習 每壹次用戶的具體使用,其結果也將作為經驗保留下來,並對知識學習的結果進行修正。分詞技術不追求 100%的準確,而講究實用、快速,不依賴於龐大的詞匯庫或知識庫,因此可以做到不針對特定領域,可解決人名、地名、新出現的詞匯等的分詞,這些問題是傳統分詞方法難以解決的,尤其是新詞匯的分詞,幾乎是壹個世界性的難題。 由於整個核心算法並非基於字、詞典及語法,而是從模仿人類對語言文字的理解入手,比如壹個兒童並不懂得查字典和語法,但能夠聽懂別人說的話,因此對核心只要稍作修改便能夠用於英語及其它文字語言,就好象壹個嬰兒,妳把他放到哪個國家,他就能學會當地的語言。