給大家介紹一款ROST新聞分析工具,采集多個搜索引擎的網(wǎng)頁和新聞,分詞和詞性分析,構建語義網(wǎng)絡,對采集回來的網(wǎng)頁進行統(tǒng)計,存放于MDB庫中,并可自由導出,免費。
功能說明:
采集多個信息源網(wǎng)絡數(shù)據(jù),并格式化保存。
分詞和詞性分析
詞頻統(tǒng)計
詞語過濾
人名、地名、團體機構名提取
構建語義網(wǎng)絡
數(shù)據(jù)可視化分析
特定數(shù)據(jù)來源總體概況
存放于MDB庫中,并可自由導出
軟件操作:
程序運行:程序下載到本地電腦后解壓文件,依次點擊文件ROST NAT→ROST NewsAnalysis Tools.exe
1、查看新聞:鼠標可直接單擊輸出文件文本框打開.txt文檔經(jīng)行瀏覽,或選擇摘要文件、鏈接文件、域名文件瀏覽。
2、詞性識別與詞性統(tǒng)計:對文本文件里的詞進行詞性判斷,如名詞,動詞等;以及統(tǒng)計文本文件里詞語出現(xiàn)的頻率。
3、社會網(wǎng)絡與語義網(wǎng)絡分析:過濾無意義詞組,統(tǒng)計文本文件中的詞出現(xiàn)最多次數(shù),分析每行文字中相關聯(lián)的詞組,用網(wǎng)狀形式展現(xiàn)出他們之間的關系。
4、統(tǒng)計圖:根據(jù)采集到新聞,按時間段統(tǒng)計這段時間新聞條數(shù),統(tǒng)計圖功能只限百度網(wǎng)頁、百度新聞、奇虎論壇使用,其它網(wǎng)站論壇在搜索時無時間顯示,故不能統(tǒng)計。
5、新聞匯總數(shù)據(jù):根據(jù)所輸關鍵詞,自動統(tǒng)計網(wǎng)頁相關結果數(shù)。
6、數(shù)據(jù)庫操作:查詢所搜到的新聞,刪除無用新聞并導出。
親,此軟件需要安裝微軟.net 環(huán)境
微軟.NET Framework 4.0下載地址:http://tipsywinegypsy.com/soft/21724.html
微軟.NET Framework 3.5下載地址:http://tipsywinegypsy.com/soft/18302.html
微軟.NET Framework 2.0下載地址:http://tipsywinegypsy.com/soft/15906.html
- PC官方版
- 安卓官方手機版
- IOS官方手機版