網(wǎng)頁(yè)正文提取工具,
通過(guò)分析騰訊、搜狐、網(wǎng)易、21cn、百度、中國(guó)新聞網(wǎng)、中華網(wǎng)、新浪網(wǎng)這八大網(wǎng)站中的噪音數(shù)據(jù)特點(diǎn)和它所產(chǎn)生的影響,
并利用html的結(jié)構(gòu)特征,提取網(wǎng)頁(yè)正文和圖片,可用于網(wǎng)頁(yè)正文的自動(dòng)提取!正確率可達(dá)90%以上。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版