金石極速網(wǎng)頁(yè)采集器專門采集和訂閱您自已指定的信息源網(wǎng)站,既可以采集指定網(wǎng)頁(yè)上的所有信息,也可以按關(guān)鍵詞匹配采集。您可以指定采集的線程數(shù),找到最高效的采集設(shè)置。
本軟件是市面上唯一一款能實(shí)現(xiàn)通過(guò)自定義欄目和關(guān)鍵詞來(lái)采集打造完全屬于您自已的桌面新聞系統(tǒng),新聞來(lái)源完全由您自行指定,運(yùn)行線程數(shù)也可以自行設(shè)定。軟件會(huì)自動(dòng)過(guò)濾網(wǎng)上的重復(fù)信息,并允許您自行設(shè)置相似度在多少以上的信息不再重復(fù)采集,讓您輕松掌控重要資訊。
金石極速網(wǎng)頁(yè)采集器使用說(shuō)明
系統(tǒng)設(shè)置中的采集選項(xiàng)是為對(duì)軟件的采集行為進(jìn)行個(gè)性化定制,點(diǎn)擊工具欄中的[系統(tǒng)設(shè)置]按鈕進(jìn)去后,界面如下圖:
1.不采集標(biāo)題與已有信息相似度達(dá)XX以上的:軟件會(huì)耗一定時(shí)間比對(duì)每條資訊與前面已采集的資訊相似度是否超過(guò)了該設(shè)定標(biāo)準(zhǔn),超過(guò)標(biāo)準(zhǔn)的視為類同信息,不再重復(fù)采集。當(dāng)該值設(shè)為98以上時(shí),軟件不會(huì)再比對(duì),省下了比對(duì)的時(shí)間,但可能出現(xiàn)類同資訊。因?yàn)楫?dāng)已采集信息量較大時(shí),比對(duì)比較耗時(shí),用戶可酌情選擇。
2.同一資訊匹配上不同關(guān)鍵詞時(shí):可以只采集一條,也可以為不同的關(guān)鍵詞各采集一條。視各人喜好選擇。
3.訂閱采集線程數(shù)和關(guān)鍵詞采集線程數(shù): 您指定幾個(gè)線程系統(tǒng)就會(huì)生成幾個(gè)線程來(lái)采集,提高采集線程數(shù)能加快采集,但如果太高,可能導(dǎo)致系統(tǒng)生成線程有問(wèn)題,反而使采集中斷。建議一般的電腦二者線程數(shù)之和不要超過(guò)20,線程數(shù)為0或負(fù)數(shù),系統(tǒng)將不進(jìn)行該項(xiàng)采集工作。
4.信息時(shí)效:設(shè)置為10天時(shí),軟件將只采集最近10天內(nèi)發(fā)布的有效資訊,并在每一次啟動(dòng)時(shí)自動(dòng)刪除超過(guò)10天的資訊。(注:1天指24小內(nèi)時(shí)的信息,而不是僅指當(dāng)天信息)
5.關(guān)鍵詞匹配方式:可選“精準(zhǔn)匹配”和“模糊匹配”,精準(zhǔn)匹配要求采集的資訊必須包含完整的關(guān)鍵詞,而模糊匹配則允許采集只包含部分關(guān)鍵詞信息的資訊。為了避免采集到無(wú)關(guān)的信息,以設(shè)為精準(zhǔn)匹配比較合適。
6.關(guān)鍵詞匹配范圍:可選“全文匹配”和“標(biāo)題匹配”,對(duì)應(yīng)于關(guān)鍵詞在全文范圍內(nèi)匹配還是僅對(duì)標(biāo)題匹配。
7.使用代理服務(wù)器:軟件允許您使用代理服務(wù)器訪問(wèn)網(wǎng)絡(luò),但您的代理服務(wù)器必須是確?捎玫,可以匿名訪問(wèn)的,否則軟件將不能采集網(wǎng)絡(luò)信息。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版