假如你采集了很多郵箱、淘寶買(mǎi)家?guī)ぬ?hào)、QQ帳號(hào),或其它類似的帳號(hào)、ID等信息,但里面有很多重復(fù)的數(shù)據(jù),手工去除那太慢太煩容易出錯(cuò),這時(shí)候就可以使用重復(fù)數(shù)據(jù)過(guò)濾神器來(lái)過(guò)濾重復(fù)的數(shù)據(jù)。本軟件支持字符串過(guò)濾,也支持對(duì).csv文件直接過(guò)濾。
重復(fù)數(shù)據(jù)過(guò)濾神器功能特點(diǎn)
1、支持多文件批量過(guò)濾,支持多線程過(guò)濾,以列表方式友好顯示每個(gè)文件各自的過(guò)濾進(jìn)度。
2、支持多文件合并過(guò)濾,如果你將數(shù)據(jù)保存在了多個(gè)文件中,不必合并,可以直接對(duì)這幾個(gè)文件進(jìn)行合并及去重復(fù)過(guò)濾,最后保存為一個(gè)無(wú)重復(fù)數(shù)據(jù)的文件。
3、每個(gè)文件過(guò)濾都會(huì)提供過(guò)濾報(bào)告,記錄各個(gè)數(shù)據(jù)的重復(fù)次數(shù),你可以再次按重復(fù)次數(shù)來(lái)篩選數(shù)據(jù)(比如在提取的淘寶交易訂單信息中,如果某個(gè)買(mǎi)家?guī)ぬ?hào)出現(xiàn)的重復(fù)次數(shù)高于某個(gè)值,我們可以認(rèn)為它可能是刷信譽(yù)的買(mǎi)家而非真買(mǎi)家從而再次去除等)。
4、本軟件主要針對(duì)QQ號(hào)、旺旺號(hào)、郵箱、手機(jī)等任何你想去除重復(fù)的字符串?dāng)?shù)據(jù)。
重復(fù)數(shù)據(jù)過(guò)濾神器功能說(shuō)明
1、字符串過(guò)濾
去除重復(fù)字串(只保留一次),過(guò)濾時(shí)一行一個(gè)字符串(字符串如帳號(hào)、ID等)。
將要過(guò)濾的字符串填寫(xiě)到下面的文本框中,每行一個(gè);也可以點(diǎn)擊【導(dǎo)入文本】按鈕從文件導(dǎo)入數(shù)據(jù)(如果導(dǎo)入的數(shù)據(jù)有亂碼,將原文用記事本打開(kāi)并另存,將編碼改為ANSI)。
2、csv文件數(shù)據(jù)過(guò)濾
直接去除csv數(shù)據(jù)中的重復(fù)數(shù)據(jù)。
要對(duì)csv進(jìn)行過(guò)濾時(shí),需要先指定以哪一個(gè)列作為過(guò)濾基準(zhǔn),即,如果不同行中的該列數(shù)據(jù)一樣時(shí),表示二個(gè)行是相同的,那么將只保留最前面的那一行,后面的行將被忽略。設(shè)置好后,選擇過(guò)濾后產(chǎn)生的新文件要保存的位置,點(diǎn)擊“開(kāi)始過(guò)濾”即可完成csv文件的數(shù)據(jù)過(guò)濾。
重復(fù)數(shù)據(jù)過(guò)濾神器更新內(nèi)容
1、字符串過(guò)濾增加行數(shù)顯示,增加過(guò)濾進(jìn)度
2、增加txt文件過(guò)濾,批量多個(gè)文件多線程同時(shí)過(guò)濾,支持各自過(guò)濾進(jìn)度的顯示;增加將多個(gè)txt文件合并過(guò)濾成一個(gè)文件。
3、Csv文件過(guò)濾增加批量多個(gè)文件多線程同時(shí)過(guò)濾,支持各自過(guò)濾進(jìn)度的顯示;增加將多個(gè)csv文件合并過(guò)濾成一個(gè)文件。
4、增加過(guò)濾報(bào)告,顯示重復(fù)數(shù)據(jù)的重復(fù)次數(shù)等。
5、本版開(kāi)始成為共享軟件,未激活也能使用,但有限制:字符串過(guò)濾不得大于1萬(wàn)行,txt、csv文件過(guò)濾時(shí)文件大小不得大于1M,不得同時(shí)過(guò)濾3個(gè)或以上的文件。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版