東坡下載:內(nèi)容最豐富最安全的下載站!

首頁IT技術(shù)軟件教程 → Linux下快速比較兩個(gè)目錄的不同

Linux下快速比較兩個(gè)目錄的不同

相關(guān)文章發(fā)表評(píng)論 來源:本站整理時(shí)間:2018/5/31 11:22:35字體大。A-A+

更多

作者:專題點(diǎn)擊:56次評(píng)論:0次標(biāo)簽: Linux

曾多次想要在Linux下比較目錄a和目錄b中文件列表的差別,然后對(duì)目錄a比目錄b中多出的文件、少掉的文件分別做處理。但是,在網(wǎng)上搜索了多次也都沒找到能直接處理好的工具。

所以想了很多不少方法,自我感覺都不錯(cuò),而且網(wǎng)上似乎沒有這方面的文章,所以分享出來給大家。如果各位有更好的工具或者方法,盼請留下說明(本文第2部分:圖形化的比較結(jié)果搜集自網(wǎng)上,我也沒有在圖形化界面下操作的需要,所以沒有多做介紹)

以下是本文有些地方涉及到的目錄結(jié)構(gòu)。

[root@node1 ~]# tree directory1 directory2directory1├── 1.png├── 2.png└── 3.pngdirectory2├── 2.png├── 3.png└── 4.png

1.命令行輸出的結(jié)果

方法一:使用diff

diff -r directory1 directory2

但是diff會(huì)對(duì)每個(gè)文件中的每一行都做比較,所以文件較多或者文件較大的時(shí)候會(huì)非常慢。請謹(jǐn)慎使用。

方法二:使用diff結(jié)合tree

diff <(tree -Ci --noreport /mnt/f/自然馬) <(tree -Ci --noreport /mnt/i/自然馬) < /mnt/f/自然馬---> /mnt/i/自然馬87a88 > xyz.avi488d488 < rsync.txt534d533 < 542D0.mp4

說明:

tree的-C選項(xiàng)是輸出顏色,如果只是看一下目錄的不同,可以使用該選項(xiàng),但在結(jié)合其他命令使用的時(shí)候建議不要使用該選項(xiàng),因?yàn)轭伾矔?huì)轉(zhuǎn)換為對(duì)應(yīng)的編碼而輸出;

-i是不縮進(jìn),建議不要省略-i,否則diff的結(jié)果很難看,也不好繼續(xù)后續(xù)的文件操作;

--noreport是不輸出報(bào)告結(jié)果,建議不要省略該選項(xiàng)。

該方法效率很高。

方法三:find結(jié)合diff

find directory1 -printf "%P\n" | sort > file1 find directory2 -printf "%P\n" | sort | diff file1 -2d1 < 1.png4a4 > 4.png

說明:

<代表的行是directory1中有而directory2沒有的文件,>則相反,是directory2中有而directory1中沒有。

不要省略-printf "%P\n",此處的%P表示find的結(jié)果中去掉前綴路徑,詳細(xì)內(nèi)容man find。例如,find /root/ -printf "%P\n"的結(jié)果中將顯示/root/a/xyz.txt中去掉/root/后的結(jié)果:a/xyz.txt。

效率很高,輸出也簡潔。

如果不想使用-printf,那么先進(jìn)入各目錄再find也行。

[root@node1 ~]# (cd /root/a;find . | sort >/tmp/file1)       [root@node1 ~]# (cd /root/b;find . | sort | diff /tmp/file1 -)2d1 < ./1.png4a4 > ./4.png

上面將命令放進(jìn)括號(hào)中執(zhí)行是為了在子shell中切換目錄,不用影響當(dāng)前所在目錄。

方法四:使用rsync

rsync -rvn --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'deleting a/xyz.avi rsync.txt 新建文件夾/542D0.mp4

其中deleting所在的行就是directory2中多出的文件。其他的都是directory中多出的文件。

如果想?yún)^(qū)分出不同的是目錄還是文件?梢约由"-i"選項(xiàng)。

rsync -rvn -i --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}'*deleting   a/xyz.avi >f+++++++++ rsync.txt >f+++++++++ 新建文件夾/542D0.mp4

其中>f+++++++++中的f代表的是文件,d代表的目錄。

上面的rsync比較目錄有幾點(diǎn)要說明:

一定不能缺少-n選項(xiàng),它表示dry run,也就是試著進(jìn)行rsync同步,但不會(huì)真的同步。

第一個(gè)目錄(directory1/)后一定不能缺少斜線,否則表示將directory1整個(gè)目錄同步到directory2目錄下。

其它選項(xiàng),如"-r -v --delete"也都不能缺少,它們的意義想必都知道。

sed的作用是過濾掉和文件不相關(guān)的內(nèi)容。

以上rsync假定了比較的兩個(gè)目錄中只有普通文件和目錄,沒有軟鏈接、塊設(shè)備等特殊文件。如果有,請考慮加上對(duì)應(yīng)的選項(xiàng)或者使用-a替代-r,否則結(jié)果中將出現(xiàn)skipping non-regular file的提示。但請注意,如果有軟鏈接,且加了對(duì)應(yīng)選項(xiàng)(-l或-a或其他相關(guān)選項(xiàng)),則可能會(huì)出現(xiàn)fileA-->fileB的輸出。

效率很高,因?yàn)閞sync的原因,篩選的可定制性也非常強(qiáng)。

2.圖形化的比較結(jié)果

方法一:使用vimdiff

vimdiff <(cd directory1; find . | sort) <(cd directory2; find . | sort)# 或者vimdiff <(find directory1 -printf "%P\n"| sort) <(find directory2 -printf "%P\n"| sort)

方法二:使用meld

meld是python寫的一個(gè)圖形化文件/目錄比較工具,所以必須先安裝圖形界面或設(shè)置好圖形界面接受協(xié)議。它的功能非常豐富,和win下的beyond compare有異曲同工之妙。

meld具體的使用方式就不介紹了。

3.將兩目錄中不同的文件篩選出來

個(gè)人建議使用命令行輸出的結(jié)果中的方法方法三和方法四,因?yàn)樗鼈兌寄芎芎玫乇A裟夸浨熬Y。

以方法三為例:

find directory1 -printf "%P\n" | sort > file1 find directory2 -printf "%P\n" | sort | diff file1 -

以下是實(shí)驗(yàn)所需目錄結(jié)構(gòu):

[root@node1 ~]# tree /root/a;tree /root/b /root/a ├── 1.png ├── 2.png └── 3.png0 directories, 3 files /root/b ├── 2.png ├── 3.png ├── 4.png └── xen    └── scripts        └── block-drbd

首先比較這兩個(gè)目錄得到文件列表的差異。

find /root/a -printf "%P\n" | sort > /tmp/file1 find /root/b -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt

然后從diff.txt中過濾出/root/a中多出的文件和/root/b中多出的文件。

# /root/a中多出的文件awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt /tmp/etc/1.png# /root/b中多出的文件awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt /tmp/etc/4.png /tmp/etc/xen /tmp/etc/xen/scripts /tmp/etc/xen/scripts/block-drbd

需要注意的是,如果多了某個(gè)目錄,則這個(gè)目錄和其內(nèi)所有文件都會(huì)列出來。如果要將多出的文件復(fù)制到其他地方,應(yīng)當(dāng)要注意這一點(diǎn)。

如果只想要比較出/root/a和/root/b下的文件和目錄的不同,不再遞歸到子目錄中比較。那么可以在find上繼續(xù)加工一番:

find /root/a -maxdepth 1 -printf "%P\n" | sort > /tmp/file1 find /root/b -maxdepth 1 -printf "%P\n" | sort | diff /tmp/file1 - >diff.txt# /root/a中多出的文件awk '/</{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt /tmp/etc/1.png# /root/b中多出的文件awk '/>/{printf("%s%s\n","/tmp/etc/",$2)}' diff.txt /tmp/etc/4.png /tmp/etc/xen

這樣一來,/root/b中多出的文件就是4.png和xen,xen目錄中的文件不再列出。

擴(kuò)展知識(shí)

相關(guān)評(píng)論

閱讀本文后您有什么感想? 已有 人給出評(píng)價(jià)!

  • 2791 喜歡喜歡
  • 2101 頂
  • 800 難過難過
  • 1219 囧
  • 4049 圍觀圍觀
  • 5602 無聊無聊
熱門評(píng)論
最新評(píng)論
發(fā)表評(píng)論 查看所有評(píng)論(0)
昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過審核才能顯示)