在韓國李世石與谷哥阿爾法狗(alphago)對戰(zhàn)三連敗后,終于在第四局中扳回一城,那知他們究竟是個什么樣的棋局呢?東坡小編帶來了李世石alphago人機大戰(zhàn)第四局棋譜完整版下載,想看李世石是怎樣贏alphago的趕緊看看吧!
李世石alphago人機大戰(zhàn)第四局賽況
第四局比賽中,AlphaGo執(zhí)黑先手,李世石執(zhí)白。開局階段雙方就形成星小目對星小目的局面,但之后李世石會并未走出模仿棋,而是打出了自己的風格。
和前幾局對決相比,李世石今天更多次陷入“長考”,導致耗時太多,在比賽進行到2個半小時后,李世石僅剩下17分鐘,比AlphGo剩余時間足足少了1個小時。
隨后,李世石白78挖,下出一招妙手,成為本場比賽的轉(zhuǎn)折點。AlphaGo黑93立,下出一步常理上的廢棋,令所有人大惑不解。現(xiàn)場英文解說員麥克雷蒙九段表示,AlphaGo后面跟的這步一下子把局面弄復(fù)雜了。
李世石alphago人機大戰(zhàn)第四局結(jié)局
雖然AlphaGo出現(xiàn)了一次“bug”,但李世石仍然不敢松懈,在打吃右側(cè)黑子時還是非常謹慎。在比賽進行到3小時20分鐘時。李世石計時全部用完,進入讀秒落子階段。
此后Alpha由于判斷局面對自己不利,每步耗時明顯增長,都超出了3分鐘。到3小時40分鐘時,比賽大局已定,AlphaGo(白)投子認輸只剩時間問題,李世石只需要冷靜收官即可獲得勝利。
收官階段,左下角AlphaGo黑159扳再次出現(xiàn)漏洞,黑子沒有繼續(xù)在此處落子,而是到左邊立,導致上一步棋成為“無用功”。
最終,李世石在收官階段發(fā)揮穩(wěn)定,沒有讓AlphaGo占到便宜。李世石獲得對AlphaGo的第一場勝利,雙方總比分變?yōu)?:1。
李世石第四局賽后說:
在賽后的記者招待會上,李世石談到了AlphaGo的兩個弱點:一個是AlphaGo執(zhí)黑棋時似乎掙扎比較多,相較執(zhí)白棋時更難贏。另一個是,當它遇到出其不意的招數(shù)時,有可能會導致失誤,未必是失誤,就是bug。
谷歌阿爾法狗(alphago)為什么會贏
舉世矚目的“阿爾法狗”和李世石對戰(zhàn),并不是歷史上第一次人機對戰(zhàn)的棋類運動。1997年,IBM的“深藍”戰(zhàn)勝了俄羅斯國際象棋大師卡斯帕羅夫。當時,“深藍”2勝1負3平的戰(zhàn)績讓卡斯帕羅夫深受打擊。后來,IBM還拒絕了卡斯帕羅夫的再戰(zhàn)請求,拆卸了“深藍”,讓給他至今無法找“深藍”復(fù)仇。
卡斯帕羅夫的遺憾并不無理由——今天,“深藍”的確算不上“聰明”的電腦!吧钏{”主要依靠強大的計算能力窮舉所有路數(shù)來選擇最佳策略。依靠硬算,“深藍”可以預(yù)判12步棋,而卡斯帕羅夫可以預(yù)判10步,二者勢均力敵。
當然,“深藍”必須具有相當?shù)挠嬎闼俣。?jù)認為,“深藍”實際上是一臺超算機,有480顆特別制造的象棋芯片,下棋程序以C語言寫成,運行AIX操作系統(tǒng),其計算能力在世界超級電腦中排名第259位。
然而,圍棋在復(fù)雜程度和組成數(shù)量上遠超國際象棋,是目前最復(fù)雜的博弈類封閉游戲。2015年1月28日,Nature雜志在封面論文中稱,圍棋是人工智能領(lǐng)域一個具有標志性的“大挑戰(zhàn)”,源于圍棋“巨大的搜索空間、很難估計局面和下子”。圍棋棋盤上每一點,都有黑、白、空三種情況,棋盤上共有361個點(19乘19),理論上可能產(chǎn)生的局數(shù)為3的361次方種。這個數(shù)字大概是10的170次方,比已觀測到的宇宙中原子數(shù)量還多。國際象棋只有10的46次方。
除了棋盤大,圍棋在下棋過程中還會出現(xiàn)“吃子”的情況,更加劇了其復(fù)雜性。曾任職谷歌公司的李開復(fù)說,當年“深藍”與卡斯帕羅夫的對局,實際上使用的是人工調(diào)整的評估函數(shù),并用特殊設(shè)計的硬件和“暴力”(brute-force)的搜索征服了國際象棋級別的復(fù)雜度。
圍棋則不行!耙驗樗乃阉魈珡V,每步的選擇有幾百而非幾十。也太深,一盤棋有幾百步而非幾十步!崩铋_復(fù)在知乎上回答稱。
所以,只靠算,計算機恐怕無法學會下圍棋。在“阿爾法狗”問世前,最成功的圍棋計算機程序能達到業(yè)余人類選手的程度,但還不能和專業(yè)選手在不讓子的情況下平局。2014年初,圍棋程序“瘋狂的石頭(Crazy stone)”在一次比賽中戰(zhàn)勝九段棋手依田紀基。但是當時是在人類棋手讓出4子的情況下贏得比賽。
開發(fā)這款程序的法國程序員Rémi Coulom在得知李世石將在不用讓子的情況下對戰(zhàn)谷歌公司的“阿爾法狗”時,感到既興奮,又有些難以置信。他表示,這是人工智能巨大的進步,而他原本以為這一天將在十年后到來。
在“瘋狂的石頭”的設(shè)計中,Coulom使用了被稱為“蒙特卡洛樹”的搜索技術(shù)。這種算法對大量隨機過程進行統(tǒng)計評估,得出一個最優(yōu)的解法。也就是說,蒙特卡羅算法對計算進行了篩選,數(shù)據(jù)庫中的低勝率選擇直接拋棄,放棄了窮舉法中那些大量消耗計算資源,但卻沒有意義的計算,使其對具有高勝率的選擇有更加精確的計算和分析。
加拿大艾伯塔大學計算機科學家喬納森·謝弗曾設(shè)計程序提高計算機的國際跳棋水平,試圖遇到了瓶頸。他發(fā)現(xiàn),就算使用了蒙特卡洛樹算法簡化了運算,計算機依然無法獲得人類高手擁有的“棋感”。
作為一名圍棋愛好者,Deep Mind公司的CEO哈薩比斯也表示,人類頂級大師中,走法很多時候依靠直覺。在他的理解中,“棋感”是指棋手能夠根據(jù)形勢分析攻防線路,還需要對棋形進行審美,這也是圍棋幾千年來讓人著迷的原因。所以,從2014年開始,包括臉書(Facebook)、谷歌的Deep Mind等人工智能研究團隊都將使程序模仿人類的直覺作為圍棋人工智能的突破方向。
- PC官方版
- 安卓官方手機版
- IOS官方手機版