您現(xiàn)在的位置:海峽網(wǎng)>新聞中心>IT科技>科技數(shù)碼
分享

寫(xiě)暴走歐洲的系列文,寫(xiě)了一半,實(shí)在忍不住回過(guò)頭來(lái)寫(xiě)圍棋。今天這個(gè)題圖,我特意從棋魂動(dòng)漫 的視頻中,找到這一幕截出來(lái)的。

柯潔棄子認(rèn)輸 人機(jī)大戰(zhàn)第二盤(pán)究竟發(fā)生了什么?

第二盤(pán)棋,柯潔中盤(pán)認(rèn)負(fù),盤(pán)面上大龍橫死,如果僅從結(jié)局來(lái)看,似乎沒(méi)有第一盤(pán),1/4子小負(fù)聽(tīng)上去那么好。

但實(shí)際上,這盤(pán)棋的質(zhì)量和精彩,超出很多人的想象,而我今天要說(shuō)的是,這是alphago與人類(lèi)的所有對(duì)局里,棋譜最完美的一份。

alphago最早是15年底,alphago V13版本,在未公開(kāi)的情況下,與退居二線旅居歐洲的職業(yè)棋手樊麾老師進(jìn)行了測(cè)試性的對(duì)局,五盤(pán)不記錄成績(jī)的對(duì)局里,alphago三勝兩負(fù),(實(shí)際上樊老師贏了兩次alphago,不過(guò)是V13的版本,那個(gè)版本的實(shí)力尚不足以挑戰(zhàn)人類(lèi)頂級(jí)高手),五盤(pán)記錄成績(jī)的對(duì)局里,alphago五勝零負(fù)。

這十盤(pán)棋譜,實(shí)際上質(zhì)量都不高,樊老師當(dāng)時(shí)壓力也很大,畢竟作為第一個(gè)輸給AI的職業(yè)棋手,情緒上出現(xiàn)波動(dòng)是很難控制的。職業(yè)棋手當(dāng)時(shí)基于此棋譜做出判斷,認(rèn)為AI面對(duì)李世石不堪一擊,并非是盲目自信,但樊老師直到半年后,才有機(jī)會(huì)證明真的并非是自己的問(wèn)題。

然而職業(yè)棋手完全低估了AI自我進(jìn)化的能力,2016年的alphago V18版本,已經(jīng)擁有碾壓完爆V13版本的實(shí)力,據(jù)說(shuō)是可以讓V13差不多3個(gè)子的水平。 與李世石的五盤(pán)棋的結(jié)果大家都知道了,四勝一負(fù),但這五盤(pán)棋譜,從質(zhì)量上來(lái)說(shuō),也難堪完美,重壓下的李世石多處技術(shù)變形,與其巔峰狀態(tài)相比其實(shí)還是有所差距;而alphago也存在多處被職業(yè)棋手詬病的處理方式,而第4局更是被李世石一個(gè)實(shí)質(zhì)上不成立的妙手打爆。

實(shí)際上,當(dāng)時(shí)AI即便存在應(yīng)對(duì)錯(cuò)誤,局面仍然很難說(shuō)就已經(jīng)勝負(fù)已分。但alphago當(dāng)時(shí)已經(jīng)出現(xiàn)了嚴(yán)重誤判,連續(xù)走出重大問(wèn)題手,導(dǎo)致局面完全不可收拾,最后棋力不錯(cuò)的黃博士代替AI強(qiáng)行認(rèn)輸,以免在棋譜上留下更加難堪的一幕。

所以,基于如上,柯潔才發(fā)出了,“能贏李世石,不能贏我”的豪言。而一些IT從業(yè)者當(dāng)時(shí)已經(jīng)神話AI,誤以為其棋力已經(jīng)邁入巔峰,無(wú)以倫比,并對(duì)職業(yè)棋手做出的判斷不屑一顧,其實(shí)這也是另一種的傲慢與偏見(jiàn)。

最后打臉這些IT從業(yè)者的,恰恰是alphago自己,2016年底alphago V25版本 化名master卷土重來(lái),在網(wǎng)絡(luò)上橫掃人類(lèi)頂尖棋手60盤(pán)。2017年與柯潔對(duì)戰(zhàn)的這個(gè)版本,功力又有提升,按照deepind公司他們自己最近官方公開(kāi)的信息,這個(gè)版本和去年戰(zhàn)勝李世石的V18版本相比,可以讓前者3個(gè)子。

換句話說(shuō),去年那個(gè)版本,在今天的alphago眼里,千瘡百孔,不堪一擊,李世石所發(fā)現(xiàn)的問(wèn)題和缺陷,絕不是僥幸和偶然的。而當(dāng)時(shí)直播中所有做即時(shí)點(diǎn)評(píng)的嘉賓職業(yè)棋手里,只有柯潔的形勢(shì)判斷是一直是最準(zhǔn)確的,有一定棋力的棋迷想必都還有印象。(我上篇文章 是的,柯潔輸了,然而又怎樣。 提到這個(gè)版本遠(yuǎn)勝于去年版本,但當(dāng)時(shí)官方還沒(méi)有提到3個(gè)子的領(lǐng)先優(yōu)勢(shì),官方的聲明和數(shù)據(jù)印證了棋界之前的判斷,也凸顯了王思聰?shù)臒o(wú)理。)

那么,樊老師10盤(pán),李世石5盤(pán),master橫掃60盤(pán),外加柯潔1/4子負(fù)的第一盤(pán),截止到昨天為止,一共76盤(pán)公開(kāi)的棋譜,我告訴你們,其實(shí)每一個(gè)棋譜里, AI都下的不夠完美,當(dāng)然,這些不完美,有少部分是它依舊不夠完善,有很多是它認(rèn)為這樣下足夠贏了。

除了保持優(yōu)勢(shì)“穩(wěn)如狗”的退讓策略,已經(jīng)被廣泛理解之外。職業(yè)棋手對(duì)AI棋譜最大的詬病是AI會(huì)輕易的濫用先手,將變化走盡。從人類(lèi)學(xué)圍棋的經(jīng)驗(yàn)來(lái)說(shuō),保留變化(專(zhuān)業(yè)術(shù)語(yǔ)是保留味道)是非常重要的,在后續(xù)的對(duì)弈中,根據(jù)不同的進(jìn)程會(huì)有不同的選擇,而且特別是針對(duì)打劫的時(shí)候,根據(jù)劫爭(zhēng)的大小,先手是可以有選擇的用來(lái)作為劫財(cái)使用。

但AI專(zhuān)家說(shuō),走盡變化是算法剪枝,減少搜索樹(shù)的分支,減少后續(xù)的計(jì)算量。 在過(guò)去的70多盤(pán)人機(jī)對(duì)弈里,AI頻頻出現(xiàn)這樣的場(chǎng)景,但很遺憾的是,由于其局面掌控能力過(guò)于強(qiáng)大,人類(lèi)完全無(wú)法對(duì)這樣的行為作出有效的反制。

那么問(wèn)題來(lái)了,第一,保留變化是否是人類(lèi)對(duì)圍棋一廂情愿的理解?第二,AI是否會(huì)在劫爭(zhēng)緊張的時(shí)候出現(xiàn)這樣的問(wèn)題?

所幸這一盤(pán),柯潔的表現(xiàn),迫使AI作出了答案。

這一盤(pán)柯潔的意圖非常明顯,(其實(shí)上一盤(pán)也很明顯,先撈后洗,簡(jiǎn)單說(shuō)就是先拿住能確定的空,再去破壞對(duì)手的成空潛力。) 打亂棋形,通過(guò)亂戰(zhàn)尋求機(jī)會(huì)。而這一戰(zhàn),柯潔成功的將棋局帶入了自己的意圖。(上一戰(zhàn),AI在實(shí)地和外勢(shì)平衡方面,展現(xiàn)了強(qiáng)大的局面控制力,成功的破壞了柯潔的意圖,早早形勢(shì)就進(jìn)入了AI的掌控)

經(jīng)常看到柯潔在一塊棋尚未安定的時(shí)候,又強(qiáng)硬的開(kāi)出一塊新戰(zhàn)場(chǎng),形成雙方各有幾塊棋不活的彼此絞殺局面(最多時(shí)雙方各有五塊孤棋,這屬于極為罕見(jiàn)的亂戰(zhàn)形勢(shì)),可以說(shuō)很早就進(jìn)入了懸崖邊的戰(zhàn)斗,任何一方,只要一著不慎,就會(huì)萬(wàn)劫不復(fù)。

盡管在二十多手的時(shí)候,AI就連續(xù)走出了讓職業(yè)棋手贊嘆不絕的定型妙手,但柯潔的頑強(qiáng)讓AI一直沒(méi)有借此真正建立優(yōu)勢(shì),直到一百手棋的時(shí)候,雙方依然糾纏不清,局勢(shì)難判,根據(jù)deepmind老板在twitter的表達(dá),在此時(shí),AI并沒(méi)有認(rèn)為自己占有優(yōu)勢(shì),這是這個(gè)版本之前所有對(duì)局中,都沒(méi)有出現(xiàn)過(guò)的??聺嵄瞥隽薃I的極限。(以上是基于alphago的自我形勢(shì)判斷數(shù)據(jù),而非棋界人士的經(jīng)驗(yàn),更不是無(wú)憑無(wú)據(jù)的恭維)。

柯潔其實(shí)在七十多手棋的時(shí)候,已經(jīng)在左下角設(shè)計(jì)了一個(gè)巨大的劫爭(zhēng),卻引而不發(fā),繼續(xù)將局面搞亂,又在右下角試圖再度挑起一個(gè)劫爭(zhēng),然而此時(shí),alphago并沒(méi)有讓柯潔如愿,我不負(fù)責(zé)的猜測(cè)一下,一些其他的圍棋AI程序,在連環(huán)劫上判斷經(jīng)常出嚴(yán)重問(wèn)題,所以柯潔大約是希望將棋引入這樣的局面,甚至有可能考慮過(guò)去設(shè)計(jì)一個(gè)三劫循環(huán),但很顯然,alphago不會(huì)讓人類(lèi)如此輕而易舉的達(dá)成目標(biāo)。

但關(guān)鍵的事情出現(xiàn)了,從柯潔引導(dǎo)alphago進(jìn)入他所設(shè)計(jì)的劫爭(zhēng),并引而不發(fā)之后,幾十手棋的進(jìn)程里,我們注意到一個(gè)事實(shí),alphago一直在保留變化,一直選擇引而不發(fā),沒(méi)有剪枝,沒(méi)有濫用任何先手權(quán)力,沒(méi)有做任何浪費(fèi)劫財(cái)?shù)氖虑椤?/p>

這證明了兩件事情,第一,保留變化是有價(jià)值的,人類(lèi)對(duì)此的經(jīng)驗(yàn)積累沒(méi)有問(wèn)題。只是絕大部分情況下,alphago認(rèn)為無(wú)需保留變化也足夠贏棋。 第二,alphago完全理解劫財(cái)?shù)膬r(jià)值和保留,但打劫會(huì)導(dǎo)致勝率的不可控,所以在非必要的情況下,它會(huì)主動(dòng)規(guī)避打劫。

只有柯潔的實(shí)力展現(xiàn),才讓人有機(jī)會(huì)看到alphago被逼交出的答案。

然而很可惜,在膠著的局勢(shì)下,alphago第119手使出了一步妙手,這步棋如果沒(méi)有職業(yè)棋手講解,我根本看不出來(lái)好在哪里。這步棋走出來(lái)后,柯潔兩片孤棋已經(jīng)難兩全。

但盡管局勢(shì)轉(zhuǎn)向不利,劫爭(zhēng)尚在,勝負(fù)仍然存在懸念。 可惜的是,千算萬(wàn)算,劫財(cái)居然不如對(duì)手。是的,正如上面文章所提,在柯潔引入復(fù)雜劫爭(zhēng)的局面后,alphago本盤(pán)罕見(jiàn)的沒(méi)有浪費(fèi)一個(gè)劫財(cái),并一直有意或無(wú)意的保持著對(duì)柯潔的劫財(cái)優(yōu)勢(shì)。

在劫爭(zhēng)引爆后,136手被一些職業(yè)棋手批評(píng)為敗招,因?yàn)榻儇?cái)明顯偏小,alphago斷然消劫后勝負(fù)已分,然而,我更愿意理解為,這是在劫財(cái)不足的情況下,柯潔對(duì)ai實(shí)施的一項(xiàng)騙招,此時(shí)AI尚有若干劫財(cái)沒(méi)有使用,柯潔保留了更大的劫財(cái),而試圖用這個(gè)較小的劫財(cái)引導(dǎo)AI形成誤判應(yīng)劫,一旦AI應(yīng)劫,柯潔將憑空多出一個(gè)劫財(cái),成功將局勢(shì)引導(dǎo)到自己掌控的一邊,但顯然這個(gè)策略并未生效。 alphago的邏輯簡(jiǎn)單清晰,基于劫財(cái)?shù)膬r(jià)值不足,顯然消劫后勝率過(guò)高。

部分職業(yè)棋手認(rèn)為,當(dāng)時(shí)應(yīng)該繼續(xù)擴(kuò)大局面的復(fù)雜性,對(duì)AI的整片棋進(jìn)行更大范圍的攻擊和纏繞,讓棋盤(pán)整體陷入更大的死活計(jì)算中,我作為業(yè)余棋手,沒(méi)有能力發(fā)表這方面的判斷,但從實(shí)戰(zhàn)而言,deepmind官方的表態(tài)已經(jīng)證明了柯潔的狀態(tài)和能力,很多關(guān)鍵地方的處理與AI自己的最優(yōu)選擇完全一致,而直到中盤(pán)AI自己的數(shù)據(jù)判斷,依然是形勢(shì)混沌膠著不分。最后確實(shí)棋差一招,但也已經(jīng)足夠體現(xiàn)了人類(lèi)的尊嚴(yán)。

alphago消劫后,寥寥數(shù)手柯潔即示意認(rèn)輸,其實(shí)雖然一條龍橫死看上去比較悲壯,但左上alphago也付出了巨大的代價(jià),雙方的差距也并不是特別巨大,如果對(duì)手是人類(lèi),棋盤(pán)上依然有可戰(zhàn)的空間。

不過(guò),此時(shí)亂戰(zhàn)已經(jīng)結(jié)束,而 alphago將毫無(wú)疑問(wèn)的進(jìn)入“穩(wěn)如狗”的境界,繼續(xù)下去,是的,我們可以預(yù)料alphago不斷退讓?zhuān)聺嵅粩嗾家稽c(diǎn)官子便宜,差距越來(lái)越小,但很抱歉,對(duì)手不會(huì)給你任何翻盤(pán)的機(jī)會(huì)。與其這樣獲得一個(gè)大殺小敗的外行看上去相對(duì)體面的結(jié)果,不如就這樣結(jié)束,保留一張沒(méi)有缺陷的棋譜給后人。

這就是我說(shuō)的,在過(guò)去的76張alphago與人類(lèi)的對(duì)局譜里,這是alphago最完美的一張棋譜,沒(méi)有退讓?zhuān)瑳](méi)有剪枝,沒(méi)有無(wú)棋自補(bǔ),每一手棋都極具效率,恰到好處,因?yàn)橹挥杏龅竭@樣的對(duì)手,alphago才會(huì)有這樣的答卷。

是的,去年李世石讓alphago交出了一份不及格的答卷,李世石的棋力和天才自然不容置疑,但別忘了,今年這個(gè)版本,棋力讓去年的三個(gè)子。

機(jī)器學(xué)習(xí)在快速的成長(zhǎng),但我們很多人似乎沒(méi)意識(shí)到,機(jī)器學(xué)習(xí)的成就,也帶動(dòng)著人類(lèi)的學(xué)習(xí)和進(jìn)步,如果alphago把系統(tǒng)的決策數(shù)據(jù)完全開(kāi)放出來(lái),人類(lèi)在棋道探索上的進(jìn)步還會(huì)前進(jìn)一大截,這件事情也是圍棋界一直在極力要求并渴望的事情。然而很遺憾,到目前為止,這一塊還只能停留在很有限的范圍內(nèi)進(jìn)行交流。

責(zé)任編輯:海凡

最新科技數(shù)碼 頻道推薦
進(jìn)入新聞?lì)l道新聞推薦
“兩新”政策顯成效 彰顯高質(zhì)量發(fā)展新
進(jìn)入圖片頻道最新圖文
進(jìn)入視頻頻道最新視頻
一周熱點(diǎn)新聞
下載海湃客戶端
關(guān)注海峽網(wǎng)微信
?

職業(yè)道德監(jiān)督、違法和不良信息舉報(bào)電話:0591-87095414 舉報(bào)郵箱:service@hxnews.com

本站游戲頻道作品版權(quán)歸作者所有,如果侵犯了您的版權(quán),請(qǐng)聯(lián)系我們,本站將在3個(gè)工作日內(nèi)刪除。

溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護(hù),謹(jǐn)防受騙上當(dāng),適度游戲益腦,沉迷游戲傷身,合理安排時(shí)間,享受健康生活。

CopyRight ?2016 海峽網(wǎng)(福建日?qǐng)?bào)主管主辦) 版權(quán)所有 閩ICP備15008128號(hào)-2 閩互聯(lián)網(wǎng)新聞信息服務(wù)備案編號(hào):20070802號(hào)

福建日?qǐng)?bào)報(bào)業(yè)集團(tuán)擁有海峽都市報(bào)(海峽網(wǎng))采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報(bào)業(yè)集團(tuán)書(shū)面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播。

版權(quán)說(shuō)明| 海峽網(wǎng)全媒體廣告價(jià)| 聯(lián)系我們| 法律顧問(wèn)| 舉報(bào)投訴| 海峽網(wǎng)跟帖評(píng)論自律管理承諾書(shū)

友情鏈接:新聞?lì)l道?| 福建頻道?| 新聞聚合