成人A片高潮痉挛,精品无码一区二区三区爱欲,盛夏晚晴天在线观看 ,男女啪啪

漫談人工智能之二,Master粲粲如星,揮灑縛豪英

2017年3月8日 來源:天云聚合B2C2B--亞洲最大、最安全的網(wǎng)上交易平臺(tái)  瀏覽 756 次 評(píng)論(0)

國(guó)內(nèi)的人工智能熱很大程度上就是被AlphaGo炒起來的。機(jī)器圍棋和哥德巴赫猜想、費(fèi)爾馬大定理一樣,是一道舉世公認(rèn)的難題。圍棋361個(gè)點(diǎn),一盤棋的變化數(shù)目據(jù)說超過了宇宙中的原子數(shù)目,和其他博弈游戲相比是高出幾十個(gè)數(shù)量級(jí)的差別。

  在我看來,圍棋規(guī)則異常簡(jiǎn)單:“交替落子,氣盡棋滅”,卻暗含宇宙中生之妙。你看一個(gè)19路棋盤宛如蒼茫大地,黑白棋從無(wú)而始,兩支生交替生長(zhǎng);中盤取勢(shì)占地,扭殺守御,皆為棋子生存繁衍。一局終了,棋譜留世。圍棋作為古人發(fā)明的智力游戲,妙處實(shí)不可言狀。千萬(wàn)年后即使地球毀滅,外星來客若找到一張高手遺譜,我覺得他們大致可以探知人類當(dāng)時(shí)所擁有的計(jì)算能力和智力水平。

  AlphaGo的核心算法早已在Nature雜志上發(fā)表,解讀的文章也很多。基本上就是說AlphaGo團(tuán)隊(duì)通過喂了狗狗幾十萬(wàn)盤人類對(duì)局,讓狗狗學(xué)會(huì)了下棋,到了一定水平后狗狗自己和自己下棋就能漲棋,水平會(huì)越來越強(qiáng)。

  果然,2016年底升級(jí)版阿法狗——Master橫空出世,在圍棋網(wǎng)站上小試牛刀,戰(zhàn)遍中日韓高手,求一敗而不得。更為可怕的是60連勝棋譜傳世之后,人類高手反復(fù)拆解,好像今沒有人敢說在60局中有某一局的某一個(gè)時(shí)刻人類棋手有過*領(lǐng)先的時(shí)刻。從數(shù)學(xué)上講,如果(60局棋)X(每局200步棋)X(每步可能的變化數(shù))在這么大的概率空間里,人類高手都沒有明確的獲勝機(jī)會(huì),那Master這個(gè)系統(tǒng)的水平和穩(wěn)定性可謂深不可測(cè)。

  作為深度圍棋愛好者,讓我震驚的是對(duì)局內(nèi)容。去年AlphaGo和李世石的棋譜其實(shí)還比較循規(guī)蹈矩,就算被媒體追捧的第二局五路尖沖“外星招法”,其實(shí)也并不算太出格。今年Master的棋就不一樣了,60局快棋中推翻人類棋手思維的下法簡(jiǎn)直俯拾皆是。比如序盤很早就點(diǎn)三三,習(xí)慣性尖沖無(wú)憂角,對(duì)人類已經(jīng)沿用了幾十年的“妖刀定式”“大雪崩定式”的徹底改造,等等,給很多圍棋國(guó)手“要重新學(xué)圍棋”的觸動(dòng)。打個(gè)比方,如果說去年的AlphaGo是集天下劍術(shù)之大成(畢竟剛剛從人類棋譜里學(xué)來)的高手,今年Master的感覺就已接近劍術(shù)通神的大師,手中無(wú)劍,天下萬(wàn)物為劍,飛花摘葉退敵千里。Master新年一出場(chǎng),就是風(fēng)清揚(yáng)、掃地僧這樣的世外高人范兒,輕輕松松饒?zhí)煜掠⑿垡幌取?

  舉個(gè)有點(diǎn)搞笑的例子,Master在對(duì)日本人井山的棋局中在右上角下出一步看起來很像初學(xué)者下出來的圍空棋,人類研究后認(rèn)為Master表示就這樣隨便下下就贏了,頗為推崇。事后替Master擺棋的“機(jī)器臂”黃士杰博士解釋是他連續(xù)在電腦前擺那么多盤棋太累了,鼠標(biāo)一滑擺錯(cuò)位置的結(jié)果。雖然有點(diǎn)尷尬,不過的確說明Master隨便下下,中間打個(gè)盹歇一手也能追回來。

  大師是怎樣練成的?Master沒有公開信息,外面基本上沒有什么技術(shù)解讀。作為業(yè)余愛好者,權(quán)且說說我的看法。

  上一篇說了“深度子”的厲害,AlphaGo or Master不只是簡(jiǎn)單用到了深度學(xué)習(xí)技術(shù),它用了兩個(gè)“深度子”的乘法效應(yīng)。具體而言,狗狗訓(xùn)練了兩個(gè)深度神經(jīng)網(wǎng)絡(luò),一個(gè)叫“策略網(wǎng)絡(luò)”負(fù)責(zé)學(xué)習(xí)人類的“棋感”,就是通過人類棋譜猜測(cè)棋盤上哪幾步是有可能的“下一手”,幫助計(jì)算機(jī)剪枝,把寶貴的計(jì)算資源用在刀刃上。另一個(gè)“價(jià)值網(wǎng)絡(luò)”負(fù)責(zé)做“形勢(shì)判斷”,就是計(jì)算在選用策略網(wǎng)絡(luò) “下一手”時(shí)的獲勝概率。這兩個(gè)算法相輔相成,互相推動(dòng),產(chǎn)生了乘法效應(yīng)。

  狗狗的“棋感”一開始是跟人學(xué)的,但的形勢(shì)判斷能力是自己發(fā)展起來的。形勢(shì)判斷能力其實(shí)是下圍棋的核心能力,這恰恰是人類的弱點(diǎn)和容易被忽視的地方。人類棋手在序盤和中盤用的“點(diǎn)目法”做形勢(shì)判斷的方法是**粗糙的近似,無(wú)法和機(jī)器的量化方法(比如說把勝率到小數(shù)點(diǎn)后3位)抗衡。人腦其實(shí)剪枝能力超強(qiáng),如果給予充分時(shí)間,高手也基本能把變化都算清楚,但是若是在選擇下出對(duì)自己更有利的招法時(shí)犯糊涂,你說怎么下贏狗?

  Master能通過“反人類思維”的招數(shù)戰(zhàn)勝人類,是機(jī)器學(xué)習(xí)的一個(gè)巨大的進(jìn)步!究其原因,一方面可能是過去一年狗狗在“價(jià)值網(wǎng)絡(luò)”取得了大突破,在判斷局勢(shì)、把握局勢(shì)走向的能力上遠(yuǎn)超人類,就是“控場(chǎng)能力爆表”。另一個(gè)方面,兩個(gè)高水平狗狗雙手互博,可以不斷嘗試超越人類“直覺”或者“經(jīng)驗(yàn)”的選點(diǎn),這樣一些需要深度模擬才能推敲出來的好棋(比如人類需要反復(fù)推演30步才能得到的結(jié)論),就會(huì)被Master挖掘出來。

  這次Master在布局階段走出了不少以前被人類否定的下法,就是說已經(jīng)擺脫了人類棋譜的思維限制,開始探索未入之境。人類下棋其實(shí)有個(gè)問題,就是借助于經(jīng)驗(yàn)的成分遠(yuǎn)遠(yuǎn)大于臨場(chǎng)發(fā)揮的成分。比如說學(xué)習(xí)和記憶定式,多考慮一個(gè)四分之一棋盤,但是狗狗是通盤全局考慮的,Master新的棋譜就很*,左上角是黑子還是白子,無(wú)憂角還是大飛角,左下角選擇的定式可能完全不同。這種“牽一發(fā)而動(dòng)全身”的戰(zhàn)法給人很多啟發(fā),有棋手說“美的讓人哭”。如果說一開始狗狗通過打人類棋譜學(xué)棋,現(xiàn)在是人類通過向狗老師學(xué)習(xí)來探索圍棋的奧秘了。

  翻譯成機(jī)器學(xué)習(xí)的語(yǔ)言,狗狗是從監(jiān)督學(xué)習(xí)(照棋譜學(xué)習(xí))進(jìn)入了非監(jiān)督學(xué)習(xí)(自由探索)的階段,AlphaGo的設(shè)計(jì)者讓程序具備了自我進(jìn)化的能力。人工智能算法的依賴于高質(zhì)量的數(shù)據(jù),在領(lǐng)域,高質(zhì)量的標(biāo)注數(shù)據(jù)(比如說高手的棋譜)都是有限的,或者說生產(chǎn)速度很慢,成本很高。AlphaGo一旦能夠自我產(chǎn)生高水平的新數(shù)據(jù),還通過自我博弈不斷提高自身水平,就相當(dāng)于有了自我進(jìn)化的能力。所以說領(lǐng)先的AI技術(shù)一旦確立優(yōu)勢(shì),很有可能一騎絕塵,讓后來者難以追趕。

  舉例來說,日本zen是一個(gè)有10年發(fā)展歷史的老牌圍棋程序。他們引入alphago的“策略網(wǎng)絡(luò)”技術(shù)后,很快就提高到了職業(yè)水平,但是后面再好像有點(diǎn)難。目前第二應(yīng)該是騰訊主力部隊(duì)開發(fā)的“絕藝”,開發(fā)半年多現(xiàn)在已經(jīng)到了去年AlphaGo戰(zhàn)勝李世石的水平。雖然距離Master還有差距,我*希望這個(gè)國(guó)產(chǎn)圍棋程序能迎頭趕上,讓Master不再寂寞。

  在一個(gè)商業(yè)領(lǐng)域,如果人工智能技術(shù)能在機(jī)制上能不斷自行產(chǎn)生優(yōu)質(zhì)數(shù)據(jù)從而自我進(jìn)化,那么別人后來居上的可能性也就大大,這可能就是全球互聯(lián)網(wǎng)公司在人工智能領(lǐng)域做瘋狂的軍備競(jìng)賽的動(dòng)因。

  好了,Master“粲粲如星,揮灑縛豪英”的故事就說到這里。既然已經(jīng)提到了AI商業(yè)化,下一篇就回到我工作的領(lǐng)域,談?wù)勅斯ぶ悄芎蜕虡I(yè)結(jié)合。

我來說兩句
人參與 丨 評(píng)論0條)
圖標(biāo)
注冊(cè) 登錄    
評(píng)論列表
×

微信掃一掃關(guān)注我們

歡迎投稿

×

郵箱:15236061639@163.com

QQ:60298351

微信:a18137798589

(版權(quán)所有 科工網(wǎng)&北京天云聚合科技有限公司 © Copyright 2015 - 2022 . All Rights Reserved.) 京ICP備14030211號(hào)-5   |   營(yíng)業(yè)執(zhí)照