close

【確認】Master就是AlphaGo升級版!60連勝背後看專傢怎麼評說

原標題:【確認】Master就是AlphaGo升級版!60連勝背後看專傢怎麼評說

新智元報道1

作者:弗格森 零夏

:COO、執行總編、主編、高級編譯、主筆、運營總監、客戶經理、咨詢總監、行政助理等 9 大崗位全面開放。

簡歷投遞:jobs@aiera.com.cn

HR 微信:13552313024

新智元為COO和執行總編提供最高超百萬的年薪激勵;為骨幹員工提供最完整的培訓體系、高於業界平均水平的工資和獎金。

加盟新智元,與人工智能業界領袖攜手改變世界。

【新智元導讀】2017年1月4日晚上,Master 完勝第59盤棋的時候,突然發聲自認:“我是 AlphaGo 的黃博士”,Master之前以橫掃千軍的姿態戰勝幾乎所有中國的圍棋大師,包括“棋聖”聶衛平和柯潔。本文帶來新智元智庫專傢白碩、鄧侃的獨傢解讀。同時,國內圍棋AI 的一名開發者也透露瞭他的看法:Master的水平略有些讓人失望。新智元還采訪瞭中國圍棋隊總教練俞斌,他在文中談瞭自己的看法和理解。這一次,機器可能不再借用人類經驗,而是憑借自我對弈和學習戰勝瞭人類,讓人類認靜電機保養識到另一個“真理”的存在。從某種程度上來說,這是一個新的“紀元”的開啟。

1月4日晚間,此前橫掃圍棋界的神秘大師“Master” 忽然發聲,自亮身份,它寫道:我是AlphaGo 黃博士。



此時,Master 剛剛取得第59場不敗紀錄,將對戰人類棋手的紀錄變為59:0。此前,人們的猜測是Master在完成60場比賽後,會隱退,或者發聲。但是,沒有人想到,在59場的時候,Master自己亮明瞭身份。

官方聲明:



Master 已經在線上平臺上接連戰勝瞭聶衛平、柯潔、樸廷桓、唐韋星、范廷鈺、王古力、周俊勛和黃雲嵩等多位圍棋高手。

戰勝“棋聖”,黃博士是誰?

2017年下午3點04分,聶衛平執白3又1/4子之差負於Master,Master取得第54勝!

聶衛平在圍棋圈有“棋聖”之稱,隻是這次,他也拿Master沒辦法。對弈結束後,Master 用繁體字打出瞭“謝謝聶老師”的消息。這個時候,其實Master的身份已經有所暗示瞭。後來Master所說的“黃博士”,指的是黃士傑博士。黃博士是臺灣人,習慣用繁體。

如果大傢有看3月份李世石與 AlphaGo 的對奕的話,應該會註意到在李世石對面有個將 AlphaGo 的棋步下到棋盤,並且將李世石的棋步再輸到電腦上的人。這位就是谷歌 DeepMind 的資深研究員,也是 AlphaGo 的主要程序開發者,臺灣出身的黃士傑博士。



黃士傑(前左)在替AlphaGo 執子

黃士傑博士畢業於臺灣師范大學,博士論文就是以“應用於電腦圍棋之蒙地卡羅樹搜索法的新啟發式演算法”,本身也是業餘六段的圍棋棋手。

此前,黃士傑在接受Engadget的采訪時曾說,如果再給 AlphaGo 一年半載的話,說不定李世石真的就是史上唯一贏過 AlphaGo 一場的人瞭...

果然,半載之後,我們看到令人嘆服的結果。

Master的技術沒有想象的那麼好?

對於此次掀起風暴的Master,新智元智庫專傢白碩評價說:

第一,並不意外。如果世界上還有另外一個團隊達到這樣的水平反而是意外。

第二,又有進步。現在的AlphaGo水平比去年戰勝李世石的時候發揮更穩定、對人類棋手更有啟發性,對人類觀眾更有觀賞性,導致人類對棋理的認識正在醞釀重大的突破。

第三,還有潛力。按現在勢頭發展,基於對弈棋譜的深度學習和基於左右互搏的增強學習正在形成良性互動的局面,但願這一階段不要過快結束(否則就跑步進入機器跟人類沒得可學的階段瞭)。

第四,除瞭不斷增強對弈能力外,讓機器以人類能理解的方式講述其棋路,以全新的體驗變革人類傳授和學習圍棋的方式,其意義不亞於戰勝人類。

新智元問及其他的機器包括國內的一些圍棋AI是否有機會超越Master呢?是否需要重大算法突破才能破解Master的時間積累優勢?

白碩說:“我知道有人在做。如果能大幅提高算法的效率,就意味著在同樣時間內可以遍歷更多有意義的變化,增強學習會做得越好。個人判斷,算法上的優化仍有空間,趕超仍有機會。未來機器之間的對弈會是新的看點。”

然而,也有專業人士表示有些失望。一位要求匿名的中國某大型互聯網公司AI開發者對新智元表示,Master 橫掃人類棋手毫不意外,但是對過程有點失望,Master的技術沒有想象的那麼好,畢竟去年7月份 Aja Huang 在一次演講中透漏可以讓頂尖棋手2子,半年過去瞭,看不出一定能讓2子。也許這並不是最新版。

棋風奔放怪異,因為沒有學習過人類棋譜?

在DeepMind官宣之前,“Master”的身份激發瞭多方猜測,有不少人認為這就是AlphaGo的升級版,但與後者不同的是“Master”的招法極其奔放,推翻瞭很多人類棋手常走的定式,棋風與去年3月的AlphaGo大不相同。

值得註意的是,DeepMind公司創始人Hassabis 曾在一次采訪中透露,他們正在嘗試訓練一個沒有學習過靜電油煙處理機人類棋譜的人工智能,而這可能就是Master和AlphaGo不同的原因。

CMU 博士鄧侃對新智元表示:

“3月份AlphaGo 與李世石對決第一盤,取得勝利後,就說明算法已經超越人類頂級高手。接下去的幾盤,AlphaGo 贏瞭,這是預料之中。輸瞭一盤,反倒有點奇怪。因為算法隻會越變越強大。

隨著訓練越來越強化,AlphaGo 的棋藝越來越精致,這是自然而然的趨勢。戰勝所有人類高手,隻不過是時間的問題。但是看不出 (現在的)AlphaGo 的算法,有本質突破。至少沒有讀到 DeepMind 在這個領域的新論文。

AlphaGo 系統中,有 Monte Carlo tree search(蒙特卡洛樹搜索),不妨把它理解為左右手互博。互博時間越長,實際上就是把各種可能的對弈方案,統統演練一遍。所以,AlphaGo 的訓練時間越長,它對各種對弈方案的瞭解就越全面。”

在自我對弈中成長起來的新AlphaGo,可能完全不需要人類棋譜。

被認為與AlphaGo“必有一戰”的世界第一柯潔,在這次對戰中也敗下陣來,但是柯潔在微博上寫的感想倒是很值得深思。

他寫道:“新的風暴即將來襲。我從3月份到現在研究瞭大半年的棋軟,無數次的理論、實踐,就是想知道計算機到底強在哪裡。昨夜輾轉反側,不想竟一夜難眠,人類數千年的實戰演練進化,計算機卻告訴我們人類全是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。但我想說,從現在開始,我們棋手將結合計算機,邁進全新的領域達到全新的境界。

專訪中國圍棋隊總教練俞斌:慢棋是人類最後的機會,但是懸念不大

在Master身份明確後,新智元第一時間聯系瞭中國圍棋隊總教練俞斌進行專訪。

新智元:您覺得人類棋手還有機會嗎?

俞斌:基本上沒有。隻留有一絲懸念,就是長時間的慢棋,但隻是懸念,我判斷慢棋也不行。

新智元:如果下慢棋,人類棋手最後的突破口可能是什麼呢?

俞斌:慢棋人的錯誤會少很多,但能否一爭勝負有懸念。感覺可能性很小。

新智元:之前有人認為,人類棋手以後隻和人類比,而機器棋手隻會和機器棋手對決瞭,您認為圍棋最後是這樣嘛?

俞斌:人與人比會,機器與機器比也有,但不會隻是這兩種。人與機器,人帶機器,用時、讓子等等,還是會有不少比的類型的。也許會有機器參加的團隊賽等等

新智元:看來機器的加入反而有瞭更多玩法。那麼您認為機器的出現,看起來像人類的天花板,人類圍棋是否會放下勝負心,真正實現人和人對圍棋本身的享受呢?

俞斌:哲學問題?? 。圍棋是勝負的遊戲。享受的是勝負的樂趣。有人工智能高手,並不影響享受圍棋的樂趣。沒有勝負而享受圍棋,我理解不瞭。這是我個人的哲學觀點。

一次橫掃千軍的網絡對戰,Master的進擊之路

12月29日晚19點多,一位名叫“Master”的新手登錄弈城,起初沒有高手搭理,但在戰勝謝爾豪四段、孟泰齡六段、於之瑩五段、韓一洲四段、喬智健四段後這個賬號熱度陡增。這晚Master十戰全勝,已註定其出世不凡。

第二天中午“Master”再度現身,在對王昊洋六段、嚴在明三段等職業棋手4連勝後,終於引出瞭韓國第一人樸廷桓九段。重頭戲開始上演,結果也是重量級的,樸廷桓在必敗局面下超時負。此結果在高手中炸瞭鍋,接著等級分排名第7的連笑七段登場挑戰,卻連敗兩場!值得註意的是,緊接著Master與賬號為“吻別”的網絡棋手交鋒兩次,均以中盤獲勝。弈城網工作人員表示,“吻別”很有可能就是擁有4個世界冠軍頭銜的當今世界圍棋第一人柯潔。如果“吻別”真是柯潔,那就意味著Master對當今中、韓第一人的戰績是6:0。

31號,“Master”又連續戰勝各大挑戰者,其中新科百靈杯冠軍陳耀燁九段也以失敗告終,最後的最後,這位堪比“掃地僧”的神秘高手連續30盤不敗,像是在逗大夥玩似的來瞭句:“今天累瞭,明天休息一天。”

最終敗在“Master”棋下的有江維傑九段、辜梓豪五段、樸永訓九段、柁嘉熹九段、井山裕太九段、孟泰齡六段、金志錫九段……

連一旁觀戰的柯潔九段都大驚失色:“從來沒見過這樣的招法,圍棋還能這麼下?”為此他感嘆:看Master的著法,等於說以前學的圍棋都是錯誤的,原來學棋的時候要被罵的著法現在Master都下出來瞭。”同樣的,知乎網友 @趙小康 評論道,Master對陣這些圍棋高手,“大多數對局都是中盤取勝,人類數千年時間總結出的定式、大局觀在master面前顯得陳腐可笑。”

1月3日9:30,棋手古力九段按捺不住,最終發出10萬元懸賞,獎勵給戰勝Master的勇士。但其後又有4位頂尖棋手被擊敗……

不過就在51場連勝之後,1月4日,“Master”第52盤以和棋結束,“Master”的51連勝紀錄就此終止。這場比賽中,“Master”挑戰中國圍棋職業選手陳耀燁。“Master”執黑棋、陳耀燁執白棋,30秒3次快棋。不過陳耀燁出現瞭斷線情況,30秒沒有落子,系統判定和棋。

今日,“Master”出現以來最受矚目的比賽在Master和聶衛平之間進行。年屆64歲的中國棋聖和“Master”的比賽也是這個人工智能程序進行的第54局比賽。本局“Master”特意把比賽用時調整為每方1分鐘一手,以示對聶衛平的尊敬。

最終本局進行至手,執白的聶衛平以7目半的劣勢落敗。本局“Master”在右上角下出犀利的手段,吃掉瞭聶衛平一塊棋由此確立優勢,並保持到瞭最後。而隨著棋聖聶衛平落敗,“Master”將自己的不敗紀錄延續至54場,中日韓高手無一能在這次“快棋”對決中取勝。

4日晚,隨著古力敗下陣來,Master 對人類棋手獲得瞭60場不敗的記錄。

AlphaGo 技術原理

AlphaGo 從三月份至今,經過10個月的發展,已經有瞭非常長足的進步,不過要追溯其技術原理,最詳細的還是三月份發表在Nature 的封面論文:Mastering the game of Go with deep neural networks and tree search(通過深度神經網絡和樹搜索,學會圍棋遊戲)。

AlphaGo 給圍棋帶來瞭新方法,它背後主要的方法是 Value Networks(價值網絡)和 Policy Networks(策略網絡),其中 Value Networks 評估棋盤位置,Policy Networks 選擇下棋步法。這些神經網絡模型通過一種新的方法訓練,結合人類專傢比賽中學到的監督學習,以及在自己和自己下棋(Self-Play)中學到強化學習。這不需要任何前瞻式的 Lookahead Search,神經網絡玩圍棋遊戲的能力,就達到瞭最先進的蒙特卡洛樹搜索算法的級別(這種算法模擬瞭上千種隨機自己和自己下棋的結果)。我們也引入瞭一種新搜索算法,這種算法將蒙特卡洛模擬和價值、策略網絡結合起來。

通過將 Value Networks、Policy Networks 與樹搜索結合起來,AlphaGo 達到瞭專業圍棋水準,讓我們看到瞭希望:在其他看起來無法完成的領域中,AI 也可以達到人類級別的表現!

DeepMind 團隊對圍棋項目的介紹(新智元翻譯)



所有完全信息(perfect information)博弈都有一個最優值函數(optimal value function),,它決定瞭在所有參與博弈的玩傢都做出瞭完美表現的情況下,博弈的結果是什麼:無論你在棋盤的哪個位置落子(或者說是狀態s)。這些博弈遊戲是可能通過在含有大約個可能行動序列(其中b是博弈的寬度,也就是在每個位置能夠移動的步數,而d是博弈的深度)的搜索樹(search tree)上反復計算最優值函數來解決的。在象棋()和圍棋之類()的大型博弈遊戲中,窮盡地搜索是不合適的,但是有效搜索空間是可以通過2種普遍規則得到降低的。首先,搜索的深度可能通過位置估計(position evaluation)來降低:在狀態s時截取搜索樹,將隨後的子樹部分(subtree)替換為根據狀態s來預測結果的近似的值函數。這種方法使程序在象棋、跳棋、翻轉棋(Othello)的遊戲中表現超越瞭人類,但人們認為它無法應用於圍棋,因為圍棋極其復雜。其次,搜索的寬度可能通過從策略概率——一種在位置s時表示出所有可能的行動的概率分佈——中抽樣行動來降低。比如,蒙特卡洛法通過從策略概率p中為博弈遊戲雙方抽樣長序列的行動來讓搜索達到深度的極限、沒有任何分支樹。將這些模擬結果進行平均,能夠提供有效的位置估計,讓程序在西洋雙陸棋(backgammon)和拼字棋(Scrabble)的遊戲中展現出超越人類的表現,在圍棋方面也能達到低級業餘愛好者水平。

新智元招聘

職位 運營總監

職位年薪:36- 50萬(工資+獎金)

工作地點:北京-海淀區

所屬部門:運營部

匯報對象:COO

下屬人數:2人

年齡要求:25 歲 至 35 歲

性別要求:不限

工作年限:3 年以上

語 言:英語6級(海外留學背景優先)

職位描述

負責大型會展贊助商及參展商拓展、挖掘潛在客戶等工作,人工智能及機器人產業方向

擅長開拓市場,並與潛在客戶建立良好的人際關系

深度瞭解人工智能及機器人產業及相關市場狀況,隨時掌握市場動態

主動協調部門之間項目合作,組織好跨部門間的合作,具備良好的影響力

帶領團隊完成營業額目標,並監控管理項目狀況

負責公司平臺運營方面的戰略計劃、合作計劃的制定與實施靜電機

崗位要求

大學本科以上學歷,碩士優先,要求有較高英語溝通能力

3年以上商務拓展經驗,有團隊管理經驗,熟悉商務部門整體管理工作

對傳統全案公關、傳統整合傳播整體方案、策略性整體方案有深邃見解

具有敏銳的市場洞察力和精確的客戶分析能力、較強的團隊統籌管理能力

具備優秀的時間管理、抗壓能力和多任務規劃統籌執行能力

有廣泛的TMT領域人脈資源、有甲方市場部工作經驗優先考慮

有媒體廣告部、市場部,top20公關公司市場拓展部經驗者優先

新智元歡迎有志之士前來面試,更多招聘崗位請訪問新智元公眾號。返回搜狐,查看更多

責任編輯:

聲明:本文由入駐搜狐號的作者撰寫,除搜狐官方賬號外,觀點僅代表作者本人,不代表搜狐立場。

閱讀 ()

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    創作者介紹
    創作者 nrn557l1h5 的頭像
    nrn557l1h5

    明明的預購清單

    nrn557l1h5 發表在 痞客邦 留言(0) 人氣()