成年人爱视频亚洲,91丁香亚洲综合社区,亚洲欧美国产日韩在线高清

由谷歌DeepMind實(shí)驗(yàn)室研究的圍棋軟件AlphaGo。

以往的下棋電腦程序都是運(yùn)用傳統(tǒng)的智能運(yùn)算方法，即對(duì)所有可能的落子位置建立搜索樹(shù)，但這種方法在對(duì)付圍棋時(shí)就失靈了。

“深度思維”公司開(kāi)發(fā)的A lphaG o電腦程序另辟蹊徑，它將更為先進(jìn)的搜索樹(shù)運(yùn)算法跟神經(jīng)系統(tǒng)運(yùn)行模式結(jié)合起來(lái)。

這種類(lèi)似神經(jīng)系統(tǒng)的運(yùn)算方法將圍棋棋盤(pán)描述為一個(gè)“輸入端”，然后運(yùn)用包含數(shù)百萬(wàn)類(lèi)神經(jīng)系統(tǒng)連接的12個(gè)不同層面的網(wǎng)絡(luò)系統(tǒng)對(duì)其進(jìn)行處理。

其中一種“神經(jīng)網(wǎng)絡(luò)系統(tǒng)”叫做“策略網(wǎng)絡(luò)”，它會(huì)選擇下一步如何走；另一種“神經(jīng)網(wǎng)絡(luò)系統(tǒng)”叫做“價(jià)值網(wǎng)絡(luò)”，它會(huì)預(yù)測(cè)誰(shuí)將勝出。

谷歌公司說(shuō)：“我們用人類(lèi)職業(yè)棋手的3000萬(wàn)步下法來(lái)訓(xùn)練‘神經(jīng)網(wǎng)絡(luò)系統(tǒng)’，直到它能以57%的準(zhǔn)確率預(yù)測(cè)職業(yè)棋手的下一步走法。”

據(jù)悉，此前的圍棋程序預(yù)測(cè)準(zhǔn)確率只能達(dá)到44%。

“深度思維”公司的目標(biāo)可不是僅僅模仿人類(lèi)，而是要擊敗頂尖圍棋高手。

為了達(dá)到這一目標(biāo)，A lphaG o電腦程序能夠“自動(dòng)學(xué)習(xí)”以發(fā)展出新的下法。A lphaG o電腦程序的“神經(jīng)網(wǎng)絡(luò)系統(tǒng)”運(yùn)用一種被稱(chēng)為“強(qiáng)化學(xué)習(xí)法”的反復(fù)試錯(cuò)法，進(jìn)行了數(shù)千次訓(xùn)練，不斷調(diào)整。

谷歌公司稱(chēng)，這需要強(qiáng)大的計(jì)算能力。

在進(jìn)行人機(jī)大戰(zhàn)之前，“深度思維”公司拿A lphaG o電腦程序跟其他圍棋程序進(jìn)行比賽，如著名的圍棋程序“瘋狂石頭”和“禪”，A lphaG o電腦程序每次都能勝出。

內(nèi)容來(lái)自百科網(wǎng)

AlphaGo 又名：機(jī)器人AlphaGo