“整體的感覺(jué)就是AI太猛了,它們總是能做出異于常人的反應(yīng)……”
在1:3輸給人工智能后,有王者榮耀電競(jìng)職業(yè)選手這樣說(shuō)到自己對(duì)戰(zhàn)時(shí)的感受。
此后更有網(wǎng)友在社交媒體直言,“人類連玩游戲也打不過(guò)AI了”“人類再次一敗涂地”……
那么,讓人工智能去玩《王者榮耀》就是為了“虐菜”嗎?中新網(wǎng)記者最近和該AI模型負(fù)責(zé)人聊了聊。
3:1 “屬于正常發(fā)揮”
幾天前,在世界人工智能大會(huì)現(xiàn)場(chǎng),一款名為“絕悟”的游戲AI與五位來(lái)自王者榮耀職業(yè)聯(lián)賽的選手現(xiàn)場(chǎng)進(jìn)行了一場(chǎng)表演賽。
有報(bào)道指出,人工智能在比賽中相繼打出了“蹲草”“前后拉扯輸出”“輔助開(kāi)團(tuán)”等操作,并在團(tuán)隊(duì)合作上頗具專業(yè)意識(shí)。
在這場(chǎng)五局三勝的賽事中,人工智能以3:1的比分戰(zhàn)勝了五位職業(yè)選手。
盡管勝負(fù)成績(jī)成了關(guān)注這場(chǎng)比賽的網(wǎng)友討論的熱點(diǎn)話題,但王者絕悟AI模型負(fù)責(zé)人邱福浩卻告訴記者,團(tuán)隊(duì)對(duì)比賽的勝負(fù)沒(méi)有預(yù)期。
作為研發(fā)人員,他們更希望人工智能可以把握與高水平玩家切磋的機(jī)會(huì),驗(yàn)證能力并不斷成長(zhǎng),雖然這樣的成績(jī)“屬于正常發(fā)揮”。
此外,很多網(wǎng)友猜測(cè),相較于人類職業(yè)選手的反應(yīng)速度,人工智能或許在操作方面有著“絕對(duì)優(yōu)勢(shì)”。
然而,邱福浩卻向記者明確表示,在數(shù)值和操作上,王者絕悟AI并沒(méi)有獨(dú)特的優(yōu)勢(shì),在游戲中的客觀條件限制是一致的。
“在英雄的自身狀態(tài)參數(shù)上,AI并沒(méi)有額外的加成,與人類玩家相同;AI在視野觀測(cè)上與人類玩家保持一致,對(duì)于戰(zhàn)爭(zhēng)迷霧中的不可見(jiàn)單位,AI同樣也看不到;AI的操作反應(yīng)也做了客觀限制,其反應(yīng)分布和均值與KPL職業(yè)選手是相接近的。根據(jù)實(shí)際觀察,人類玩露娜等英雄會(huì)比AI更秀?!?/p>
AI一天對(duì)局?jǐn)?shù)≈人類440年
既然客觀條件沒(méi)有什么不同,人工智能為何能戰(zhàn)勝人類職業(yè)選手?
邱福浩給出的答案是訓(xùn)練量?!癆I的優(yōu)勢(shì)在于其龐大的訓(xùn)練量,一天對(duì)局?jǐn)?shù)約等于人類440年?!?/p>
用研發(fā)團(tuán)隊(duì)的話說(shuō),自2017年啟動(dòng)項(xiàng)目,王者絕悟AI從模仿人類的監(jiān)督學(xué)習(xí),到自我博弈的強(qiáng)化學(xué)習(xí),經(jīng)過(guò)了多次迭代,攻克了多個(gè)難題,才逐步進(jìn)化成了全英雄職業(yè)電競(jìng)水平的“完全體”。
邱福浩介紹,2018年,王者絕悟AI還只是頂尖業(yè)余玩家的水平;到了2019年,王者絕悟AI不再需要模仿人類數(shù)據(jù),而是通過(guò)自己和自己對(duì)戰(zhàn),進(jìn)一步提升微操水平和大局觀,已達(dá)到了王者榮耀職業(yè)電競(jìng)水平;去年,它學(xué)會(huì)了更多英雄玩法,并用40個(gè)英雄首次接受玩家們的挑戰(zhàn);最新版本中,團(tuán)隊(duì)又在競(jìng)技比賽的局前和局內(nèi)階段,進(jìn)行了針對(duì)性優(yōu)化。
幾年前,AlphaGO擊敗人類職業(yè)圍棋選手時(shí),一度震驚世界。
與圍棋相比,《王者榮耀》是一個(gè)不完全信息博弈場(chǎng)景,需要多個(gè)AI協(xié)作完成任務(wù),且需在復(fù)雜連續(xù)的決策空間下進(jìn)行長(zhǎng)期決策。
換句話說(shuō),教會(huì)人工智能玩《王者榮耀》,比讓人工智能下圍棋更難。
邱福浩說(shuō),圍棋的動(dòng)作空間多達(dá)10的172次方,而AI在王者榮耀一局游戲中的操作可能性則多達(dá)10的20000次方。
讓AI打游戲不是終點(diǎn)
但,進(jìn)行如此復(fù)雜的研發(fā)、訓(xùn)練,就只是為了讓人工智能在游戲中打敗人類嗎?
邱福浩并不這么看。因?yàn)槿斯ぶ悄茏罱K是要服務(wù)于人類的。
他告訴記者,團(tuán)隊(duì)之所以就此進(jìn)行研發(fā),首先是因?yàn)椤斑@是一個(gè)多人協(xié)作的游戲場(chǎng)景,它在設(shè)計(jì)上的高復(fù)雜度、高挑戰(zhàn)性,滿足了對(duì)高水平AI+游戲的研究需要”。
“從近年AI發(fā)展的關(guān)鍵事件可以看到,AI的下一個(gè)里程碑很有可能就是在復(fù)雜策略游戲中誕生?!?/p>
而人工智能進(jìn)行復(fù)雜游戲訓(xùn)練的,是為了幫助人類解決現(xiàn)實(shí)生活中的問(wèn)題。
邱福浩說(shuō),AI在虛擬環(huán)境學(xué)習(xí)通用的感知、決策能力,未來(lái)可能在現(xiàn)實(shí)世界中發(fā)揮更大作用。以無(wú)人車研究為例,AI學(xué)習(xí)外界環(huán)境,感知道路環(huán)境信息并加以表達(dá),進(jìn)而作出駕駛決策;再如機(jī)器人在虛擬世界仿真學(xué)習(xí),再在現(xiàn)實(shí)世界對(duì)環(huán)境的未知變化做出反應(yīng)。
他認(rèn)為,未來(lái),AI研究還將覆蓋到更多場(chǎng)景。對(duì)于不少研究人員和開(kāi)發(fā)者來(lái)說(shuō),多智能體技術(shù)研究依然存在顯著的現(xiàn)實(shí)困難,包括環(huán)境的不確定性、信息獲取的局限性、個(gè)體目標(biāo)與全局目標(biāo)的一致性,以及對(duì)高算力的要求。
在邱福浩看來(lái),“AI+游戲”研究將是團(tuán)隊(duì)攻克AI終極研究難題——通用人工智能(AGI)的關(guān)鍵一步。AGI代表研發(fā)能在通用系統(tǒng)中執(zhí)行多種復(fù)雜命令,達(dá)到或超越人類水平的AI。
“這中間的經(jīng)驗(yàn)、方法與結(jié)論,長(zhǎng)期來(lái)看,有望在大范圍內(nèi),如醫(yī)療、制造、無(wú)人駕駛、農(nóng)業(yè)到智慧城市管理等領(lǐng)域帶來(lái)更深遠(yuǎn)影響?!?/p>
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。