當前位置:學問君>人在職場>創業指導>

利用AI打造線上版的“西部世界”

學問君 人氣:1.19W

由於人工智能技術的迅猛進展,幾年之後,計算機可能自動設計遊戲。 那時, 某款遊戲產品的宣傳賣點也許將是“本遊戲100%由人類製作” 。

利用AI打造線上版的“西部世界”

這個聽起來有點天方夜譚的想法,或許不久之後就會實現。正在努力實現這個願景的,是一家叫做北京深極智能科技的公司,在明年你就有可能看到他們的第一款由機器打造的的遊戲。

“用機器自動製作遊戲”的想法來自郭祥昊博士--深極智能公司的創始人。 郭祥昊1998年在北京郵電大學獲得了自然語言處理(NLP)方向的博士學位,師從資訊理論和神經網絡專家鍾義信教授。同時他還有一個並不尋常的身份:資深遊戲製作人。

如果你是一個老遊戲玩家,想必對他製作的獨立遊戲《北京浮生記》印象深刻。 正是這款遊戲的爆紅,激勵他2005年從一家國企科研機構離職,轉投遊戲行業。這些年來,他和他帶領的團隊先後開發了《方便麪三國》、《大明浮生記》、《找你妹2014》、《狂暴之翼》等遊戲。

而在實現這一宏偉目標前,這家公司還想先用人工智能技術幫助遊戲廠商提升遊戲運營的質量,增加收入,用“大數據和人工智能技術能改進遊戲業”。

在郭祥昊看來,遊戲是數據的組合,其中的一切都是可以量化的,即使是遊戲功能開放節奏、玩家疲勞度這些傳統意義上較爲主觀、定性的概念,也可以完全用定量的方式量化出來。

2016年底離職創業前,郭祥昊帶着一支科學家小隊在青果靈動公司用大數據做手機網遊《狂暴之翼》的遊戲前期改進。這個產品的成功因素很多,而利用數據,也發揮了重要的作用

遊戲中,已經被發現的問題解決起來不那麼困難。最困難的是很多設計問題“我們不知道我們不知道”。遊戲業經常出現某產品測試數據不佳,但由於苦於不知道具體原因, 難以下手改進的現象。策劃面對這些棘手的問題時,往往會根據經驗給出主觀臆測判斷(所謂“拍腦袋”),有較大的盲目性,改進效果很難把握,很隨機。

解決辦法之一就是用客觀數據去發現問題。遊戲開發過程中,他們對玩家在遊戲前期的行爲進行了細粒度埋點,得到了大量的玩家行爲數據,然後應用大數據技術,用過硬的數據證據修正遊戲的各種設計問題,其中包括策劃和QA都沒有意識到的設計問題。

大量玩家的連續點擊流(ClickStream), 形成了時間序列上有意義的大數據,能夠用統計學手段度量玩家的成長感、目標感、流失、疲勞度、UI易用性等。 他們還利用數據, 用支援向量機(SVM)訓練出了《狂暴之翼》付費玩家預測模型,準確率達到了81%,成果發表在遊資網(GameRes)上後,引起了不小反響。這堅定了郭祥昊用微觀大數據來對抗遊戲開發過程中的盲目性和不確定性。

2016年3月, AlphaGo戰勝李世石的事件給了郭祥昊很大的震動。專業的技術背景、11年在遊戲行業工作的經歷,讓他認識到這個行業的痛點和問題。2016年10月他從青果靈動公司離開,創辦了深極智能公司,並且得到了千萬級天使輪投資。而有趣的是,這家公司的名字也是利用RNN(循環神經網絡)學習了《道德經》五千多字內容後,自動生成的7個名字之一。

深極智能公司的一項業務,就是透過精細埋點數據來改進遊戲的前期表現,目前已經有包括上市公司在內的客戶。

此外,公司還在較短時間內,用機器學習的方式研發了遊戲智能客服系統,能讓玩家透過人機對話的方式得到客服服務,即將用於青果靈動的《狂暴之翼》。

對於一家初創公司來說,上面兩項業務可以帶來持續的現金流。但這家公司還想把深度強化學習(Deep Reinforcement Learning, DRL)技術應用到遊戲業中去,做一些更具有想象力的事——用深度強化學習打造遊戲版的《西部世界》,甚至未來用機器自動生成遊戲。

作爲強化學習的研究者,郭祥昊很清楚,強化學習“自古以來”都是透過遊戲展現自己的能力的。比如,1992年,美國人Gerry Tesauro用強化學習和神經網絡結合,研發了能戰勝人類的西洋雙陸棋程序(TD-Gammon);2013年英國的Deepmind的AI系統利用深度強化學習自動玩ATARI遊戲,轟動一時; 而深度強化學習是AlphaGo核心模組之一,它賦予了AlphaGo透過Self-Play來自學習的能力。

深極智能公司正在用深度強化學習打造遊戲版的《西部世界》。具體來說,就是用深度強化學習模擬網絡遊戲玩家行爲,訓練出接近人類用戶的虛擬玩家(Agent),這些玩家在行爲方面接近人類用戶,能在網遊環境下透過圖靈測試。

對於網遊遊戲公司來說,活躍的遊戲氛圍有助於提升遊戲玩家的體驗,提高留存數據和LTV值。目前一個遊戲用戶的'獲取成本已經非常高,而高度真實的虛擬玩家,可以扮演人類玩家,提升服務器平均活躍程度,給玩家更爲熱鬧的交互氛圍,從而提升遊戲包括次留在內的各種數據指標。 這方面,團隊已經與成都一家遊戲公司進行合作,雖然遇到了工程實現方面的很多坑,但目前合作整體上順利。

但這個想法還不足夠大。郭祥昊還在構想另一件事事——用人工智能技術、尤其是DRL自動做遊戲,取代目前遊戲開發過程中的策劃人員和測試人員。

人工智能技術將滲透到生活中的方方面面,遊戲業也不可避免。策劃在遊戲開發過程中非常重要,但策劃的水平卻非常隨機,部分策劃的工作單調重複性較大。遊戲產品的脆弱來自策劃水平的不穩定性。用更穩定、計算能力更強的AI取代策劃,有其背後的邏輯。如果真能實現,那麼在遊戲業,策劃將成爲受AI技術驅使而成本下降、效果提升的生產要素之一。

郭祥昊表示,正是因爲這個願景,公司吸引了不少人才。目前,深極智能公司規模已經達到10人,除1名HR外,主要爲算法工程師,分別來自清華大學、劍橋大學、中國科學院、 浙江大學、西北工大、 北航等著名的理工院校,都是數學好的遊戲愛好者。

人工智能在遊戲行業中其實早有運用。近年來,隨着網遊的普及、計算力的提升、人工智能相關算法的迭代, AI 在遊戲中可以發揮的空間越來越大。諸如騰訊,就將遊戲AI,作爲AI戰略的重要方向。全球範圍內,也有些初創公司開始關注這個市場,也受到了資本和遊戲公司的青睞。比如,日本的AI公司Heroz不久前就獲得了萬代南夢宮的投資,前者的技術也將會用於提升萬代南夢宮遊戲的難度,使遊戲更具挑戰性。