今天,由聲網(wǎng)主辦的RTE2022第八屆實時互聯(lián)網(wǎng)大會正式開幕在主論壇上,音網(wǎng)創(chuàng)始人兼CEO趙斌,音網(wǎng)CTO兼首席科學(xué)家鐘升分別從行業(yè)和技術(shù)的角度對實時交互進(jìn)行了深度解讀查普曼大學(xué)電影學(xué)院教授,《福布斯》周刊《XR Express》專欄作家查理·芬克本周分享了年度熱詞超宇宙聯(lián)合國人口基金駐華代表兼蒙古辦事處主任康佳婷博士分享了實時互動技術(shù)在促進(jìn)可持續(xù)社會和經(jīng)濟(jì)發(fā)展方面的關(guān)鍵作用
RTE的概念和邊界逐漸明晰,元宇宙博弈仍有待突破。
伴隨著行業(yè)的發(fā)展,RTE的概念和邊界也逐漸清晰2020年,王聲在上市招股書中首次公開提出RTE的概念此后,這一理念逐漸被全行業(yè)認(rèn)可和使用趙斌說,從傳播學(xué)的角度來看,RTC強(qiáng)調(diào)語義信息的優(yōu)質(zhì)高效傳遞RTE更側(cè)重于用戶需要的共享空間和時間,也就是俗話說的場景而且能夠達(dá)到甚至超越線下場景的交互體驗和效果,這才是RTE真正的重點,其內(nèi)涵和外延遠(yuǎn)遠(yuǎn)超過RTC領(lǐng)域
從RTC到RTE服務(wù),也是從基礎(chǔ)能力到場景能力的快速演進(jìn)在這樣的需求下,聲網(wǎng)推出的Native NG SDK 4.0.0是專為RTE場景構(gòu)建而設(shè)計的新一代SDK趙斌表示,它在模塊化設(shè)計上提供了更加靈活,便捷,易于解耦和組合的能力,同時也提供了強(qiáng)大的插件平臺,使得各種場景的搭建和插件開發(fā)更加簡單方便同時,也很容易為各種應(yīng)用場景搭建aPaaS這個場景工具庫的完備,為下一代場景的誕生做了充分的準(zhǔn)備
幾年前,Soundnet成為第一家將AI算法全面引入實時交互領(lǐng)域的服務(wù)提供商在過去的一年里,AI算法在音頻領(lǐng)域取得了巨大的進(jìn)步AI降噪,AI回聲消除,空間音頻等音頻新技術(shù)能力為各種場景帶來更純粹,更身臨其境的聽覺體驗趙斌表示,我們很高興看到AI降噪在過去一年取得了突破與傳統(tǒng)的DSP算法相比,AI降噪可以有效降低各種突發(fā)的,不可持續(xù)的,甚至不規(guī)則的噪聲信號
在線k歌時,在不傷害演唱者回聲的前提下,AI回聲消除可以精準(zhǔn)消除伴奏的回聲,讓玩家和用戶在不戴耳機(jī),不在外面放音樂的情況下,依然可以有非常好的演唱效果。
空間對于元宇宙的重要性不容忽視趙斌認(rèn)為,只要有左右聲道,空間音頻就沒有空間感人耳是一個超級敏感的器官,有能力感知和分辨任何聲音的變化除了左右方向,還有空間的大小,距離,空間是充滿物體還是相對空曠等等如果這些和現(xiàn)實有出入,那么在元宇宙場景中的場景感,沉浸感,真實感都會有很大的損失
在過去的一年里,元宇宙的熱度持續(xù)飆升,許多App都沖上了App Store的榜首,但宣傳效果仍然與現(xiàn)實相差甚遠(yuǎn)經(jīng)過一年多的行業(yè)實踐,聲網(wǎng)也對元宇宙有了進(jìn)一步的認(rèn)識
BeReal應(yīng)用的爆炸式增長讓我們看到,真實圖像遠(yuǎn)比虛擬圖像更能滿足陌生人社交的需求趙斌說,我們發(fā)現(xiàn),用戶在使用陌生人的社交應(yīng)用時,在某種程度上正在與孤獨進(jìn)行一場戰(zhàn)爭當(dāng)你對抗孤獨時,虛擬影像的豐富性和真實性遠(yuǎn)不如真實影像,能讓你覺得自己戰(zhàn)勝了孤獨
而在非陌生人的社交領(lǐng)域,如熟人社交,興趣社交場景,虛擬影像也是小眾人群的弱需求熟人之間往往結(jié)合了通訊工具的功能在這種情況下,大家一般都認(rèn)識或者了解另一個人,甚至是熟悉的這個時候,形象的轉(zhuǎn)化和改變,其實是一種微弱的訴求再比如,我們發(fā)現(xiàn)在很多有趣的社交應(yīng)用下,玩家對你在這個感興趣的話題下的觀點,信息,內(nèi)容更感興趣個人認(rèn)同中的形象補(bǔ)充也是非常弱的訴求和價值點趙斌說
無論是頭像還是其他玩法,超宇宙要想在社交領(lǐng)域大展拳腳,在玩法上還有更大的突破空間鑒于此,Soundnet還將元宇宙能力和API進(jìn)化集中在基礎(chǔ)能力模塊上,以組合的方式提供,方便合作伙伴靈活選擇組件,自行打造不同的組合和互動游戲
在超宇宙人氣飆升的時候,由此衍生出的各種新潮游戲為社交娛樂提供了新的想象空間音視頻互動不僅不會在元宇宙中消失,還會給元宇宙帶來更多層次的沉浸感查普曼大學(xué)電影學(xué)院教授,福布斯周刊《XR Express》本周專欄作家查理·芬克認(rèn)為,互聯(lián)網(wǎng)并沒有擺脫電視,它讓電視變得更好我相信這是元宇宙將會發(fā)生的事情,它將包括視頻,語音和我們今天所做的事情所以,即使你身處3D虛擬世界,它仍然需要語音和視頻的存在
實時感知和理解成為RTE技術(shù)的關(guān)鍵能力。
實時互聯(lián)網(wǎng)越來越智能化實時音視頻端到端鏈路各個環(huán)節(jié)對場景的實時感知和理解,已經(jīng)成為實時交互的重要基礎(chǔ)能力聲網(wǎng)CTO兼首席科學(xué)家鐘升分享了其中的關(guān)鍵環(huán)節(jié)和技術(shù)他認(rèn)為就像一個信息傳遞的管道,承載不了當(dāng)下的交流需求,整個實時音視頻端到端的鏈接具有提取知識,識別情緒,做出決策的能力,成為實時交互不可或缺的要素
實時感知和理解的能力在實時交互的許多方面都發(fā)揮了重要的作用,或者說帶來了價值,包括對用戶體驗的感知質(zhì)量的估計,對整個傳輸網(wǎng)絡(luò)的質(zhì)量監(jiān)控,以及場景尤其是人體和物體的重建,以及人機(jī)交互等在未來的實時交互場景中,需求會越來越多伴隨著技術(shù)的進(jìn)步,在這方面帶給用戶的體驗和價值會越來越高鐘聲表明
實時互動促進(jìn)社會經(jīng)濟(jì)的可持續(xù)發(fā)展。
面向技術(shù)的創(chuàng)新對于中國實現(xiàn)可持續(xù)發(fā)展目標(biāo)非常重要聯(lián)合國人口基金駐華代表,聯(lián)合國人口基金駐蒙古辦事處主任康佳婷博士分享說,聯(lián)合國人口基金正在通過實時互動技術(shù),為偏遠(yuǎn)地區(qū)13—15歲的學(xué)生提供互動,全面,科學(xué)的青少年健康教育,幫助他們在成長過程中做出負(fù)責(zé)任的選擇這個項目的實時交互技術(shù)在很多方面都得益于聲音網(wǎng)絡(luò)的支持
康佳婷博士表示,得益于音網(wǎng)的資助及其提供的實時互動技術(shù),聯(lián)合國人口基金青少年健康教育課程的學(xué)生容量將進(jìn)一步擴(kuò)大,預(yù)計將覆蓋至少10000名來自中國各地的學(xué)生未來,音網(wǎng),人口基金和我們的合作伙伴將繼續(xù)通過科技創(chuàng)新,促進(jìn)青少年身心健康發(fā)展2023年,聯(lián)合國人口基金和音網(wǎng)計劃聯(lián)合舉辦全球青年創(chuàng)新大賽,歡迎持續(xù)關(guān)注
影音技術(shù)賦能企業(yè)數(shù)字化轉(zhuǎn)型新趨勢
未來音視頻技術(shù)會給企業(yè)的數(shù)字化轉(zhuǎn)型和賦能帶來哪些新趨勢王聲首席運營官劉斌,新希望集團(tuán)首席投資官俞峰,微醫(yī)集團(tuán)副總裁李磊,水滴寶研發(fā)負(fù)責(zé)人林露等嘉賓發(fā)表了各自的觀點
互聯(lián)網(wǎng)正逐漸向保險的深水區(qū)發(fā)展,即線下經(jīng)紀(jì)業(yè)務(wù)林露說,在這個過程中,音頻和視頻技術(shù)是非常寶貴的未來,通過與用戶的遠(yuǎn)程視頻聊天,以及與保險業(yè)務(wù)系統(tǒng)的進(jìn)一步溝通,可以提供更多的展示工具和交互,從而提供更深入,更長期的保險服務(wù)這是下一個應(yīng)用場景的發(fā)展趨勢
音視頻技術(shù)也是醫(yī)療服務(wù)中的核心手段李磊說,無論是醫(yī)生之間,醫(yī)患之間,還是其他場景的服務(wù),音視頻都是廣泛使用的我們希望音視頻不僅僅是作為一種服務(wù)方式,而是能夠成為服務(wù)的天線或者入口,更好的服務(wù)用戶比如我們希望推出微醫(yī)健康維護(hù)機(jī)構(gòu)HMO系統(tǒng),對人進(jìn)行全生命周期的管理在這個過程中,需要家庭醫(yī)生和醫(yī)療資源的參與,這就需要音視頻技術(shù)
于峰認(rèn)為,未來5年或10年,豬的語音數(shù)據(jù)庫會非常豐富,甚至可以識別更多豬想要表達(dá)的情感和語言同時,目前通過圖像技術(shù),可以通過手持稱重儀或類似的遠(yuǎn)程監(jiān)控,準(zhǔn)確估計豬的體重因此,我們看到從人類交互到真實生物資產(chǎn)的音視頻機(jī)會,通過豬的語音識別和豬的圖像估計,實現(xiàn)人類,生物和動物之間的交流
從云服務(wù)提供商的角度,劉斌對行業(yè)的未來趨勢提出了四點觀察他認(rèn)為首先,云服務(wù)被越來越多的傳統(tǒng)企業(yè)接受,逐漸接受混合云模式,其次,AI技術(shù)的應(yīng)用越來越多,比如語音AI降噪,空間音頻方位識別等,包括視頻人臉識別和未來脊柱識別,第三,虛擬現(xiàn)實的組合趨勢明顯,第四,在一些有積累的垂直行業(yè),先做低碼會更容易,而不是簡單的用低碼
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場無關(guān)。僅供讀者參考,并請自行核實相關(guān)內(nèi)容。