手機(jī)版 | 網(wǎng)站導(dǎo)航
觀察家網(wǎng) > 財(cái)經(jīng) >

給狂飆的大模型系上“安全帶”,瑞萊智慧發(fā)布全新AI安全平臺(tái)RealSafe

財(cái)訊網(wǎng) | 2023-07-11 21:05:13

近幾個(gè)月來(lái),以ChatGPT為代表的生成式人工智能狂飆突進(jìn),大模型時(shí)代已然降臨。在“百模大戰(zhàn)”越戰(zhàn)越酣之時(shí),大模型其內(nèi)生及衍生安全威脅也愈演愈烈,數(shù)據(jù)泄露、幻想、生產(chǎn)歧視、排斥和有害內(nèi)容等安全問(wèn)題層出不窮。

如何將制約大模型應(yīng)用發(fā)展的“絆腳石”變?yōu)?ldquo;壓艙石”?

7月7日,清華大學(xué)人工智能研究院孵化企業(yè)瑞萊智慧RealAI在2023WAIC世界人工智能大會(huì)上,重磅發(fā)布了全新人工智能安全平臺(tái)RealSafe3.0,為“加速度”發(fā)展中的大模型系好“安全帶”、把好“方向盤(pán)”。

瑞萊智慧RealAI聯(lián)合創(chuàng)始人、算法科學(xué)家

現(xiàn)狀:“雙刃劍”效應(yīng),制約大模型落地

和所有通用目的技術(shù)一樣,自人工智能誕生的那一刻起,創(chuàng)造技術(shù)的力量和控制技術(shù)的力量就存在不對(duì)等。新技術(shù)必然會(huì)帶來(lái)新的安全問(wèn)題,這正是技術(shù)兩面性。大模型亦是如此,盡管它的強(qiáng)大已讓人類瞥見(jiàn)了通用人工智能的曙光,但也讓眾多學(xué)界、業(yè)界人士心生憂懼。前不久,就有全球400多位專家發(fā)布聯(lián)名公開(kāi)信,警告人工智能發(fā)展速度過(guò)快,缺乏監(jiān)管,可能會(huì)危及人類生存。

他們的擔(dān)憂并非危言聳聽(tīng)。近段時(shí)間以來(lái),關(guān)于大模型的安全隱患屢見(jiàn)不鮮,例如:機(jī)密文件被泄露、添加無(wú)意義的字符后模型竟給出完全相反的回答、輸出違法有害內(nèi)容、隱含對(duì)某些人類社群的偏見(jiàn)和歧視等等。

這一新興技術(shù)帶來(lái)的風(fēng)險(xiǎn),已經(jīng)引起世界各國(guó)的高度關(guān)注。國(guó)家互聯(lián)網(wǎng)信息辦公室4月11日起草《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》公開(kāi)征求意見(jiàn);歐盟于6月14日投票通過(guò)了《人工智能法案》,以期法律法規(guī)引領(lǐng)技術(shù)向好向善發(fā)展。

瑞萊智慧聯(lián)合創(chuàng)始人、算法科學(xué)家蕭子豪認(rèn)為,大模型“落地難”的本質(zhì)在于,當(dāng)前仍處于“野蠻生長(zhǎng)”階段,還沒(méi)有找到場(chǎng)景、風(fēng)險(xiǎn)和規(guī)范三者之間的平衡點(diǎn)。而在探尋這一平衡點(diǎn)的過(guò)程中,缺少易用和標(biāo)準(zhǔn)化的工具,即在技術(shù)層面上缺乏有力抓手,能夠科學(xué)評(píng)判大模型在場(chǎng)景中能否同時(shí)滿足規(guī)范和低風(fēng)險(xiǎn),且能夠進(jìn)一步定位問(wèn)題并給出優(yōu)化建議,助力模型上線運(yùn)行。

出路:源頭上找癥結(jié),技術(shù)上找對(duì)策

因此,瑞萊智慧在2023世界人工智能大會(huì)上,正式發(fā)布人工智能安全平臺(tái)RealSafe3.0版本。它是集成主流及RealAI獨(dú)有的世界領(lǐng)先的安全評(píng)測(cè)技術(shù),能夠提供端到端的模型安全性測(cè)評(píng)解決方案,解決當(dāng)前通用大模型安全風(fēng)險(xiǎn)難以審計(jì)的痛點(diǎn)問(wèn)題。

相較上一版本,RealSafe3.0新增了對(duì)通用大模型的評(píng)測(cè),在評(píng)測(cè)維度上,它已覆蓋數(shù)據(jù)安全、認(rèn)知任務(wù)、通用模型特有漏洞、濫用場(chǎng)景等近70個(gè)評(píng)測(cè)維度,全方位多維度地評(píng)測(cè)通用大模型的性能,且未來(lái)還會(huì)持續(xù)擴(kuò)增測(cè)評(píng)維度的數(shù)量。

“評(píng)測(cè)只是手段,幫助通用大模型提升其自身安全性才是核心目的。”蕭子豪說(shuō),不能因?yàn)閷?duì)于被技術(shù)反噬的擔(dān)憂就止步不前,創(chuàng)造新技術(shù)和控制技術(shù)危害應(yīng)該同步進(jìn)行,“瑞萊智慧的辦法是,從源頭上找到癥結(jié),再用‘魔法’打敗‘魔法’。”

如果將人工智能模型比作“引擎”,數(shù)據(jù)則是模型的“燃料”??梢哉f(shuō),數(shù)據(jù)集質(zhì)量直接影響模型的內(nèi)生安全。因此,RealSafe3.0內(nèi)部集成了多個(gè)自研模型和專家論證高質(zhì)量數(shù)據(jù)集,來(lái)幫助用戶修復(fù)模型中的問(wèn)題。

對(duì)黑盒不可解釋的通用大模型,自研紅隊(duì)對(duì)抗模型取代人工設(shè)計(jì)問(wèn)題,顯著提升攻擊成功率和樣本多樣性。也就是說(shuō),該模型數(shù)據(jù)集中,不僅包含了自有數(shù)據(jù)集,還包含了模型自生成的數(shù)據(jù),無(wú)論是從數(shù)據(jù)質(zhì)量還是數(shù)據(jù)規(guī)模上都可圈可點(diǎn),因此它能夠自動(dòng)化地挖掘出更多的漏洞,真正從源頭上緩解安全問(wèn)題。

教練模型則通過(guò)對(duì)被測(cè)大模型進(jìn)行多輪次的提問(wèn)-回答訓(xùn)練,并以訓(xùn)練好的評(píng)分模型對(duì)問(wèn)答結(jié)果進(jìn)行評(píng)分,再將評(píng)分結(jié)果反饋給大模型,使其不斷強(qiáng)化學(xué)習(xí)到好壞答案的要點(diǎn)及區(qū)別,直至問(wèn)答能力逐步迭代至最優(yōu)。除了定制化的訓(xùn)練框架,教練模型理想的模型效果還得益于夯實(shí)的數(shù)據(jù)基礎(chǔ),瑞萊智慧自有數(shù)據(jù)集經(jīng)過(guò)數(shù)十位價(jià)值觀領(lǐng)域的專家論證,以確保輸入的數(shù)據(jù)無(wú)誤,質(zhì)量高且領(lǐng)域多元,未來(lái)也將持續(xù)更新補(bǔ)充。

蕭子豪透露:“這些技術(shù),都是基于自研多模態(tài)大模型底座實(shí)現(xiàn)的。”

瑞萊智慧人工智能安全平臺(tái)RealSafe3.0通用大模型測(cè)評(píng)及優(yōu)化工作流程

結(jié)語(yǔ):用AI打敗AI,用智慧駕馭智能

除了可提升生成式大模型安全性的RealSafe3.0,瑞萊智慧此次還帶來(lái)了能夠防范生成式人工智能惡意濫用的DeepReal2.0。據(jù)悉,DeepReal此前名為深度偽造內(nèi)容檢測(cè)平臺(tái),現(xiàn)已正式更名為生成式人工智能內(nèi)容檢測(cè)平臺(tái),因?yàn)樗四軌驒z測(cè)Deepfake內(nèi)容,還新增兩個(gè)功能模塊,可以檢測(cè)Diffusion、LLM這兩類新方法生成的數(shù)據(jù),支持對(duì)圖像、視頻、音頻、文本進(jìn)行是否偽造的檢測(cè)。應(yīng)用場(chǎng)景包括打擊網(wǎng)絡(luò)詐騙和聲譽(yù)侵害行為、檢測(cè)網(wǎng)絡(luò)內(nèi)容合規(guī)性、檢測(cè)音視頻物證真實(shí)性等,可對(duì)生成式人工智能技術(shù)濫用行為進(jìn)行管控和治理。

自2018年成立以來(lái),瑞萊智慧就致力于研究和發(fā)展安全可控的第三代人工智能技術(shù),建立通用AI模型能力和人工智能安全能力:通過(guò)通用人工智能模型來(lái)適應(yīng)各類復(fù)雜的智能應(yīng)用場(chǎng)景和任務(wù);并通過(guò)人工智能安全能力,真正使AI造福人類整體利益。

瑞萊智慧堅(jiān)持源頭創(chuàng)新和底層研究,在生成式人工智能等領(lǐng)域不斷發(fā)表世界領(lǐng)先科研成果。成立以來(lái),瑞萊智慧研發(fā)團(tuán)隊(duì)核心成員在人工智能領(lǐng)域頂會(huì)上發(fā)表論文數(shù)百篇,多次在國(guó)際測(cè)評(píng)和競(jìng)賽中斬獲冠軍,獲得授權(quán)專利100余項(xiàng)。同時(shí),瑞萊智慧積極推動(dòng)行業(yè)規(guī)范化,累計(jì)參與30余項(xiàng)國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)制定。此外,瑞萊智慧已與網(wǎng)信辦、工信部、公安部及下屬多家單位展開(kāi)深入的項(xiàng)目合作。

“從古至今,技術(shù)始終都是一把‘雙刃劍’。通用人工智能的時(shí)代必將到來(lái),如何讓人工智能揚(yáng)長(zhǎng)避短,如何用人類智慧駕馭人工智能,是從業(yè)者的一道長(zhǎng)久課題。”蕭子豪說(shuō),這也是瑞萊智慧一直努力的方向。未來(lái),RealSafe3.0將在保障通用大模型和專有模型安全、可靠、可控上,發(fā)揮強(qiáng)大作用。瑞萊智慧也將持續(xù)迭代技術(shù)、打磨產(chǎn)品,以確保在這場(chǎng)人工智能安全“攻防戰(zhàn)”中始終立于不敗之地,將人工智能的兩面性這一“關(guān)鍵變量”,轉(zhuǎn)化為高質(zhì)量發(fā)展的“最大增量”。

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。

標(biāo)簽:

  • 標(biāo)簽:中國(guó)觀察家網(wǎng),商業(yè)門(mén)戶網(wǎng)站,新聞,專題,財(cái)經(jīng),新媒體,焦點(diǎn),排行,教育,熱點(diǎn),行業(yè),消費(fèi),互聯(lián)網(wǎng),科技,國(guó)際,文化,時(shí)事,社會(huì),國(guó)內(nèi),健康,產(chǎn)業(yè)資訊,房產(chǎn),體育。

相關(guān)推薦