手機(jī)版 | 網(wǎng)站導(dǎo)航
觀察家網(wǎng) 綜合 >

AI攝像機(jī)誤將裁判光頭識(shí)別成足球 AI翻車就“弱爆”了嗎

科技日?qǐng)?bào) | 2020-11-30 08:52:10

跟著一名邊裁,時(shí)不時(shí)來(lái)張“C位”特寫。原來(lái),AI攝像機(jī)誤將這名裁判的光頭識(shí)別成足球,所以瘋狂追了一整場(chǎng)。

在家觀看這場(chǎng)90分鐘比賽的球迷,大部分時(shí)間不是看球,而是在圍觀光頭。不少網(wǎng)友打趣:這場(chǎng)球賽實(shí)打?qū)嵉?ldquo;看了一個(gè)寂寞”。

為什么AI攝像機(jī)會(huì)把光頭看成了足球?為避免AI犯類似失誤,我們需要做些什么?出現(xiàn)“翻車”事件,能就此認(rèn)為AI“弱爆”了嗎?

來(lái)自光頭裁判的無(wú)意識(shí)“挑釁”

從直接參與體育賽事到記錄運(yùn)動(dòng)員表現(xiàn),再到直播比賽現(xiàn)場(chǎng)、分析運(yùn)動(dòng)員健康狀況,AI正成為體育界的寵兒。幾個(gè)月前,巴塞羅那足球俱樂部(巴薩)還攜手視頻技術(shù)公司Pixellot,打造了人工智能教練解決方案。

沒想到,在體育界一路高歌猛進(jìn)的AI,這次出人意料地遭遇了一名光頭邊裁無(wú)意識(shí)的“挑釁”。由于這名邊裁光頭太亮,加之陽(yáng)光照射,AI攝像機(jī)根本分不清哪個(gè)是球,哪個(gè)是頭。此前,因弗內(nèi)斯隊(duì)表示,他們使用的AI跟蹤技術(shù),可以將直播畫面清晰地傳輸?shù)矫恳晃患酒辟?gòu)買者家中,讓因新冠肺炎疫情而無(wú)法前往主場(chǎng)的球迷不錯(cuò)過(guò)任何一場(chǎng)比賽。

據(jù)悉,此次比賽直播使用的攝像機(jī)正是與巴薩合作的Pixellot所提供的多攝像機(jī)系統(tǒng)。該系統(tǒng)由英偉達(dá)的圖形處理器(NVIDIA GPU)提供動(dòng)力支持,捕獲的視頻分辨率可達(dá)8K。這些攝像機(jī)可以安裝在固定位置,無(wú)需攝像機(jī)操作員進(jìn)行操控。為捕獲關(guān)鍵時(shí)刻畫面,Pixellot收集了數(shù)十萬(wàn)個(gè)小時(shí)的體育視頻,用于在本地工作站的NVIDIA GPU上訓(xùn)練其算法。

擁有海量的可用數(shù)據(jù),使用了深度學(xué)習(xí)算法,加上高性能GPU計(jì)算加持,具備推動(dòng)AI前行的三大動(dòng)力,Pixellot的這款A(yù)I攝像機(jī)為何“翻車”呢?

活動(dòng)結(jié)束后,相關(guān)俱樂部和制造攝像頭的技術(shù)公司進(jìn)行了反思,問題似乎非常清楚:足球的大小、形狀與人的腦袋差不多,加上陽(yáng)光直射,讓AI攝像頭陷入了“迷茫”。因弗內(nèi)斯隊(duì)回應(yīng)稱已知曉了問題,并且將為下一場(chǎng)比賽進(jìn)行改進(jìn),給觀眾帶來(lái)更好的體驗(yàn),希望這種情況不會(huì)再發(fā)生。

Pixellot公司也表示解決這個(gè)問題并不難?,F(xiàn)有的目標(biāo)檢測(cè)與追蹤技術(shù)已比較成熟,Pixellot在設(shè)計(jì)階段沒考慮到光頭的影響,需要收集一些足球和光頭的數(shù)據(jù)對(duì)算法進(jìn)行微調(diào),以排除來(lái)自光頭的干擾。

有技術(shù)人員表示,在訓(xùn)練直播球賽的AI攝像機(jī)時(shí),需要的不僅“這是球”數(shù)據(jù)集,還需要一個(gè)“這不是球”數(shù)據(jù)集。光頭、足夠亮的白鞋、燈光、比賽場(chǎng)地旁訓(xùn)練場(chǎng)上的球、球員用來(lái)熱身的球,都是訓(xùn)練AI時(shí)需要考慮的干擾因素。

AI“視力差”才是常態(tài)

盡管可以通過(guò)加大數(shù)據(jù)“投喂量”,加強(qiáng)訓(xùn)練和改進(jìn)算法改善AI攝像機(jī)性能,但有專業(yè)人士認(rèn)為,隨著AI應(yīng)用場(chǎng)景逐步拓展,此類“翻車”事件還將長(zhǎng)期存在。

“AI‘翻車’是常態(tài),不‘翻車’才奇怪。”北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授、北京智源人工智能研究院院長(zhǎng)黃鐵軍接受科技日?qǐng)?bào)記者采訪時(shí)直言。

黃鐵軍認(rèn)為,表面上看,這次AI攝像機(jī)出現(xiàn)失誤可能是因?yàn)榍捌谟?xùn)練不夠,但最主要的原因是現(xiàn)在的計(jì)算機(jī)識(shí)別系統(tǒng)還只是用特定的數(shù)據(jù)訓(xùn)練出來(lái)的,例如在上述例子中,使用大量足球視頻訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在識(shí)別足球方面已超越人類,但卻忽視了這個(gè)網(wǎng)絡(luò)對(duì)光頭更敏感,對(duì)

沒見過(guò)的對(duì)象胡亂識(shí)別或“視而不見”,這種問題普遍存在。

機(jī)器視覺就是將視覺感知賦予機(jī)器,使機(jī)器具有和生物視覺系統(tǒng)類似的場(chǎng)景感知能力,涉及到光學(xué)成像、圖像處理、分析與識(shí)別、執(zhí)行等多個(gè)組成部分。

“把攝像機(jī)作為AI的‘眼睛’,在現(xiàn)實(shí)場(chǎng)景中,讓AI像人眼一樣去識(shí)別足球和光頭,還有很長(zhǎng)的路要走。”黃鐵軍表示。

什么時(shí)候能走完這條路,甚至實(shí)現(xiàn)AI之眼超越人眼?

這取決于機(jī)器視覺何時(shí)彌合與生物視覺的差距。“顱骨之中的大腦通過(guò)三百多萬(wàn)根神經(jīng)纖維實(shí)時(shí)感知外部世界,其中每只眼睛后面就有一百多萬(wàn)根。”黃鐵軍表示,“發(fā)展至今天的機(jī)器視覺,與花費(fèi)億萬(wàn)年進(jìn)化而來(lái)的生物視覺系統(tǒng)相比,還是小巫見大巫。”

人眼適應(yīng)性很強(qiáng),能在復(fù)雜及變化的環(huán)境中識(shí)別目標(biāo),具有高級(jí)智能,能運(yùn)用邏輯分析、推理能力去識(shí)別變化中的目標(biāo),并總結(jié)規(guī)律。而反觀機(jī)器視覺,雖然可以利用人工智能神經(jīng)網(wǎng)絡(luò)技術(shù),但不能很好識(shí)別變化的目標(biāo),受硬件條件制約,目前一般的圖像采集系統(tǒng)色彩分辨能力較差。

“與生物視覺神經(jīng)網(wǎng)絡(luò)相比,人工智能的視覺神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)、規(guī)模上相距甚遠(yuǎn),所以功能也要差很多。”黃鐵軍表示,“在現(xiàn)實(shí)應(yīng)用中,機(jī)器視覺‘翻車’不是偶然事件,把光頭識(shí)別成足球,只是個(gè)案,類似問題其實(shí)大量存在。”

黃鐵軍說(shuō):“這一次,技術(shù)提供方可以把光頭誤認(rèn)為足球的漏洞補(bǔ)上,但還有更多的漏洞,用對(duì)抗性圖片訓(xùn)練騙過(guò)人臉識(shí)別系統(tǒng)只是揭開機(jī)器視覺不足的冰山一角。”

不同技術(shù)路線在賽跑

“基于深度學(xué)習(xí)的機(jī)器視覺在圖像識(shí)別等方面取得重大進(jìn)展,但并未真正解決感知問題。”黃鐵軍認(rèn)為,深度學(xué)習(xí)遠(yuǎn)未抓住人類視覺系統(tǒng)的復(fù)雜性。

深度學(xué)習(xí)建立在圖像和視頻大數(shù)據(jù)的訓(xùn)練基礎(chǔ)上,和主動(dòng)感知?jiǎng)討B(tài)世界的生物視覺相距甚遠(yuǎn),而且仍未脫離算力需求。例如,如果把視頻幀率從30提高到3萬(wàn),深度學(xué)習(xí)的算力就需要提高1000倍。

而生物神經(jīng)網(wǎng)絡(luò)是脈沖神經(jīng)網(wǎng)絡(luò),更適合完成視覺信息處理。黃鐵軍認(rèn)為,借鑒生物視覺系統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和信息加工機(jī)理,建立一套新的類腦視覺信息處理理論和技術(shù),是重啟機(jī)器視覺的希望所在。

專家表示,發(fā)展人工機(jī)器視覺,目前有兩條主要技術(shù)路線,一是通過(guò)收集更多數(shù)據(jù)、增加數(shù)據(jù)量,加大訓(xùn)練力度,構(gòu)造出強(qiáng)大的智能系統(tǒng);二是模仿生物神經(jīng)系統(tǒng),照葫蘆畫瓢,將生物神經(jīng)系統(tǒng)的結(jié)構(gòu)甚至機(jī)理搞清楚,以此為基礎(chǔ)發(fā)展未來(lái)智能。

黃鐵軍認(rèn)為,第二條路徑要比第一條路徑更有效。“短時(shí)間來(lái)看,第一條更易取得成果。但長(zhǎng)遠(yuǎn)來(lái)看,從生物神經(jīng)網(wǎng)絡(luò)入手更為直接,實(shí)現(xiàn)目標(biāo)也更有把握。”

目前,AI學(xué)界多數(shù)支持第一條路徑,即通過(guò)“大數(shù)據(jù)+大算力”的方式,發(fā)展機(jī)器視覺在內(nèi)的人工智能。黃鐵軍踏上少數(shù)人走的那條路,是因?yàn)樗麍?jiān)信生物視覺神經(jīng)網(wǎng)絡(luò)有巨大潛能可以挖掘。“生物大腦是億萬(wàn)年進(jìn)化的產(chǎn)物,是最好的先驗(yàn)結(jié)構(gòu)。強(qiáng)大智能必須依托復(fù)雜結(jié)構(gòu),站在進(jìn)化肩膀上,看似艱難,實(shí)則最快。”

“計(jì)算機(jī)科學(xué)之父”圖靈早就表達(dá)過(guò)對(duì)生物大腦的推崇。1943年初,香農(nóng)提議,可以把“文化的東西”灌輸給電子大腦,圖靈有一次在大庭廣眾之下反駁:“不,我對(duì)建造一顆強(qiáng)大的大腦不感興趣,我想要的不過(guò)是一顆尋常的大腦,跟美國(guó)電報(bào)電話公司董事長(zhǎng)的腦袋瓜差不多即可。”

發(fā)展機(jī)器視覺,抑或是人工智能,是重起爐灶,是模仿生物神經(jīng)網(wǎng)絡(luò),還是另有他法?暫無(wú)定論。在不同的賽道上,人工智能都在加速前進(jìn)。

盡管AI“翻車”案例不在少數(shù),比如谷歌AI眼部疾病診斷系統(tǒng)的實(shí)用性在泰國(guó)大打折扣,騰訊AI翻譯在2018年博鰲論壇上鬧出笑話。但AI時(shí)代正加速到來(lái),勢(shì)不可擋。

“必須承認(rèn),AI確實(shí)解決了不少現(xiàn)實(shí)問題,它將逐步替代人的部分功能。但不能過(guò)分夸大,它距離我們想象中的智能還有很多不足,還需要更多突破。”黃鐵軍說(shuō),要保持開放的思維,跨越“實(shí)驗(yàn)?zāi)M”與“真實(shí)世界”之間的鴻溝,AI技術(shù)發(fā)展任重而道遠(yuǎn)。 (實(shí)習(xí)記者 代小佩)

  • 標(biāo)簽:AI攝像機(jī),翻車,裁判光頭

媒體焦點(diǎn)