財(cái)聯(lián)社4月16日訊(編輯 旭日)AI視覺(jué)領(lǐng)域迎來(lái)新模型“炸場(chǎng)”,圖像識(shí)別門(mén)檻大幅降低。據(jù)財(cái)聯(lián)社報(bào)道,Meta周三發(fā)布了一個(gè)人工智能模型,可以從圖像中挑選出單個(gè)對(duì)象,以及一個(gè)圖像注釋數(shù)據(jù)集。該模型名為Segment Anything Model(SAM),Meta官方表示這是有史以來(lái)最大的分割數(shù)據(jù)集。同時(shí)Meta將該模型及數(shù)據(jù)集在GitHub上開(kāi)源,以促進(jìn)機(jī)器視覺(jué)通用基礎(chǔ)大模型的進(jìn)一步研究。
SAM是計(jì)算機(jī)視覺(jué)領(lǐng)域發(fā)布第一個(gè)用于圖像分割的、可通過(guò)提示(prompt)方式應(yīng)用的通用大模型,類(lèi)似自然語(yǔ)言領(lǐng)域(NLP)中的大模型ChatGPT。英偉達(dá)人工智能科學(xué)家Jim Fan將Meta的這項(xiàng)研究稱(chēng)作計(jì)算機(jī)視覺(jué)領(lǐng)域的“GPT-3時(shí)刻”之一——其分割方法可以通用,可對(duì)不熟悉的物體和圖像進(jìn)行零樣本泛化,初步驗(yàn)證了多模態(tài)技術(shù)路徑及其泛化能力。
【資料圖】
國(guó)盛證券劉高暢4月8日研報(bào)中表示,預(yù)計(jì)1-5年內(nèi),多模態(tài)發(fā)展將帶來(lái)AI泛化能力提升,通用視覺(jué)、通用機(jī)械臂、通用物流搬運(yùn)機(jī)器人、行業(yè)服務(wù)機(jī)器人、真正的智能家居會(huì)進(jìn)入生活;5-10年內(nèi),結(jié)合復(fù)雜多模態(tài)方案的大模型有望具備完備的與世界交互的能力,在通用機(jī)器人、虛擬現(xiàn)實(shí)等領(lǐng)域得到應(yīng)用。
首創(chuàng)證券翟煒4月11日研報(bào)中指出,本周META發(fā)布了視覺(jué)大模型SAM,緊接著智源研究院視覺(jué)團(tuán)隊(duì)也推出通用分割模型SegGPT,通用視覺(jué)大模型之戰(zhàn)也打響。視覺(jué)大模型能把任意圖像從像素陣列解析為視覺(jué)結(jié)構(gòu)單元,像人類(lèi)視覺(jué)那樣理解各類(lèi)場(chǎng)景,這對(duì)自動(dòng)駕駛、安防、智能家居、工業(yè)視覺(jué)等眾多行業(yè)都將帶來(lái)飛躍式提升。
公開(kāi)資料顯示,計(jì)算機(jī)視覺(jué)模擬大腦完成對(duì)圖像的處理和解釋?zhuān)瑢?shí)現(xiàn)對(duì)相應(yīng)場(chǎng)景的多維理解。以圖像、視頻為代表的視覺(jué)數(shù)據(jù)是互聯(lián)網(wǎng)時(shí)代信息的主要載體之一,賦以人工智能模型感知并理解這些海量的視覺(jué)數(shù)據(jù)的能力,有助于提高人工智能自主適應(yīng)環(huán)境的能力。
作為人工智能(AI)和深度學(xué)習(xí)的子領(lǐng)域,計(jì)算機(jī)視覺(jué)可訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN),以便針對(duì)各種應(yīng)用場(chǎng)合開(kāi)發(fā)仿人類(lèi)視覺(jué)功能,利用圖像和視頻進(jìn)行數(shù)據(jù)分割、分類(lèi)和檢測(cè)。
國(guó)海證券陳夢(mèng)竹在3月29日研報(bào)中表示,2021年中國(guó)計(jì)算機(jī)視覺(jué)技術(shù)核心產(chǎn)品、帶動(dòng)相關(guān)產(chǎn)業(yè)市場(chǎng)規(guī)模達(dá)990億元、3079億元,預(yù)計(jì)2025年分別達(dá)1873億元、5771億元。
目前,中國(guó)計(jì)算機(jī)視覺(jué)廠商具有基于基礎(chǔ)算法進(jìn)行改進(jìn)和優(yōu)化并形成各自特有算法的技術(shù)能力。截至2021年上半年,商湯科技以47%市占率位列行業(yè)第一;曠視科技和??低曃涣械诙?、第三名,市占率分別為8%和7%。云從科技、創(chuàng)新奇智、依圖科技、大華股份等位列行業(yè)Top10。
此外,據(jù)財(cái)聯(lián)社不完全整理,近期在互動(dòng)易平臺(tái)回復(fù)布局AI視覺(jué)/計(jì)算機(jī)視覺(jué)相關(guān)業(yè)務(wù)上市公司還包括美亞柏科、虹軟科技、創(chuàng)維數(shù)字、潤(rùn)和軟件、國(guó)科微、全志科技、超圖軟件、凌云光、創(chuàng)業(yè)黑馬、中科創(chuàng)達(dá)、云鼎科技、智微智能、中科通達(dá)、移遠(yuǎn)通信、奧普特、克來(lái)機(jī)電、國(guó)聯(lián)股份等。
國(guó)盛證券鄭震湘4月12日研報(bào)中指出,SAM模型在視覺(jué)識(shí)別領(lǐng)域具有重要意義,建議關(guān)注芯片端包括韋爾股份,龍迅股份,晶方科技,富瀚微,思特威,格科微等;光學(xué)/鏡頭模組包括高偉電子,舜宇光學(xué),宇瞳光學(xué)和永新光學(xué)。
建議關(guān)注視覺(jué)方案的虹軟科技;安防模型及應(yīng)用包括??低?,大華股份等;工業(yè)機(jī)器視覺(jué)包括奧比中光,凌云光等;AR/VR 相關(guān)上市公司包括立訊精密,歌爾股份,水晶光電,創(chuàng)維數(shù)字,兆威機(jī)電,長(zhǎng)盈精密等。
不過(guò)值得注意的是,分析人士表示對(duì)于視覺(jué)算法運(yùn)行顯卡,國(guó)內(nèi)一些廠商已經(jīng)有了自研產(chǎn)品,但推理速度、顯存等性能與國(guó)外廠商有一定差距。除此之外,不同顯卡和框架之間的遷移和適配過(guò)程復(fù)雜。為了讓視覺(jué)算法落地到國(guó)家的各行各業(yè),國(guó)產(chǎn)化進(jìn)程任重而道遠(yuǎn)。
[責(zé)任編輯:linlin]
標(biāo)簽: