視覺常識推理VCR (Visual Commonsense Reasoning )是人工智能領(lǐng)域的前沿熱點問題,從處理類型單一的數(shù)據(jù)到跨媒體認知、學(xué)習和推理的“跨媒體智能”被認為是五大智能方向。
近日,騰訊微視視頻理解團隊在多模態(tài)理解領(lǐng)域最權(quán)威排行榜之一VCR任務(wù)中榮登榜首。該團隊提出的BLENDer(BimodaL ENcoDer)模型超越多家研究機構(gòu)的模型效果,一舉成為單、多模型的三項指標第一,值得注意的是,BLENDer僅憑單模型效果便超越了此前榜單上的多模型最好效果,賦予了機器更強大的理解和認知能力,并深度應(yīng)用到短視頻領(lǐng)域。
VisualCommonsense Reasoning (VCR)任務(wù)于2018年由華盛頓大學(xué)的研究人員首次提出,任務(wù)旨在將圖像和自然語言理解二者結(jié)合,驗證多模態(tài)模型高階認知和常識推理的能力,讓機器擁有“看圖說話”的能力,例如VCR能夠通過圖片中人物的行為,進一步推理出其動機、情緒等信息。VCR榜單是多模態(tài)理解領(lǐng)域最權(quán)威的排行榜之一,也是當前圖像理解和多模態(tài)領(lǐng)域?qū)哟巫钌?、門檻最高的任務(wù)之一,吸引了微軟、谷歌、Facebook、百度、UCLA等國內(nèi)外公司和研究機構(gòu)紛紛參與。
據(jù)相關(guān)負責人介紹,BLENDer模型賦予了平臺更強大的認知能力,使得包含文本、音頻、視頻等多種媒體信息在內(nèi)的短視頻內(nèi)容,能夠更好的做到分類和識別,更加精準理解和挖掘這些海量的跨媒體信息。
在BLENDer模型中,第一階段以NLP中的Bert模型為起點,結(jié)合海量數(shù)據(jù)中抽取得到的數(shù)百萬張圖片和對應(yīng)描述文本作為BLENDer的輸入進行多模態(tài)訓(xùn)練;第二階段,在視覺常識推理數(shù)據(jù)集上學(xué)習電影中的場景和情節(jié),使模型在新數(shù)據(jù)上獲得更好的遷移能力;第三階段,引入最終問答任務(wù),讓BLENDer利用已有的知識和常識對現(xiàn)有問題進行人物-人物、人物-場景之間關(guān)系的挖掘和關(guān)聯(lián)進行推理,得到最終的答案。
未來,人工智能將具備更加多元、深度的交流學(xué)習能力,而技術(shù)的創(chuàng)新和精進將進一步推動AI技術(shù)在短視頻業(yè)務(wù)中智能交互場景的落地。(張銘陽)
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 www.ffpps.com All Rights Reserved.
中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
日本少妇ass浓精pics| 99蜜桃在线观看免费视频网站| 狂躁女人双腿流白色液体| 初女模被破流血视频| 性欧美18-19sex性高清播放| 荷兰女人裸体性做爰| 免费又黄又爽又色的视频| bbox撕裂bass俄罗斯| 黑人大群XXXX| 又长又粗又爽又黄少妇毛片| 西西444www无码大胆| 斯文教授×貌美学生1v1h| 片多多APP看视频| 国产精品乱码一区二三区| 久久精品无码一区二区日韩av| 日本一大免费高清| 久久精品丝袜高跟鞋| 国产精品免费无遮挡无码永久视频| 妽妽的下边好紧春雨医生| 午夜性刺激免费看视频| 亚洲av无码a片在线观看蜜桃| 尺度最大的色情禁片| 亚洲av永久无码精品古装片| 国产真实露脸乱子伦| 天天做天天爱夜夜爽| 连开两个处苞过程| 高h喷水荡肉自慰爽文np| 国产风流老太婆大bbbhd视频| 异地男朋友回来都跟饿狼似的| 久久五月色婷婷丁香六月综优物| 各种盗撮合集voyeur| 国产+日韩+另类| 成人乱码一区二区三区av| 久久99热狠狠色av蜜臀| 欧美激情a片久久久久久| 婷婷亚洲五月色综合久久| 国产9色在线 | 日韩| 无限看片的视频高清在线| 激情都市亚洲一区二区| 狼色精品人妻在线视频网站 | 久久日本片精品AAAAA国产|