(資料圖)
編程客棧()8月23日 消息:最近, Hugging Face 推出了一個名為 IDEFICS 的開源多模態(tài) AI 模型,它可以接受圖像和文本作為輸入,并生成連貫的文本輸出。
IDEFICS 是一個強大的視覺語言模型,擁有高達800億的參數(shù)量,功能包括根據(jù)圖像生成描述、回答相關問題以及根據(jù)多個圖像生成敘述等。
IDEFICS 基于 DeepMind 開發(fā)的 Flamingo 模型,后者是一種目前最先進的視覺語言模型,但尚未對外開源。相比之下,IDEFICS 作為 Flamingo 的開源實現(xiàn)版本,其測試結果顯示在各類圖像理解任務上其表現(xiàn)與 Flamingo 相當。
為訓練 IDEFICS,Hugging Face 利用了多種公開的數(shù)據(jù)集,還額外構建了一個包含1.4億張圖像的大規(guī)模圖像-編程客棧文本數(shù)據(jù)集。
IDEFICS 有兩個版本,包括90億參數(shù)的基礎版和800億參數(shù)的大模型版,可以處理不同的應用場景。
IDEFICS 的推出為研究人員和開發(fā)者提供了js一個強大的開源視覺語言編程模型,相比專利系統(tǒng)如 GPT-3,它提供了更大的靈活性。同js時,IDEFICS 也顯示出生成式模型處理多模態(tài)輸入的潛力。
未來如果能進一步提升多模態(tài)理解和生成能力,將可以大幅推動諸如機器人、自動駕駛等多模態(tài) AI 應用的發(fā)展。
項目網址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground
關鍵詞:
新聞發(fā)布平臺 |科極網 |環(huán)球周刊網 |tp錢包官網下載 |中國創(chuàng)投網 |教體產業(yè)網 |中國商界網 |萬能百科 |薄荷網 |資訊_時尚網 |連州財經網 |劇情啦 |5元服裝包郵 |中華網河南 |網購省錢平臺 |海淘返利 |太平洋裝修網 |勵普網校 |九十三度白茶網 |商標注冊 |專利申請 |啟哈號 |速挖投訴平臺 |深度財經網 |深圳熱線 |財報網 |財報網 |財報網 |咕嚕財經 |太原熱線 |電路維修 |防水補漏 |水管維修 |墻面翻修 |舊房維修 |參考經濟網 |中原網視臺 |財經產業(yè)網 |全球經濟網 |消費導報網 |外貿網 |重播網 |國際財經網 |星島中文網 |手機測評 |品牌推廣 |名律網 |項目大全 |整形資訊 |整形新聞 |美麗網 |佳人網 |稅法網 |法務網 |法律服務 |法律咨詢 |成報網 |媒體采購網 |聚焦網 |參考網
亞洲資本網 版權所有
Copyright © 2011-2020 亞洲資本網 All Rights Reserved. 聯(lián)系網站:55 16 53 8 @qq.com