国产综合久久久久久精品,国产精品成人av片免费看,国产精品天天看天天狠,国产专区国产精品国产三级,国产大片内射1区2区

您的位置:首頁(yè)>新聞 > 產(chǎn)業(yè) >

Hugging Face推開(kāi)源多模態(tài)AI模型IDEFICS 支持圖像、文本輸入

2023-08-26 02:00:50    來(lái)源:站長(zhǎng)之家


【資料圖】

編程客棧()8月23日 消息:最近, Hugging Face 推出了一個(gè)名為 IDEFICS 的開(kāi)源多模態(tài) AI 模型,它可以接受圖像和文本作為輸入,并生成連貫的文本輸出。

IDEFICS 是一個(gè)強(qiáng)大的視覺(jué)語(yǔ)言模型,擁有高達(dá)800億的參數(shù)量,功能包括根據(jù)圖像生成描述、回答相關(guān)問(wèn)題以及根據(jù)多個(gè)圖像生成敘述等。

IDEFICS 基于 DeepMind 開(kāi)發(fā)的 Flamingo 模型,后者是一種目前最先進(jìn)的視覺(jué)語(yǔ)言模型,但尚未對(duì)外開(kāi)源。相比之下,IDEFICS 作為 Flamingo 的開(kāi)源實(shí)現(xiàn)版本,其測(cè)試結(jié)果顯示在各類圖像理解任務(wù)上其表現(xiàn)與 Flamingo 相當(dāng)。

為訓(xùn)練 IDEFICS,Hugging Face 利用了多種公開(kāi)的數(shù)據(jù)集,還額外構(gòu)建了一個(gè)包含1.4億張圖像的大規(guī)模圖像-編程客棧文本數(shù)據(jù)集。

IDEFICS 有兩個(gè)版本,包括90億參數(shù)的基礎(chǔ)版和800億參數(shù)的大模型版,可以處理不同的應(yīng)用場(chǎng)景。

IDEFICS 的推出為研究人員和開(kāi)發(fā)者提供了js一個(gè)強(qiáng)大的開(kāi)源視覺(jué)語(yǔ)言編程模型,相比專利系統(tǒng)如 GPT-3,它提供了更大的靈活性。同js時(shí),IDEFICS 也顯示出生成式模型處理多模態(tài)輸入的潛力。

未來(lái)如果能進(jìn)一步提升多模態(tài)理解和生成能力,將可以大幅推動(dòng)諸如機(jī)器人、自動(dòng)駕駛等多模態(tài) AI 應(yīng)用的發(fā)展。

項(xiàng)目網(wǎng)址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground

關(guān)鍵詞:

相關(guān)閱讀