MobileCLIP2是其改善多模態強化練習方法后的晉級版模型。可擴展到新的模態或數據域
。視頻等視覺內容相關的文本描繪信息。

圖畫分類基準數據集ImageNet-1k上的基準測驗成果
MobileCLIP2系列模型在不同推遲條件下,邊沿設備上布置,MobileCLIP2-B在圖畫分類基準數據集ImageNet-1k上的零樣本準確率進步了2.2%
。分類,
與此一起,準確性的功能。一起最大極限下降練習或推理過程中的核算開支。DFN2B-CLIP-ViT-L-14和DFN2B-CLIP-ViT-L-14-s39b的組合構成了教師集成的主干。現在