發布時間:2024-09-13 12:39:02 來源:本站 作者:admin
總部位于巴黎的人工智能初創公司 Mistral AI 推出了其首個多模態模型 Pixtral 12B。該模型旨在處理文本和圖像,標志著該公司取得了顯著的進步。
Pixtral 12B 概述
Pixtral 12B 在 Mistral 之前的文本模型 Nemo 12B 的基礎上添加了一個 4 億參數的視覺適配器。使用增強功能可以通過 URL 或文本中的 base64 編碼進行圖像處理。它擁有 120 億個參數,大小約為 24GB,可以執行圖像字幕和對象識別等任務。
在功能方面,Pixtral 12B 與其他多模態模型(如 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4)并駕齊驅。它旨在在圖像分析任務中表現出色,包括生成字幕、識別對象和回答與圖像相關的問題。
訪問和許可
開發人員可以通過 GitHub 和 Hugging Face 平臺上的種子鏈接獲取 Pixtral 12B。它根據 Apache 2.0 許可證分發,允許不受限制地使用和定制。開源策略旨在促進廣泛采用和修改。
雖然 Mistral 沒有指定用于訓練 Pixtral 12B 的確切數據集,但生成式 AI 模型利用大量公開可用的數據是很常見的。Mistral 的方法引發了法律爭論,特別是圍繞版權材料的使用。一些人聲稱公共數據抓取屬于“合理使用”,這一觀點仍然存在爭議,并導致了涉及知名 AI 公司的法律糾紛。
Mistral 最近獲得了由 General Catalyst 牽頭的 6.45 億美元融資,目前估值為 60 億美元。該公司部分由微軟擁有,旨在成為 OpenAI 的歐洲替代品。Mistral 的戰略包括免費提供開放模型,同時將托管版本和咨詢服務貨幣化。
此次合作標志著微軟邁出了重要的一步,因為它正尋求擴展其 AI 產品,讓 Azure AI 客戶能夠訪問 Mistral AI 開發的大型語言模型。此次合作始于將 Mistral 的大型語言模型 (LLM) 集成到 Azure AI 服務中,現在,Mistral 小型 LLM 也已向客戶開放。