發布時間:2024-08-19 18:26:07 來源:本站 作者:admin
谷歌向美國用戶發布了其文本轉圖像人工智能模型 Imagen 3 的最新版本。該人工智能模型承諾比其前身有顯著改進,并被稱為該科技巨頭提供的“最高質量的文本轉圖像模型”。
Imagen 3 可通過 Google 的 AI Test Kitchen 訪問,旨在生成具有增強細節和更逼真光線的圖像。
通過完善其人工智能功能,谷歌旨在提供更令人印象深刻、更具視覺吸引力的圖像創作。
“我們推出了 Imagen 3,這是一種潛在擴散模型,可根據文本提示生成高質量圖像。我們描述了我們的質量和責任評估。在評估時,Imagen 3 優于其他最先進 (SOTA) 模型。此外,我們還討論了安全性和代表性問題,以及我們用來最大限度減少模型潛在危害的方法,”該公司在上周的一份研究論文中表示。
Imagen 3 將提供多個版本,每個版本針對不同類型的任務進行優化,從生成快速草圖到高分辨率圖像。
“Imagen 3 是我們最高質量的文本轉圖像模型,能夠生成比我們之前的模型更精細、光線更豐富、干擾更少的圖像。我們顯著提高了 Imagen 3 理解提示的能力,這有助于模型生成廣泛的視覺風格,并從較長的提示中捕捉到小細節,”谷歌在今年的 Google I/O 大會上推出 Imagen-3 模型時這樣說道。
如何訪問 Imagen-3
如果您居住在美國,您可以通過 ImageFX 和 Vertex AI 訪問 Imagen 3。居住在美國以外的人可以使用此鏈接注冊。您的電子郵件將被添加到等候名單中,當 AI 模型在您所在的國家/地區可用時,您將獲得訪問權限。
谷歌暫停了 Gemini 聊天機器人的圖像生成
今年早些時候,Google Gemini Al 聊天機器人創建了與事實不符的圖像。Google 承認存在問題,導致其圖像生成功能暫時中止。Google 首席執行官 Sundar Pichai 還表示,公司正在從頭開始開發該功能并修復這些問題。