生成式人工智能圖像模型的列表還在不斷增長。
周一,人工智能公司Luma發布了其新的文本到圖像模型Photon。面向設計師和創意人員,該模型建立在Luma的Dream Machine視頻生成器之上,該生成器允許用戶從他們上傳的圖像中創建短視頻剪輯。
與Dream Machine一樣,Photon是為所有人設計的,目標受眾是那些“在我們周圍建造世界的人,從設計師、電影制作人、視覺思想家到小企業和教育工作者,”發布解釋說。這包括從時尚到架構的所有用例。
Photon具有多圖像輸出和清晰的文本渲染功能,基于Luma定制的通用變壓器架構,該公司聲稱該架構使其“比其他同類機型快800%,價格便宜”。與類似的生成器一樣,用戶可以在編輯和定制生成的圖像時調整提示。
Luma還宣布了一個Photon API,可能會在2024年底之前發布。可擴展的API將允許開發人員創建文本到圖像和圖像到圖像的內容。
a16z普通合伙人、Luma AI董事會成員Anjney Midha在新聞稿中表示:“Luma AI的真正魔力在于成為每個創作者獨特創意DNA的家園——他們的參考資料、風格和歷史——而Dream Machine則隨著每個用戶的創意旅程而學習和發展。”
Luma希望用戶將Dream Machine和Photon視為真正的創意合作伙伴,能夠理解用戶獨特的環境和需求。其中一個功能允許用戶上傳一個人的照片,并創建一個可重復使用的“角色”,光子可以在幾個單一的圖像場景中描繪——這是一個頭腦風暴活動的理想工具。用戶可以上傳該人的肖像,并在提示符中加上“@character”來激活該功能。
然而,在ZDNET的演示中,Photon似乎在某些位置的角色渲染自然表情方面存在一些問題,這立即引起了人們對深度偽造和其他潛在濫用的擔憂。
Luma的使用指南中有一個關于內容審核的說明,表明該公司將刪除某些生成的圖像。
值得注意的是,Luma表示,來自Photon的輸入和輸出數據不會用于訓練該公司的模型。在演示過程中,當被問及Luma的訓練數據集時,首席執行官Amit Jain表示,他無法透露其中包含的內容,以及它是否包含從互聯網上抓取的材料或授權內容。
就版權問題而言,指導方針有點模糊。該公司要求用戶“不要要求或生成侵犯版權或商標材料的內容”,并“始終尊重知識產權”。
最后,該公司還發布了Dream Machine的新界面,現在可以在網頁和iOS上使用。據該公司介紹,它可以與自然語言一起使用:不需要學習如何成為一名更好的提示工程師。
新界面易于使用,讓人想起其他生成器,這些生成器在提示符中識別關鍵描述符,并在您想修改想法或探索不同變體的情況下提供類似替代方案的下拉菜單。該服務面向任何想要探索設計概念,迭代產品想法,頭腦風暴以及通過Luma方便的情緒板基礎設施與團隊成員合作的用戶。
“視覺人工智能服務”還提供圖像和視頻的個性化功能,以及每月10美元起的免費和付費訂閱。