AI画图进入淘汰赛,谷歌奋起直追推出Muse,有创业公司已破产
【ashkeling专稿,未经授权不得转载!】
ashkeling报道/AIGC可以算是过去一年来科技行业的大明星。近日,谷歌旗下的研究团队又发布了他们在AI绘画领域的全新工具“Muse”,并在项目的Github页面公布了该工具的成果和成绩,以及相关的论文。
图片来源:Muse官方github页面
作为AI领域的强势选手之一,谷歌在此之前就曾推出过类似的AI绘图工具,比如扩散模型的Imagen以及自回归模型的Parti,但在“Muse”上,谷歌似乎有一种“默秒全”的气势。
在该工具的官方页面,据团队介绍,“Muse”可以做到在FID(Fréchet inception distance,一种用于评估生成模型创建的图像质量的指标)评分优于Stable Diffusion、DALL-E 2,甚至是自家的Parti以及Imagen的同时,在速度和效率上,也远高于以上工具。
官方数据显示,在生成256×256的图片时,Parti和Imagen分别需要6.4秒和9.1秒,在生成512×512的图片时,Stable Diffusion 1.4需要3.7秒,但“Muse”却可以做到0.3秒就生成256×256的图片,512×512的图片也只需要1.3秒。
以下是同样的关键词,DALL-E 2、Imagen和Muse生成的图片对比:
该团队表示,效率上的提高主要由于与Imagen等离散模型相比,Muse使用离散标记(discrete tokens)并且需要更少的采样迭代,因此效率显著提高,与Parti等自回归模型相比,Muse使用了并行解码,因此效率更高。
除了又快又好,“Muse”通过预训练的大型语言模型,该AI还在画面中元素的空间关系、数量、位置、颜色、自定义元素的添加等方面,具有一定优势,而这对于传统的AI绘图而言并不算简单。而这种优势也让“Muse”在仅依靠文字的图像编辑方面,有了不错的表现。无论是否遮罩,无需额外的微调,谷歌的开发者实现了仅利用提示文本就在Muse里修改画面元素。
不过虽然“Muse”的表现至少从文本上来看是令人惊喜的,但当下在商业层面,AI绘图其实已经开始了第一轮的淘汰赛,已经有先驱者在该领域依旧狂热的时候,倒下了。
12月28日,业内最早的AI绘画平台之一StockAI发布公告称,该平台将于今年1月后正式关停,目前公司正在对付费用户根据其账户剩余时间等进行退款。据悉,该平台创立于2022年9月。
从一开始Stable Diffusion、DALL-E等工具的大火,再到包括QQ、抖音、百度、TikTok等平台纷纷发布相关工具或玩法功能,AI生成内容,特别是AI生成图片一时间可谓风头无两。
甚至就连资本也陆续入场,2022年10月中旬,人工智能公司Stability AI以及AIGC平台Jasper前后接连获投,融资金额达上亿美元,两家公司也先后成为该领域全新的独角兽。
但其实,AIGC平台以及相关业务对技术、硬件算力、数据的庞大需求,以及该业务在当下消费者市场几乎不存在的使用场景,对企业市场还不够成熟稳定低风险的状态,对于很多创业公司而言,并不算好消息,前者意味着前期庞大的投入,后者意味着短时间商业变现上难以解决的困难。
图片来源:Muse官方github页面
当然,对于谷歌这种巨头而言,这些都不算问题,因此它可以从Imagen、Parti到自己打败自己的Muse不断尝试,不用担心商业化的苦恼,只为在AI革命中拔得头筹。相反,被ChatGPT等AI工具替代才是这家巨头的燃眉之急。
虽然现在ChatGPT等工具,由于风控等原因往往不能联网、及时更新数据、很多回答也都有瑕疵,但包括微软等公司,其实都正在试图利用AI工具,扩大自家搜索引擎(比如Bing)、广告等业务的竞争力。
如若转载,请注明出处:http://www.ashkeling.com/2023/01/507514