ob电竞·(中国)电子竞技平台

【ashkeling专稿，未经授权不得转载！】

ashkeling报道/AIGC可以算是过去一年来科技行业的大明星。近日，谷歌旗下的研究团队又发布了他们在AI绘画领域的全新工具“Muse”，并在项目的Github页面公布了该工具的成果和成绩，以及相关的论文。

图片来源：Muse官方github页面

作为AI领域的强势选手之一，谷歌在此之前就曾推出过类似的AI绘图工具，比如扩散模型的Imagen以及自回归模型的Parti，但在“Muse”上，谷歌似乎有一种“默秒全”的气势。

在该工具的官方页面，据团队介绍，“Muse”可以做到在FID（Fréchet inception distance，一种用于评估生成模型创建的图像质量的指标）评分优于Stable Diffusion、DALL-E 2，甚至是自家的Parti以及Imagen的同时，在速度和效率上，也远高于以上工具。

官方数据显示，在生成256×256的图片时，Parti和Imagen分别需要6.4秒和9.1秒，在生成512×512的图片时，Stable Diffusion 1.4需要3.7秒，但“Muse”却可以做到0.3秒就生成256×256的图片，512×512的图片也只需要1.3秒。

以下是同样的关键词，DALL-E 2、Imagen和Muse生成的图片对比：

该团队表示，效率上的提高主要由于与Imagen等离散模型相比，Muse使用离散标记（discrete tokens）并且需要更少的采样迭代，因此效率显著提高，与Parti等自回归模型相比，Muse使用了并行解码，因此效率更高。

除了又快又好，“Muse”通过预训练的大型语言模型，该AI还在画面中元素的空间关系、数量、位置、颜色、自定义元素的添加等方面，具有一定优势，而这对于传统的AI绘图而言并不算简单。而这种优势也让“Muse”在仅依靠文字的图像编辑方面，有了不错的表现。无论是否遮罩，无需额外的微调，谷歌的开发者实现了仅利用提示文本就在Muse里修改画面元素。

不过虽然“Muse”的表现至少从文本上来看是令人惊喜的，但当下在商业层面，AI绘图其实已经开始了第一轮的淘汰赛，已经有先驱者在该领域依旧狂热的时候，倒下了。

12月28日，业内最早的AI绘画平台之一StockAI发布公告称，该平台将于今年1月后正式关停，目前公司正在对付费用户根据其账户剩余时间等进行退款。据悉，该平台创立于2022年9月。

从一开始Stable Diffusion、DALL-E等工具的大火，再到包括QQ、抖音、百度、TikTok等平台纷纷发布相关工具或玩法功能，AI生成内容，特别是AI生成图片一时间可谓风头无两。

甚至就连资本也陆续入场，2022年10月中旬，人工智能公司Stability AI以及AIGC平台Jasper前后接连获投，融资金额达上亿美元，两家公司也先后成为该领域全新的独角兽。

但其实，AIGC平台以及相关业务对技术、硬件算力、数据的庞大需求，以及该业务在当下消费者市场几乎不存在的使用场景，对企业市场还不够成熟稳定低风险的状态，对于很多创业公司而言，并不算好消息，前者意味着前期庞大的投入，后者意味着短时间商业变现上难以解决的困难。

图片来源：Muse官方github页面

当然，对于谷歌这种巨头而言，这些都不算问题，因此它可以从Imagen、Parti到自己打败自己的Muse不断尝试，不用担心商业化的苦恼，只为在AI革命中拔得头筹。相反，被ChatGPT等AI工具替代才是这家巨头的燃眉之急。

虽然现在ChatGPT等工具，由于风控等原因往往不能联网、及时更新数据、很多回答也都有瑕疵，但包括微软等公司，其实都正在试图利用AI工具，扩大自家搜索引擎（比如Bing）、广告等业务的竞争力。

如若转载，请注明出处：http://www.ashkeling.com/2023/01/507514

ob电竞·(中国)电子竞技平台

AI画图进入淘汰赛，谷歌奋起直追推出Muse，有创业公司已破产

相关推荐