Meta图像生成AI模型CM3leon已超越Google

AJun更新于 2023-07-17 17:09:46首发于 2023-07-17 17:09:46IT资讯346

Meta 日前推出了一款全新的生成型 AI 模型 — CM3leon（发音像变色龙 Chameleon），具备文本转成图像以及图像转成文本的能力。Meta 表示 CM3leon 是首个经由改良的纯文本语言模型配方进行训练的多模态模型，包含大规模检索增强的预训练阶段以及第二阶段的多任务监督微调（SFT）阶段。

根据 Meta 的说法，与以往的 Transformer-based 的方法相比，CM3leon 只需要五倍的计算能力和更小的训练数据集。

在与最广泛使用的图像生成基准（zero-shot MS-COCO）进行比较时，CM3leon 获得了 4.88 的 FID （Fréchet Inception Distance）得分，证实了其文本转图像技术超越了 Google 的文本转图像模型 Parti。

Meta图像生成AI模型CM3leon已超越Google