美图不想在文生视频领域和巨头们“硬碰硬”

6月12日，美图公司（01357.HK）一口气发布及更新了6款产品，包括美图云修V2、开拍V2、美图设计室V3、站酷设计服务、奇觅及MOKI，覆盖商业摄影、游戏营销、视频生成等多个领域。

MOKI是该公司新发布的AI短片创作平台，主要辅助创作者制作动画短片、网文短剧、故事绘本和MV。该平台将于7月31日推出。

据界面新闻了解，目前美图产品所需的AI模型能力，均由美图奇想大模型（MiracleVision）提供。该模型已迭代到V5版本，采用自研DiT技术架构，涵盖图像大模型、视频大模型、音频大模型和文本大模型。

美图公司创始人、董事长兼首席执行官吴欣鸿认为，AI应用将经历点、线、面三个阶段，美图正尝试把AI单点功能串联起来，以运用到电商、广告、游戏、影视、动漫等行业。例如在MOKI上，输入一个简单的故事剧本后，模型可将短片操作流程进行结构化拆解，然后生成短片。

这并非美图首创。早在今年2月，OpenAI发布的Sora便在文生视频领域掀起了一轮巨浪，此后有多家大模型相关公司跟进。但美图方面表示，用类似的文生视频模型辅助内容创作，故事成片难，可控性较差。

在吴欣鸿看来，文生视频领域涉及蒙太奇等多种剪辑效果，可控性远比时长更重要，它意味着AI需要完成各种各样的复杂工作。

文生视频的另一难题还在于，用户输入一整篇小作文才能输出短片，且要考虑场景、人物、运动轨迹以及各种精细化的视频内容呈现。但现实情况是，很多内容难以用文字去描述清楚。

即便Sora仍有种种不足，要在短期内追上它的技术能力和生成效果并不容易。对此，美团的策略是“不在模型侧一味硬碰硬”。

吴欣鸿指出，如果在文生视频领域“硬刚”，其竞争对手会是全球巨头。无论在资金投入还是算法层面，美图与巨头们都存在一定差距。但在应用层，该公司希望通过提供一站式的内容创作方案来抢占更多市场。

为了能更好地“控制”其应用，这家公司选择自研大模型。“如果我们用外部API或者开源大模型，很难在底层进行深度开发。 ”吴欣鸿向界面新闻表示，目前AI技术领先于AI应用，将AI概念转化为优秀产品的并不多。

不少大模型公司都在追求参数量、打榜，以证明自己的技术实力和资金投入，背后却是高昂的成本，以及由此带来的商业化挑战。

美图试图在投入和盈利之间寻求平衡。“搞模型军备竞赛不是美图的核心战略，我们会在保证应用竞争力的前提下，控制模型的投入。”他还强调，过去很长时间美图都是常年亏损，所以会更看重落地场景和商业模式。”

吴欣鸿认可“模型即应用是大趋势”，也注意到国内很多大模型公司都在往应用方向走，或快或慢。他相信应用会是十倍于模型本身的市场空间。

从此次发布的产品可知，这家公司有意回归最为熟悉的影像领域，且正在设法争取更多企业用户。

近年来，其曾做过多元化尝试，涉足手机制造、电子商务、金融科技等领域，但频频受挫。当下着力的AI应用，也同样面对来自字节跳动、腾讯、快手等大型互联网公司，以及新晋大模型独角兽们的围追堵截。

该公司2023年财报显示，其企业端业务收入为5.7亿元，占总营收的21%，消费端业务占比近50%，营收达13.3亿元。企业端要超过消费端营收，美图仍有很长的一段路要走。

截至6月12日收盘，美图公司收盘价为2.78港元，下跌9.74%，总市值126.08亿港元。

转载来源：界面新闻作者：陈振芳