6月12日,美图公司(01357.HK)一口气发布及更新了6款产品,包括美图云修V2、开拍V2、美图设计室V3、站酷设计服务、奇觅及MOKI,覆盖商业摄影、游戏营销、视频生成等多个领域。
MOKI是该公司新发布的AI短片创作平台,主要辅助创作者制作动画短片、网文短剧、故事绘本和MV。该平台将于7月31日推出。
据界面新闻了解,目前美图产品所需的AI模型能力,均由美图奇想大模型(MiracleVision)提供。该模型已迭代到V5版本,采用自研DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型。
美图公司创始人、董事长兼首席执行官吴欣鸿认为,AI应用将经历点、线、面三个阶段,美图正尝试把AI单点功能串联起来,以运用到电商、广告、游戏、影视、动漫等行业。 例如在MOKI上,输入一个简单的故事剧本后,模型可将短片操作流程进行结构化拆解,然后生成短片。
这并非美图首创。早在今年2月,OpenAI发布的Sora便在文生视频领域掀起了一轮巨浪,此后有多家大模型相关公司跟进。但美图方面表示,用类似的文生视频模型辅助内容创作,故事成片难,可控性较差。
在吴欣鸿看来,文生视频领域涉及蒙太奇等多种剪辑效果,可控性远比时长更重要,它意味着AI需要完成各种各样的复杂工作。
文生视频的另一难题还在于,用户输入一整篇小作文才能输出短片,且要考虑场景、人物、运动轨迹以及各种精细化的视频内容呈现。但现实情况是,很多内容难以用文字去描述清楚。
即便Sora仍有种种不足,要在短期内追上它的技术能力和生成效果并不容易。对此,美团的策略是“不在模型侧一味硬碰硬”。
吴欣鸿指出,如果在文生视频领域“硬刚”,其竞争对手会是全球巨头。无论在资金投入还是算法层面,美图与巨头们都存在一定差距。但在应用层,该公司希望通过提供一站式的内容创作方案来抢占更多市场。
为了能更好地“控制”其应用,这家公司选择自研大模型。“如果我们用外部API或者开源大模型,很难在底层进行深度开发。 ”吴欣鸿向界面新闻表示,目前AI技术领先于AI应用,将AI概念转化为优秀产品的并不多。
不少大模型公司都在追求参数量、打榜,以证明自己的技术实力和资金投入,背后却是高昂的成本,以及由此带来的商业化挑战。
美图试图在投入和盈利之间寻求平衡。“搞模型军备竞赛不是美图的核心战略,我们会在保证应用竞争力的前提下,控制模型的投入。”他还强调,过去很长时间美图都是常年亏损,所以会更看重落地场景和商业模式。”
吴欣鸿认可“模型即应用是大趋势”,也注意到国内很多大模型公司都在往应用方向走,或快或慢。他相信应用会是十倍于模型本身的市场空间。
从此次发布的产品可知,这家公司有意回归最为熟悉的影像领域,且正在设法争取更多企业用户。
近年来,其曾做过多元化尝试,涉足手机制造、电子商务、金融科技等领域,但频频受挫。当下着力的AI应用,也同样面对来自字节跳动、腾讯、快手等大型互联网公司,以及新晋大模型独角兽们的围追堵截。
该公司2023年财报显示,其企业端业务收入为5.7亿元,占总营收的21%,消费端业务占比近50%,营收达13.3亿元。企业端要超过消费端营收,美图仍有很长的一段路要走。
截至6月12日收盘,美图公司收盘价为2.78港元,下跌9.74%,总市值126.08亿港元。
转载来源:界面新闻 作者:陈振芳