来自美国的Kevin Stratvert是一名全职博主,主要创作知识型视频,目前在视频分享网站YouTube上拥有超过300万的订阅者。
此前在硅谷科技大厂工作的经历,让Kevin Stratvert学会了如何在创作过程中利用生产力工具。两年前,他接触到一款名叫Wondershare Filmora(下称“Filmora”)的多功能编辑软件,并基于该应用创作出了一系列具有独特创意的视频内容,至今累计播放量已达数百万次。
Filmora打动Kevin Stratvert的点在于,它简便且智能化。像AI音频重组的功能,早在2023年新一波AIGC(生成式人工智能)浪潮来临之前,该视频编辑软件就已有体现。加之去年末的版本更新迭代,Kevin Stratvert觉得该应用的AI功能变得更全面了。
他以AI文字快剪功能为例告诉经济观察报,用户不再需要一遍一遍拉片找剪辑点,简单地编辑文字后,应用中的创作助手Copilot(人工智能助手)就能帮助他进行视频的初步剪辑。
Filmora由深圳企业万兴科技(300624.SZ)开发。该企业在成立之初便选择面向海外市场,除了开发视频领域的创意软件,在视频创意素材平台、绘图创意和文档创意软件等领域也有布局。目前,包含国内版本万兴喵影在内,Filmora在全球累计约有1亿用户。
今年2月15日,美国AI企业OpenAI推出文生视频大模型Sora,宣布可以生成长达60秒的视频。半个月之前,万兴科技自研的音视频多媒体大模型“天幕”也已通过算法备案,面向全球市场发布了视频一键生成以及3D场景生成等模型能力。
与Sora至今未开放测试不同,“天幕”相关AI视频生成的能力已经在Filmora 13等产品上实现落地应用。“未来,在视频领域,一定是应用带动大模型发展。”万兴科技创始人兼董事长吴太兵将大模型赋能比作“组装车间”,大模型更多是用来生成视频的原材料,仅靠模型能力较难生产出视频成品,后续还需要视频编辑对原材料进行组装加工。
与一些短视频巨头平台在纵向思维下孵化视频编辑应用、寄希望其发展成创作者的超级工具不同,万兴科技以横向思维开发Filmora,“做一个公共的工具软件,为各个平台上的创作者提供资源、素材、AI能力等”。吴太兵为Filmora设定了AI化演进的目标,即进一步降低视频创作门槛,提升视频创作效率,为全球的创作者提供数字化、智能化的创意赋能。
发力AI
今年4月,美国软件公司Adobe进行了视频剪辑应用Premier Pro的概念演示,在主镜头之外集成了一段AI生成的辅助镜头。此后,Runway、Pika等AI视频应用纷纷对外演示了各自在镜头生成方面的落地能力。
彼时,市场上有一种判断,视频剪辑工作流将在2024年进入AI时代。实际上,万兴科技2023年就让旗下的Filmora在创新视频创作的AI工作流方面展开摸索。
自2010年诞生以来,Filmora每年都会发布一个新版本。2023年演进至13代时,Filmora上线了AI文本成片、AI音乐生成器、AI文字快剪、AI智能遮罩等功能,并在应用中内建了AI机器人Copilot。无论新手还是专业级创作者,都可以通过向创作助手发问,调用出想要的功能,按需求执行。
从分析影片内容、给出建议、理解创作者需求,到提供即时的剪辑意见,进而帮助创作者完成高点击率或浏览量的视频影片,Filmora的AI体验不只服务于Kevin Stratvert这样的海外用户,国内用户也可以在万兴喵影中调出文字快剪,他们不需要花时间学习剪辑等界面操作,而是像编辑文本一样完成视频剪辑。
相对Premiere这种专业视频编辑软件,AI加持下的Filmora操作简单,同时也支持多种效果。
吴太兵告诉经济观察报,Filmora的客户群体以KOL(关键意见领袖)为主,他们靠流量挣钱,需要专业化工具去快速生产各类视频,但又不希望工具太过复杂。Filmora切中了痛点。
吴太兵一直认为,工具变得智能,不会对内容创作者产生取代的危机。内容创作者用好AI这个工具,不仅能够降本增效,还可以打破语言障碍,使创作的内容能够参与全球化交流。
经济观察报了解到,目前该应用的服务面向全球,针对不同区域的用户,该应用会在产品语言、营销推广等方面做到本地化适配。
吴太兵以AI翻译功能举例称,在STT(语音转文本)、TTS(文字转语音)的能力基础上,Filmora会针对不同地区用户的音色偏好,提供不同的音色,还会在圣诞节、开斋节等节日,有针对性地在相应地区上线资源素材。
“无中生有”
在与吴太兵对话的当天,万兴科技发布了一个与节气相关的影视短片。这个2分钟的视频,从原始素材到成片都是由AI生成的。
以往,AI视频的创作多基于人为拍摄的视频素材,进行训练后再给到创作者,供后者基于训练后的视频内容进行二次加工。“现在不需要了,(视频)可以‘无中生有’。”吴太兵说这件事能实现的背后,是万兴科技自研的音视频多媒体大模型“天幕”在提供支持。
相较Sora偏向场景的内容生成,吴太兵说,Filmora是结合AI脚本生成和理解的能力,实现完整故事或多种镜头角度的生成,基于“天幕”的模型能力为视频生成配乐,实现一键创建完整视频的过程。
在音视频领域深耕20多年的吴太兵,按照Photo2VCD、Filmora、“天幕”大模型等万兴科技的主力产品,将公司的发展历程划分为三个阶段。2002年,他希望把数码相机里的照片刻进VCD光盘,寄回给老家的父母看,从而研发了Photo2VCD。当时,国外市场的数码相机普及率更高,该产品在2003年打向海外后,他一年就赚到了100万美元。
从Photo2VCD到Filmora,吴太兵认为这既是视频内容互联网化后的自然结果,也是万兴科技抓住技术在视频生产、输出和分享等整个产业链中演进的机会。大量的非专业设计师有在社交媒体、视频网站进行视频创作和发布的需求。
“没有人想经历3—6个月培训去学会一个方法。”吴太兵说。
从万兴科技的财报看,2023年该公司视频创意产品线实现营业收入9.61亿元,同比增长28.91%,在总收入中的占比增至65%。
过去,用户进行视频创作时,需要有内容、素材做底。万兴科技意识到,还有很多没有素材的用户,也想利用工具进行视频创作。因此,Filmora既要赋能创作流程的内容生成、音视频剪辑,也要实现整个交互方式的AIGC化。
在OpenAI推出对话大模型产品ChatGPT之后的一年多时间里,大模型的数量在全球呈现井喷式增长。吴太兵在今年5月时估算,仅国内厂商就发布了近240个大模型。他认为,大模型在文本和图像领域已经实现了相当成熟的生产力商用。图文模型较为成熟的阶段来临,这在一定程度上意味着,大模型将加速进入以音视频多媒体为载体的2.0时代。
吴太兵的判断依据来自一项市场调研:2022年以来,82%以上的互联网流量集中于视频,全球日均有200亿次以上的视频播放次数,30亿小时以上的视频播放时长以及超3亿的视频创作者。
尽管视频传输的需求量巨大,可现实的另一面是视频相关的模型只占少部分,且面临数据集欠缺、算力成本高、生产效果不佳等问题。在吴太兵看来,市面上现有的模型既无法满足用户需求,也不适用于万兴科技旗下包括Filmora在内的产品的演进。
目前,万兴科技已拥有一支上百人的研发团队,从架构、算法、工程落地等多个维度入手,展开“天幕”大模型的研发。“你永远不要期望一个大模型可以做任何事情。”吴太兵称,万兴科技也和国内外不少大模型厂商合作。但根据自身“具备组装意义的视频创作软件”的AI需求,万兴科技还是踏上了自研音视频大模型之路。
研发
吴太兵说,万兴科技在研发端一直保持“压强式投入”,2023年研发投入在整体营收中的占比超27%,达4.03亿元。与一些软件公司以销售人员为主不同,万兴科技的研发人员占比达到56%。
“我们最后是靠规模取胜的公司。”吴太兵不是一位会带着产品去和客户洽谈的老板。在他看来,如果需要他亲自销售,这个产品的定位一定出了问题。吴太兵对自己的定位是:比起关注单个产品,更关注创造产品的人。
“有好的人才有好的产品,同理,好的产品自然能吸引到更多优秀的人。”吴太兵称,万兴科技有专门的产品、投资、分析等部门,内部鼓励产品负责人等提出创意。经过该公司的创新创业大赛选拔、评审通过后,相关员工就可以成立工作室,招人组队。员工还可以成立新的事业部或者子公司,万兴科技会帮助他们实现平台化创业。
这个策略在万兴科技已经实施了6年,每年都有不少新产品的点子被发现。“这个行业变化很快,团队必须快速锁定新的机会。”吴太兵说万兴科技的发展,只靠他一个人是不行的,他要求全员都要保持创业心态。
对内孵化的同时,万兴科技对外相继完成了对国内绘图创意软件龙头亿图软件、在线原型设计软件与协作平台墨刀以及移动视频创意软件格像科技的战略控股,还与华为、马投算力等合力解决算力难题,与中广天择等进行算料合作。与此同时,为加码AI产业生态建设,万兴科技还与微软、阿里巴巴、湘江实验室等海内外企业及科研机构开展合作。
即便是微软这样的硅谷大厂,多年来也在尝试使用视频编辑产品,直到使用过Filmora,其内部共享视频的速度和效率才实现了提升。
吴太兵称,万兴科技过去的打法是“先往上走”,让Filmora等产品在欧美以及日本等主流市场抢占市场份额,之后才是“往下走”。目前,东南亚、非洲等区域的发展中国家还不是万兴科技的重点市场,但未来会有所调整。
往发达国家走还是往发展中国家走,在吴太兵看来,这将是两种不同的路径。吴太兵不建议当下谋划出海的中国企业,同时走这两条路径。另外,看到很多出海公司将生产、研发等多个环节仍放在国内,只是将产品推向海外,吴太兵认为这在万兴科技所处的行业里行不通。
中国化
“我们不是整合中国资源去服务海外市场。”吴太兵一直强调万兴科技在做的事情是整合全球资源,服务全球市场。这个过程中,企业面临的最大难点是需要具有全球化视野的团队,并尽可能借助各国各地区的本地团队资源,去做产品及市场的洞察、推广,乃至合规化的后期运营。
在织就全球化网络的过程中,吴太兵对使用本地团队有着自己的思考:把各区域市场当作风筝,自己手里握着的那根绳子是中国化。
在他看来,对一家根在中国、市场布局全球化的企业来说,若不了解中国在全球化市场中拥有怎样的资源优势,盲目地进行全球化布局,多半会以失败告终。
在海外市场具备拓展经验和商业模式的万兴科技,回归中国市场已有7年时间。吴太兵觉得应该面向B端(企业端)提供定制化产品和服务,而切中C端(消费端)用户的,往往是万兴喵影能否具备方便快捷的使用体验,这背后考验的都是Filmora在AI方面的集成能力。
吴太兵把大模型类比为发电厂,他预判未来在大模型之上会长出更多应用,一个可以想象的AIGC软件生态是若干大模型叠加海量的小应用。因此,在万兴科技的“天幕”大模型基础上,Filmora等应用将被快速开发和迭代上线。
近期,Filmora又推出了声音复刻、文生贴纸等AI功能,用户录制5秒以上的自有声音,就可以完成音色训练。产品不但支持16种语言,还能将用户的语气、腔调、情绪等元素进行克隆。
目前,不少模型厂商在发力垂直应用,但吴太兵发现,大多数企业的出发点是围绕其生态去做,每家企业的基因会有所区别。万兴科技开发Filmora始终落在内容创作层面,应用设计的初衷是发挥创作者本身的积极性,以产品和服务思维赋能他们。
提及视频创意应用市场的整体想象力,吴太兵给出了一个数字:可能有100亿美元,这与巨头一年几千亿美元营收的市场规模无法比拟。但对于AI视频应用的未来机会,美国风险投资公司SignalFire却给出了这样的预测数据:2026年全球创作者经济市场规模将有望突破2000亿美元。Gartner也预测2030年90%的数字内容都将是由AI生成的。