文生视频落地加速,用AI生成虚拟人视频只需百元了

自AI爆火以来,技术取代人类劳动力的讨论就不绝于耳。如今这样的现实确实在发生——企业用一套AI工具生成3D虚拟人视频,比采用人工制作的成本要低上20倍。

实践者之一来自于金融行业。东吴证券每天需要更新大量资讯类视频,平均每天产出一条热门板块点评、大盘回顾、财经早报等等。类比同类券商,其使用模版的价格达到平均每条2000元,定制一条则需2到3万元。使用魔珐科技的文生视频产品“有言”后,东吴证券生产一条2分钟的视频,成本可以降到百元左右。

图像_2024-05-16_201525646.png

在一些公司喊出“追赶Sora”的口号时,另一些从应用出发做产品的国内公司,开始探索自己的AIGC路径,上述案例就此诞生。

魔珐科技专注于3D虚拟人业务,超写实国风虚拟人“翎Ling”就出自该公司之手。公司创始人兼CEO柴金祥毕业于美国卡内基梅隆大学人工智能&机器人学专业,是计算机视觉、计算机图形学以及智能交互领域的专家。此前魔珐科技已经搭建了3D虚拟人AIGC开放平台,今年3月,公司正式发布原生3D内容AIGC产品“有言”。

“有言”产出3D视频的流程是生成内容、编辑镜头和视频包装,通过AI手段,做到一键输出三维动画、三维超写实形象、三维运镜和声音等。据公司向界面新闻介绍,截至目前,该产品已积累了近50家公司的落地案例。

企业用“有言”来生产虚拟人视频的需求集中在营销、培训等不同的场景,但核心的诉求都围绕“降本增效”。例如东吴证券,除了用“有言”生产资讯播报类视频之外,还会在线下活动中使用3D虚拟人视频进行技术发布和路演,在提升宣传效果的同时,节省人工拍摄和准备的成本。

事实上,“有言”代表了一类国内科技公司探寻技术应用的方式:做低门槛产品,优先注重落地和可上手。而在文生视频领域,这和Sora的探索属于不同的路径。

柴金祥在接受界面新闻等媒体采访时表示,有言主打的是高效率、低门槛,希望在信息传达类场景中落地,例如产品发布、品牌宣传、新闻播报。其技术路径是AI生成3D内容,通过引擎的方式渲染出视频。

而Stable Diffusion、Runway、Pika和Sora属于另一类AI文生视频产品:用大量的视频数据训练大模型。Sora面世之时,行业对其的讨论就包含了应用上的质疑——它离真正的商业化落地还有些距离。

浙商证券也在研报中提出,对于业态更加复杂的长视频和游戏,受限于模型还无法准确理解因果关系及其他技术难点,现阶段Sora及同类产品或以提供美术灵感支持为主。

柴金祥解释称,Sora在一定程度上解决了时空的一致性,并且在时长上有了较大提升,但它走2D视频生成路线,更适合创意类视频生成,不适合“高信息密度”以及“内容需要精准控制”的视频内容。这是“有言”希望填补的场景。

而在具体实践中,有言的能力和当下企业的使用场景是否适配?

事实上,自虚拟人火爆之后,企业使用产品自己生成虚拟人视频的需求就一直存在,毕竟定制一个虚拟人需要付出的成本极高——根据不同的精细程度,需要花费几万到几十万不等的价格。

但过去的数据和技术能力不足。做超写实虚拟人时,魔珐科技服务了几百家B端(企业)客户,公司在这一过程中积累大量3D数据,凭借此逐步开发出AIGC产品,产出质量也有所提升。“坦白说,我们以前用纯手工做的,还没有现在AIGC的效果好。”柴金祥称。

目前,“有言”的应用集中在金融证券、3C家电、美妆快消和广电领域。对虚拟人视频的需求相对简单和规范化的客户,更愿意买单。

以海尔集团为例,过往企业采用图文剪辑或者真人拍摄的形式制作不同类型的视频,现在可以实现平均每天生产30多条视频,用于经销商培训、产品介绍等。美妆品牌自然堂使用“有言”生产大量种草视频、产品讲解视频以及内部培训视频,使用产品2周多,各部门的视频生产量达到数百支。

回到文生视频的大赛道上,其落地的潜力已经为外界认可。中信证券在研报中指出,在生成式AI的诸多发展方向中,文生图、文生视频有望率先迎来商业化落地。根据华泰证券研报,2023年实际诞生文生视频大模型达到数十个,全球用户数量超过百万级别。

这让市场竞争变得集中而激烈。国内公司多数在B端进行文生视频的商业化尝试,探索落地可能性。已在软件上布局的公司早就闻风而动,3月以来,一众创业公司也陆续收获融资。

但这些公司亦有不同的发力方向。如A股上市公司万兴科技瞄准泛娱乐垂直市场,发布的产品包含文生视频、视频AI配乐等,核心是以音视频生成式AI技术为基础的多媒体创作垂类大模型,落地领域集中在游戏和影视行业,将产品提供给B端企业。

创业公司也有各自的选择。文生视频AI公司爱诗科技在3月完成亿元级人民币A1轮融资,主要研发视频大模型和国民级AI应用,大规模的C端(消费者)应用是其努力的方向。

在3月12日完成新一轮数亿元融资的生数科技则用“两条腿走路”,一方面以API的形式向B端提供模型能力,另一方面也研发垂类应用产品,以订阅等形式推出AIGC平台。在推出B端服务后,今年魔珐科技同样要在“有言”的C端版本上加大投入。

长期来看,这些产品要面临的共同难题是盈利。即使上述路径已经有明确的落地案例,什么样的产品会最先成为商业化的排头兵,答案还未清晰。

柴金祥认为,到了产品化的阶段,所有的成本就是GPU的成本,无论服务C端消费者还是B端企业都一样。因此他认为,对所有的科技企业来说,最重要的是找到PMF(Product Market Fit,产品市场匹配度)和产品壁垒。