新闻详细
新闻当前位置:新闻详细

智谱AI入局AI生成视频,旗下智谱清言APP上线清影(Ying)

转载:https://ai.zol.com.cn/886/8869847.html

2024-07-26 11:44:48·[??中关村在线 原创??]·作者:肖医

7月26日,智谱AI旗下“智谱清言”App正式上线了AI视频生成功能“清影(Ying)”,支持文生视频、图生视频。


图源:网络

据了解,AI生成视频模型清影(Ying)正式上线智谱清言,生成6秒视频只需要30秒的时间。即日起所有C端用户,都能通过清影(Ying)体验到AI文生视频、图生视频能力。

张鹏表示,这次生成式视频能力的全面上线,为的是让大家都能体验生成式视频功能,希望能够听到大家的意见和反馈。未来,智谱AI将采用快速迭代的方式,不断提升生成式视频模型能力。

当然,在生成式视频模型的研发中,Scaling Law继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的scaling方式。”张鹏表示:“随着算法、数据不断迭代,相信Scaling Law将继续发挥强大威力。”

本次清影(Ying)底座的视频生成模型是CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX相比前代(CogVideo)推理速度提升了6倍。理论上,模型侧生成6秒视频仅需30秒时间。


图源:网络

智谱自研了一个端到端视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述,这样可以增强模型的文本理解和指令遵循能力,使得生成的视频更符合用户的输入,能够理解超长复杂prompt指令。

在内容连贯性上,智谱AI自研高效三维变分自编码器结构(3D VAE),将原视频空间压缩至2%大小,配合3D RoPE位置编码模块,更有利于在时间维度上捕捉帧间关系,建立起视频中的长程依赖。

CogVideoX模型亦同步上线智谱AI大模型开放平台 bigmodel.cn,开发者可以通过调用API的方式,体验和使用文生视频以及图生视频的模型能力,在国内尚属首次。

本文属于原创文章,如若转载,请注明来源:智谱AI入局AI生成视频,旗下智谱清言APP上线清影(Ying)https://ai.zol.com.cn/886/8869847.html

Copyright2023未知同城服务科技