人工智能行业专题报告:从Sora看多模态大模型发展

目前除OpenAI之外,谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。

目前除OpenAI之外,谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。基于对Stable Video Diffusion、谷歌W.A.L.T以及其它文生视频模型的分析,我们认为高质量数据以及底层通用大模型是文生视频能力的重要决定因素,随着Transformer架构的引入,以及3D建模领域模型的迭代,2024年文生视频有望在时间长度、画面清晰度、内容逼真程度等方面实现显著迭代,打开商业化应用空间。

人工智能行业专题报告:从Sora看多模态大模型发展-第1张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第2张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第3张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第4张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第5张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第6张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第7张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第8张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第9张图片

人工智能行业专题报告:从Sora看多模态大模型发展-第10张图片

附件
【零帕6529】人工智能行业专题报告:从Sora看多模态大模型发展.pdf
application/pdf
20.41MB
43
下载文件
附件购买(促销中)
促销价:3.2 积分原价:4 积分

登录注册购买。 VIP权益 | 不支持浏览器清单

免责声明:本文来自浙商证券,著作权归作者所有,如有侵权请联系本平台处理。商业转载请联系作者获得授权,非商业转载请注明出处。内容投诉
零帕网 » 人工智能行业专题报告:从Sora看多模态大模型发展
您需要 登录账户 后才能发表评论

发表评论

欢迎 访客 发表评论