目前除OpenAI之外,谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。基于对Stable Video Diffusion、谷歌W.A.L.T以及其它文生视频模型的分析,我们认为高质量数据以及底层通用大模型是文生视频能力的重要决定因素,随着Transformer架构的引入,以及3D建模领域模型的迭代,2024年文生视频有望在时间长度、画面清晰度、内容逼真程度等方面实现显著迭代,打开商业化应用空间。
AI 跃升至 2.0 时代,随着大模型进入“轻量化”、“多模态”时代,以云端作为 AI 大脑,边缘端和终端作为小脑的混合 AI 料将成为技术发展主线。我们认为,AI 大模型落地成为终端出货成长的新动能,产业曲线两端将率先发力,其中硬件算力端(SoC、存储)、终端品牌将有望核心受益,零组件及组装中部分环节如传感器、电池、散热结构件等部分有望受益。我们认为当前各类 AI终端应用仍未达到成熟阶段,接下来一年重在软硬件适配和产品打磨,从“AI+产品”(出货量提升)到“产品 AI 化”(量价齐升),有望成