基于对人形机器人发展阶段及核心竞争力的分析,我们认为人形机器人已经跨入了一个全新的软件定义加 AI 驱动的时代。软件不仅承载着人形机器人的基础操作系统和应用算法,而且通过不断迭代升级,为人形机器人赋予了超越传统机械设备的智能特性。软件和 AI 不仅开启了人形机器人在各行各业广泛应用的可能性,更定义了人形机器人的功能边界。
AI 存储路线图:更大容量、更大带宽、更低功耗。随着人工智能的快速发展,大模型的参数量指数级增长,不仅推升了处理器的算力需求,同时也对与处理器匹配的内存系统提出了更高的要求。一方面,大量模型数据的传输要求更大的内存带宽,以缓解“内存墙”问题,提升 HPC 系统计算效率;另一方面,内存系统的容量需要大幅拓展,以存储千亿参数乃至更大规模的大模型。
基础能力测试:混元 VS Claude 3 VS Mistral1、数学能力: Claude 3 >混元 > Mistral。测试3道高数题、1道线代题、1道概率题,Claude 3 正确率为80%,混元正确率为60%,Mistral 正确率为40%。2、编程能力:混元 >Claude 3 👍istral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude 和 Mistral 均为40%,
奥比中光是国内首批消费级 3D 视觉厂商,公司经过多年高投入,实现 3D 视觉全技术路径布局,并完成“芯片-算法-器件-整机-量产”的全链覆盖。得益于全栈的技术路径布局和规模化量产能力,公司已和英伟达、微软、蚂蚁、银联、OPPO、优必选、斯坦德、创想三维等各行业头部企业达成合作。但受制于消费级 3D 视觉行业处于起步初期,下游需求不稳定,公司近 5 年营收有所波动,2023 年为 3.62 亿元(yoy+3.34%)。
AR 采用 OST 方式将数据直接叠加于现实世界,交互及融合感更自然。AR眼镜的微显示屏与光学方案是当前产业链发展的关键。光学方案中,光波导为当前主流,表面浮雕光栅衍射光波导依靠微纳制造,我们认为光栅设计/光栅母版加工/纳米压印三大技术决定波导性能,关注纳米压印设备精度及效率提升。显示方案中,Micro LED 具有低功耗、高亮度等优势适配光波导方案,有望成为 AR 眼镜微显示器的最优选择。Micro LED 当前需克服巨量转移和全彩显示两大难题,后续关注激光巨量转移设备在 Micro LED
伴随人工智能技术的加速演进,AI 大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。近年来,我国高度重视人工智能的发展,将其上升为国家战略,出台一系列扶持政策和规划,为 AI 大模型产业发展创造了良好的环境。当前,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型产业的应用落地将进一步提速。作为新一代人工智能产业的核心驱动力,AI 大模型广泛赋能我国经济社会的多个领域,打开迈向通用人工智能的大门,推动新一轮的科技革命与产业变革。在大模型盛行的时
OpenAI 推出文生视频模型 Sora,人工智能赋能短视频应用发展超预期。从全球角度看,OpenAI Sora 的发布,使得 ChatGPT 从文字、图片层面正式向成熟短视频层面进行演进,可生成最长 60 秒的全动态视频,具备了创建复杂场景和多人物角色的能力,一经发布业界就引起较大轰动。Sora 本质上基于“Transformer+Diffusion”,属于 GPT 的延申,代表了人工智能应用的进一步尝试,让世界看到了 AI 行业的更多可能,随着全球对 AI 的热衷程度不断提高,未来全球 AI
Sora 是第一个表现出"涌现"能力的视频生成模型:随着模型规模增大而出现“理解世界”的能力。虽然许多 LLM,如ChatGPT 和 GPT-4,表现出涌现能力,但在 Sora 出现之前,展示类似能力的视觉模型一直很少。根据 Sora 的技术报告,它是第一个表现出确认的涌现能力的视觉模型,标志着计算机视觉领域的一个重要里程碑。
人形机器人产业链催化不断。根据擎天柱首席工程师 Milan Kovac,目前擎天柱行走速度约为 0.6 米/秒,速度与此前相比提高了 30%。通过改进前庭系统、脚部轨迹,以及地面接触逻辑,并升级运动规划器,缩短整个机器人的环路延迟,擎天柱整体行走稳定性和自信程度都有所提升,转弯表现也十分优异。研究团队还为其添加了一些躯干和手臂的摇摆动作,使行走更加自然。此外,英伟达将成立 GEAR 研究小组,由高级科学家 Jim Fan 领衔,专注于通用具身智能体的研究。我们认为人形机器人是 AGI 具身智能的
Will generative AI (gen AI) be the greatest, most impactful technology innovation in history? Will it completely transform how humans live and work? Or will it turn out to be just another technology du jour that promised revolutionary change but ulti
目前除OpenAI之外,谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。基于对Stable Video Diffusion、谷歌W.A.L.T以及其它文生视频模型的分析,我们认为高质量数据以及底层通用大模型是文生视频能力的重要决定因素,随着Transformer架构的引入,以及3D建模领域模型的迭代,2024年文生视频有望在时间长度、画面清晰度、内容逼真程度等方面实现显著迭代,打开商业化应用空间。
AI 模型工具化程度提升,即将带来应用端百花齐放。基础模型持续迭代,模型能力提升,开发门槛及使用成本下降。GPT-4、Gemini、Pika 均支持自然语言,无需编程基础,如使用 GPT-4 构建自定义 GPT 时无需任何代码,全程支持可视化点击操作以及自然语言;GPT Store 已上线。使用成本上,Open AI 产品系统性降价;Gemini Pro 可在 Brad 上免费体验,Pika 目前为免费使用。随着垂类模型训练门槛的降低,我们认为数据和场景为 AI 应用竞争的壁垒所在。每一轮硬件或
我们认为 1) 全球科技产业的 AI 化,和 2)中国企业的出海,3)国内 IT 产业的国产化是 2024 年中国科技行业投资的三条主线。建议投资人关注,(1)微软 Copilot 用户数,(2)AI PC 渗透率,(3)小米、华为汽车销量,(4)国内主要半导体制造企业 2024 年资本开支计划,(5)Vision Pro 等新品类用户反馈,(6)比特币价格走势等指标。
AI+硬件:高性能处理器加码,AI 终端时代来临。英伟达、AMD、高通分别推出 GeForce RTX 40 SUPER 系列、锐龙 8000G 系列、骁龙 XR2+ Gen 2 等高性能处理器,性能水平实现跃升,助力 AI 加速渗透 PC、汽车、智能家居等终端场景。我们看到,三星大力布局人车互联生态;英特尔在发布 AI PC平台的同时,推出 SDV SoC 赋能 AI+汽车;戴尔灵越系列搭载英特尔酷睿Ultra 7,AI 能效再度提升;联想十余款 AI PC 产品发布,规模化落地逐步推进;华硕
视频及图像处理应用软件是万兴基石产品,持续开拓 AIGC 功能,部分产品开启 AI 商业化尝试,并预发布天幕大模型。1.创意类软件在公司收入中占比超过 80%,主要以中小用户为主。2.今年以来,公司一方面,迅速推出万兴爱画、万兴播爆、KwiCut 等含有内容生成能力的 AI 产品,补全创意产品矩阵;另一方面,推动 AI Lab 发展,以 API 的方式赋能各类创意产品。3.即将发布国内首个专注于以视频创意应用为核心的百亿级参数大模型“天幕”,天幕大模型由视频大模型、音频大模型、图片大模型、文本大
AI 跃升至 2.0 时代,随着大模型进入“轻量化”、“多模态”时代,以云端作为 AI 大脑,边缘端和终端作为小脑的混合 AI 料将成为技术发展主线。我们认为,AI 大模型落地成为终端出货成长的新动能,产业曲线两端将率先发力,其中硬件算力端(SoC、存储)、终端品牌将有望核心受益,零组件及组装中部分环节如传感器、电池、散热结构件等部分有望受益。我们认为当前各类 AI终端应用仍未达到成熟阶段,接下来一年重在软硬件适配和产品打磨,从“AI+产品”(出货量提升)到“产品 AI 化”(量价齐升),有望成
苹果首款 MR 头显设备 Vision pro 发售在即,我们认为,Vision pro 在硬件端展现了当前消费电子领域顶尖的参数水平,有望提供全面超越市面相关产品的硬件体验,而软件应用端,空间计算所代表的 3D 体验不同于当前主流的 2D屏幕,有望从手势、眼动、语言等维度塑造用户交互的全新范式,并进一步催动软件应用及制作技术的变革。在投资机会上,我们建议关注参与 Vision pro硬件产业链的相关公司,同时,有望受益于软件应用新范式的游戏、视频、内容制作及商业化等方向亦值得重点关注。[Nea
最新一代手机 SoC 高通骁龙 8 Gen3、联发科天玑 9300 均搭载 AI 引擎,当前智能手机销量或已处于周期底部,AI 手机和折叠屏等创新有望驱动手机销量重回增长周期。2023 年 Q3 全球 PC 销量连续两个季度环比回升,英特尔、联想等 PC 产业链领军者纷纷颁布 AI PC 布局计划,需求复苏以及 AI PC 有望驱动 2024 年 PC 销量同比增长。苹果 Vision Pro 发售在即,应用生态丰富,Office 等应用可以直接使用,有望引领 XR 产业迈入新纪元。[NeadP
公司专注于操作系统的开发与优化,凭借过硬的技术与高通、英伟达、地平线等厂商保持着深厚的合作关系。随着数字技术与不同产业的深入融合,算力芯片逐渐成为众多产品的智慧大脑,公司也伴随着芯片市场的扩张,形成了“智能软件、智能汽车、智能物联网”三大核心业务,为不同行业客户提供全栈操作系统服务及软件解决方案。2023 年公司启动 Smart to Intelligent,通过大模型赋能现有业务,有望进一步实现降本增效。
Meteor Lake 使用 Intel 3D Foveros 封装及采用分离式模块(Chiplet)架构,并首次集成了 NPU 实现端侧 AI 推理能力。Chiplet 架构处理器分为计算模块(Intel 4)、I/O 模块(N6)、SoC 模块(N6)、图形模块(N5),并将后三者外包给台积电。该架构的优势在于各模块能采用不同制程设计以提升性能和良率,从而降低成本。和上一代 Raptor Lake 相比,Meteor Lake 的制程从 Intel 7 升级至 Intel 4,晶体管密度翻倍
苹果不断加码 3D 内容建设,有望引领空间计算时代。在 3D 内容建设方面,苹果先后分别于 2021 和 2023 年推出了目标捕捉和空间视频功能,在 3D 生态建设方面持续深入,伴随着 Vision Pro 产品的发布,有望推动 3D 生态不断完善。同时苹果在 3D 内容开发方面保持了相对开放的态度,目标捕捉生成的 3D 模型格式为 USDZ,为目前业界常用的 3D 模型格式。苹果的 3D 拍摄使用的视频编码方式为 MV-HEVC,是 HEVC 的一个延伸,HEVC 被认为是当前最先进的视频编
丰富社交产品矩阵巩固护城河,效率提升探索新增长。Meta 通过多元社交产品矩阵建立王者地位,“效率之年”经营业绩重回增长。TikTok全球化扩张冲击下 Reels 深度融合应用生态献增量,Threads 把握Twitter 收购转型契机迅速抢占市场,驱动 Family 总流量稳健增长;全球社交广告韧性充足 Meta 份额领先,品效合一产品成熟机器学习与推荐算法奠定根基,IDFA 冲击淡化与 AI 赋能下广告新增长可期。
ChatGPT 带来的新一轮 AI 革命对算力的需求确定性是确认的,算力芯片作为 AI 大模型底座将长期稳定受益,存算一体、HBM、Chiplet、CPO 等技术作为解决大算力带来的“内存墙”“功耗墙”等问题的有效路径,也有望取得良好发展。混合 AI 是 AI 规模化的必然趋势,将部分推理工作放在终端侧能够带来成本、能耗、性能、隐私、安全和个性化优势。AI 手机、AI PC 等终端有望率先落地并逐步普及,为消费电子注入新活力。建议关注国产大算力芯片、英伟达/AMD 产业链、上游硬件供应商、下游多
人形机器人是人工智能的具身化载体,随着 AI 技术的突破性发展以及特斯拉等科技企业入局,行业迎来奇点时刻,机器人技术加速发展;政策上工信部及各地方政府陆续发布机器人相关支持性政策,为行业发展保驾护航;2023 年是多家机器人及上游零部件企业集中发布人形机器人相关产品的产业元年,机器人行业进入实质性发展阶段,技术政策产业开始共振。当前机器人处于导入阶段,我们看好“硬件先行”逻辑下执行器及其零部件的投资机会,建议关注执行器及其上游零部件的相关标的,看好国内企业有望在全球的人形机器人产业链中占据一席之
技术为先,把握产业互联网长期价值。百度历经三个阶段,两次重要变革,早在 2010 年就开始了 AI 布局,多年来的研发投入奠定了深厚的技术基础。2016 以来,在内容生态建设上继续发力的同时,深耕技术研发,使得公司从同行中脱颖而出,成为具有世界一流 AI 能力的领先科技公司。公司的核心业务由 AI 驱动,AI 能力囊括在核心 AI 技术引擎百度大脑中,使 AI 产品服务不同市场(包括消费互联网、云服务、智能驾驶、智能助手及 AI芯片),实现 AI驱动的市场及产品之间强大的协同效益。公司的战略布局
AI 赋能,人形机器人发展提速,拉动金属材料需求。人形机器人具有类人的外貌,一定程度上可替代多种传统机器人,但也需要更加复杂的驱动、传感、控制、交互系统。早期人形机器人造价昂贵,不具备智能,应用场景有限,难以大规模商业化量产。快速发展的 AI 或可成为人形机器人的大脑,同时近年新发布人形机器人的成本普遍有所下降。一旦人形机器人克服成本高和不智能两大缺点,下游应用空间或将被打开,人形机器人市场空间将迎来快速增长。根据Stratistics Market Research Consulting 的数
人工智能和机器学习(AI 和 ML)不再是新奇事物。高管层始终关注着不断变化的技术需求,AI 已然成为他们的最高优先事项之一。“AI 先行”这一流行语就是很好的体现。尽管大家都在大肆宣传这一概念,但实际情况是,当下的 AI 更多的是在标准业务流程的基础上进行递进式改进。本研究报告旨在帮助企业领导者全面了解不断演变的 AI 格局,弄清楚自己在典型 AI 发展历程中所处的位置,并提供有助于他们落实AI 策略的框架。本报告以 Emerald Research Group 于 2021 年 6 月受 H
除模型规模体积之外,目前全球 AI 算法的创新重点正逐步聚焦于多模态、智能Agent 等方面。OpenAI 在今年 6 月发布的 GPT-4V 展现了 AI 多模态能力的重大进展,模型在技术上做到了理解一种模态内容时考虑到另一种模态的上下文,真正意义上同时理解了文字与图片。我们判断多模态会是推动本轮 AI 热点继续前进的下一个增长点。下一代多模态将会快速拓展目前大语言模型有限的应用场景,显著提高语言模型的泛化能力,并有望在成本方面展现出对传统专有模型的优势,从而推动如 AI Agent 等应用的
深耕 AI 领域二十余载,人工智能国家队。公司自成立以来,一直从事智能语音、自然语言理解、计算机视觉等核心技术研究,积极推动人工智能产品和行业应用落地,是国内 AI 技术最为领先的企业之一,曾多次在语音识别、语音合成、机器翻译、图文识别等各项国际评测中取得佳绩。仅于2022 年,公司就累计获得包含常识阅读理解挑战赛 OpenBookQA、QASC、ReClor 等在内的 13 项认知智能国际竞赛冠军。同时公司是中文语音交互技术标准工作组组长单位,具备牵头制定中文语音技术标准能力。[NeadPay
自“ChatGPT”横空出世,全球科技企业掀起一场研发 AI 大模型的热潮,造成短期内算力端供给持续紧俏。我们认为随着 AI 算力等硬件底座逐步搭建完善,AI 大规模应用成为可能,位于“倒金字塔顶”的应用端发展空间广阔。通过梳理海外 AI 应用发展情况,我们认为 AI 大模型已在多垂类场景产生可行的商业模式,尤其在图文创意、虚拟数字人以及工业软件领域已出现较为成熟的落地应用,在营销、社交娱乐、制造等领域可有效节省制作成本并提升生产效率。虽 AIGC 或将在多行业诞生“爆款”应用,但结合到在各行业
海外 AI 应用商业化落地加速。距离 ChatGPT 的面世即将满一年,大模型带来的技术革命也催化了大量的 AI 应用涌现,现在这些应用也逐步进入了商业化落地的阶段。海外的 AI 应用由于起步较早,已经有大量的 AI 应用的商业化走在前列。微软、谷歌等科技大厂具备技术底座优势,布局全栈 AI 产业链,正在加速应用端推广。B 端企业服务厂商持续深化 AI 在原有产品基础的赋能,不断提升客户体验;C端产品则重点关注多模态、智能体、情感陪伴等方向。
公司是行业领先的人工智能软件公司。公司前瞻性投资并运营国内最大的 AI 专用基础设施 SenseCore 大装置,助其在 AI 2.0转型升级中赢得算力先发优势,并已在基座大模型研发和生成式AI 应用方面取得显著成果。“日日新”体系基座大模型InternLM-123B、InternLM-20B 近期发布,评测成绩达到业界领先水平,有望成为支撑下游行业模型和应用开发的基础平台;生成式 AI 产品族商量、秒画、如影等各具特色、使用场景广泛。在首批获得监管备案后,公司的基座大模型和生成式 AI 应用将
ChatGPT推出以来,大语言模型(Large Language Model,LLM)技术的发展取得突破性发展,越来越多的大模型犹如雨后春笋般破土而出,目前最为先进的模型为GPT-4,性能大幅领先市面上的其他模型。同时根据founder park,OpenAI估值目前也是此前微软投资时近3倍。当下LLM模型的规模持续增长,参数量已远远超过千亿级别,多模态崭露头角。1)模型规模的增长带来性能的提升,但是同时对模型的训练和部署也带来了挑战。以Open AI为代表的人工智能公司,已经开始就模型训练和部
Overnight, generative artificial intelligence (AI) has become a global sensation. Predictions of its potential impact on society, employment, politics, culture, and business fill the media and the internet. Business leaders are intrigued by the possi
在2021 TESLA AI DAY将引入Transformer进行大规模的无监督学习。2022年后国内公司跟进。特斯拉从安装在汽车周围的八个摄像头的视频中用传统的ResNet提取图像特征,并使用Transformer、CNN、3D卷积中的一种或者多种组合完成跨时间的图像融合,实现基于2D图像形成具有3D信息输出。毫末智行的AI团队正在逐步将基于Transformer的感知算法应用到实际的道路感知问题,如车道线检测、障碍物检测、可行驶区域分割、红绿灯检测&识别、道路交通标志检测、点云检测
近期海外大厂先后发布财务报告,以微软、谷歌、Meta 和亚马逊为代表,海外AI 大厂在大模型、云计算、搜索及广告、生产力工具等赛道积极拥抱 AI 商业化浪潮,发力布局 AI 大模型应用及产品服务,正在主导新一轮的 AI 产业变革。我们认为随着海外大厂在人工智能基础设施、模型算法和应用产品布局的不断推进,AI+行业应用有望迎来爆发。
奥比中光为国内领先的 3D 视觉感知整体技术方案提供商。公司自 2013 年成立起,就致力于在万物互联时代为智能终端打造“机器之眼”,是国内率先开展 3D 视觉感知技术系统性研发,自主研发一系列深度引擎数字芯片及多种专用感光模拟芯片并实现 3D 视觉传感器产业化应用的少数企业之一,也是全球少数几家全面布局六大 3D 视觉感知技术的公司,产品布局 3D 传感器、消费级应用设备和工业级应用设备,多款产品销量已过百万,全球合作客户已超 1000 家。
AI Agent(人工智能代理)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent 和大模型的区别在于,大模型与人类之间的交互是基于prompt 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果。而 AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。和传统的 RPA相比,RPA 只能在给定的情况条件下,根据程序内预设好的流程来进行工作的处理,而 AI
系统级 AI 计算平台是提升 AI 芯片算力利用率,培养用户生态的关键。影响 AI 芯片计算能力的因素除了硬件层面的芯片制程、内存、带宽等,还包括调用各硬件资源的系统级软件计算平台。AI 芯片厂商开发的系统计算平台不仅仅有效提升各家 AI 芯片产品的算力利用率,还为各类AI 应用开发提供了丰富的函数库,提供开发者简便易用的开发环境。英伟达的 CUDA 计算平台是主流 AI 应用开发平台。通过对比各公司开发的 AI 计算平台,我们发现英伟达的 CUDA 开发时间最早,积累的开发者数量最多。英伟达一