“文心一言”表现一如预期,不必过度悲观
► “文心一言”表现一如预期,不必过度悲观
3 月 16 日“文心一言”发布,从官方 demo 来看,文心一言具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成能力,存在超预期亮点,但事前录屏降低了其演示的真实性,也并未对外直接开放,多因素导致公众反馈不佳。我们认为尽管上下文理解、语义逻辑、多轮对话方面尚有欠缺,“文心一言”展现了足够的文案创作能力,为 B 端降本增效的起始逻辑已经明晰,尽管尚未对公众大范围开放,企业用户已经能够申请内测邀请码,若邀请范围持续扩大,飞轮效应将推进“文心一言”表现改善,且优化空间极大。
► 复现 ChatGPT 的难点在哪里?AI 三要件略逊一筹,但差距并非不可逾越
1)算法上,去开源化极大增加了国内科技企业的复现难度,但学术界已有相对成功复现先例,随着人才流动、时间推移和研究进步,大模型性能很可能逐渐趋同。2)数据上,数据集质量、标注细节处理、用户真实交互是关键,尽管优质的中文标注数据集匮乏,使用英文数据进行预训练并不影响中文输出,科技企业能够参考 GPT3 的路径,利用海量用户交互提升数据质量。3)算力上,国内头部科技企业多已完成数据中心建设,能够实现算力资源部分自给,此外算力更接近于自由流通的商品,战略押注意愿明确、现金流充沛的国内厂商有希望弥合算力上的差距。
► 工程化和应用分发能力是隐形壁垒,头部厂商优势明显
国产 ChatGPT 的落地在技术准备之外还需要两项核心要素:工程化与分发能力。1)工程化能力,即能够利用更低的成本和更高效的迭代做出先进的大模型应用,制作更高效、廉价、贴合市场的产品,能够同时容纳亿级用户在线。2)充沛的 C 端用户及 B 端应用场景,即更低的分发触达成本、更快速的产品应用迭代。国内厂商完全具备大 DAU 场景下 AI 工程化处理的潜力,且应用分发是国内企业的长项,头部厂商本身已经建起规模及心智壁垒,且商业模式无需再探索,如要落地 AGI 相关应用,获客成本远低于新进入者。
► 若“文心一言”对外开放,增量成本仍可控
短期我们关注“文心一言”等产品对科技企业财务状况的影响,将增量成本拆分为训练成本、推理成本及数据标注成本(暂不考虑人力支出及维护费用),测算大模型落地搜索页面后年均增量成本约为 16 亿元。但考虑到国产模型参数量及数据集 token 数量均是未知,且 Azure 云计算价格与实际成本存在偏差,此外实际落地后各项成本均存在优化可能、具体会计处理方式还存在探讨空间,我们判断 10-20 亿元为其增量成本的合理范围(暂不考虑人力支出及维护费用),参考百度 2022 年经营现金流净额 261.7 亿元,对公司正常经营影响可控。
零帕网 » 人工智能行业专题之分析:“文心一言”发布,国内厂商距离复现ChatGPT有多远?