目前,AI大模型主要在自然语言处理、计算机视觉、语音识别等领域得到广泛应用。
国内外大厂加速布局 AI 大模型,"科技牛"在路上:
以ChatGPT为代表的AI大模型开启新一轮生产力革新的科技浪潮,并引发国内外大厂争相布局,也激起了TMT投资热潮,年初至今,沪深300上涨5.8%,而TMT细分领域计算机、传媒、通信、电子则分别大涨44%、39%、35%和19%,大幅跑赢市场。当前通信、电子、传媒板块当前估值仍处在过去10年的50%的分位区间内。在AI浪潮下,估值提升或仍有空间。
AI 大模型简介
AI大模型包含了“预训练”和“大模型”两层含义,即模型在大规模数据集上完成了预训练后形成特征和规则,无需或仅需要少量数据的微调,就能直接支撑各类应用。目前,AI大模型主要在自然语言处理、计算机视觉、语音识别等领域得到广泛应用。
近年来,优秀的AI大模型层出不穷。2018年,Google提出BERT模型;2020年,OpenAI提出了全球首个千亿级的GPT-3模型。以百度、华为等为代表的国内大模型也在奋力追赶,与国外大模型不同,国外往往在实验室打磨成熟,而中国大模型都是从产业和场景落地中建立起来的。
大模型的竞争从底层技术和基础设施开始
大模型是“大数据+大算力+强算法”结合的产物,基础设施方面,超大规模基础模型训练涉及到大模型算法、分布式训练系统、计算、网络、和高质量数据集的相关工具等多种核心技术支撑。AI算力需求增长已成共识,与之配套的高性能、高可靠数据中心网络也将相应增加。有望带动算力基础设施、AI芯片、GPU、光通讯、服务器、交换机、高速网络等高增。
大语言模型的应用领域广泛
大语言模型底层技术的发展,一方面在算力、服务器、通信等许多领域掀起新的技术革命,同时也在多个应用场景落地,在医疗、金融、教育、传媒等产业中变革,创造新的商业模式。