
近期,AI大模型的迭代还在加速。北京时间2月18日,知名企业家埃隆·马斯克(ElonMusk)与xAI团队在X平台上进行直播,发布了xAI开发的最新版大模型Grok3。该模型被马斯克描述为“地球上最聪明的AI”。xAI小组成员称,为训练Grok3,他们将数据中心10万张GPU扩充到20万张。
2月初,中国初创企业DeepSeek发布新版大模型DeepSeek-R1,以极低的训练成本和使用成本,搅动大模型领域格局。随后,谷歌、xAI、OpenAI、Anthropic等公司也相继宣布将发布新版大模型。同时,有更多公司表示将采取开源策略。机构觉得,大模型的开源大幅度降低了应用成本,看好AI应用带来的新机会。
对于新公布的大模型Grok3,马斯克在直播中表示:“Grok3的性能比Grok2提升了一个‘数量级’,和Grok3聊天会觉得很有趣。”2023年7月,马斯克成立xAI公司。2023年11月,xAI发布第一款大模型Grok1,该模型拥有3140亿参数,成为当时参数量最大的开源大语言模型。2024年8月,xAI发布Grok2,有业内专家当时表示,该模型在性能上与ChatGPT的新模型相媲美。
而为了打造更强的Grok3,马斯克与xAI小组成员表示,在训练过程中,团队搭建了大型算力集群,并克服了散热、电力等问题带来的挑战。第一阶段,团队用122天将首批10万张GPU投入到正常的使用中,随后又用92天将集群规模扩大一倍,GPU数量达到20万张。
xAI团队在直播中展示称,Grok3和Grok3mini在多方面的测试得分都超过或媲美Gemini、DeepSeek和ChatGPT等对手。团队还演示用Grok3生成代码,通过运行这段代码,画面上显示出飞船在地球和火星间往返的动画。随后,xAI团队又用Grok3制作了一款类似于俄罗斯方块的游戏。
此外,xAI宣布推出名为DeepSearch的Grok3智能搜索引擎。xAI团队表示,Grok3的所有功能将在一周后陆续上线,并将开源上一代模型Grok2。开源证券表示,全球AI领域迎来多项重大进展,这些突破有望加速AI应用普及。
马斯克的xAI成为大模型领域强有力的竞争者,参与这场竞技的还有DeepSeek、OpenAI、谷歌等企业。
近期,中国初创企业DeepSeek发布开源推理大模型DeepSeek-R1,以极低的成本实现高性能表现,超越部分对标模型,搅动了大模型市场格局。公开资料显示,DeepSeek-V3使用了2048张英伟达H800GPU训练了两个月,训练成本为557.6万美元,仅为GPT-4o的十分之一。
DeepSeek新模型发布后,2月初,谷歌发布Gemini2.0系列模型,该系列模型强化了编码与推理能力,向全用户开放使用。OpenAI则于近日宣布,公司将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。据称,GPT-5将整合OpenAI的多项核心技术,包括o3推理模型。另有消息称,Anthropic计划在未来几周内发布新的混合型大模型Claude4,用户都能够自行控制使用时的推理成本。
同时,DeepSeek还掀起了大模型领域的开源革命,推动大模型成为各领域的“水电煤”。2月18日,阶跃星辰宣布与吉利汽车集团联合开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。百度宣布,其大模型产品文心一言将于4月1日起全面免费,所有PC端和App端用户均可体验其最新模型。2月13日凌晨,OpenAI也宣布免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。
中国信息通信研究院技术与标准研究所工程师龚正指出,AI技术的成熟正在改写商业模式,DeepSeek等开源模型的崛起正在重构行业生态。
截至中国证券报记者发稿时,据不完全统计,已经有数百家公司和机构正式接入DeepSeek研发的大模型,包括芯片、云服务、网络科技、金融、汽车等行业。
日前,DeepSeek接入拥有近14亿用户的微信。微信自2月15日起开始灰度测试接入DeepSeek-R1模型,增强其搜索功能。2月16日晚间,百度搜索宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能。
一位关注AI创新的投资服务业人士和记者说,未来大模型公司能够通过向企业端提供解决方案获得收益。对于大模型企业来说,未来的估值将不再单纯依赖于模型本身,投资者将更多地关注其生态建设、用户规模、数据质量以及增值服务的盈利能力。
大模型的应用已经影响到内容创作、金融、电信、无人驾驶等领域。国信证券表示,三大运营商年后陆续接入DeepSeek,运营商庞大的数据有助于为DeepSeek的模型训练与优化提供丰富素材,运营商接入DeepSeek有助于开发新的AI驱动型业务,运营商云平台有望实现AI能力深度集成,加速云业务增长。
在内容创作领域,大模型能够在一定程度上帮助企业快速生成文案、图片、视频等内容,提高创作效率。阅文集团近日宣布,旗下作家辅助创作产品“作家助手”应用已集成独立部署的DeepSeek-R1大模型。数字文化内容产业集团中文在线也宣布,公司已在部分内部AI网文创作流程中部署DeepSeek-R1,帮助增强创作效率。
在智能客服领域,大模型能轻松实现更智能的交互,提升客户满意程度。一汽丰田汽车销售有限公司近日宣布已借助腾讯云的大模型知识引擎接入DeepSeek模型,在智能客服等业务场景深度应用,大幅度的提高在线智能客服、电话外呼、系统运维工单等多场景的服务效率和用户体验。
在金融领域,大模型能够适用于风险评估、投资决策等,提高金融机构的运营效率和风险管理能力。例如,国金证券表示,将把DeepSeek应用于信息检索、文档处理、行业研究及市场分析等多个场景,未来还计划进一步拓展至智能服务、风险管理、投资分析等核心业务领域。
清华大学公共管理学院教授、清华大学人工智能国际治理研究院副院长梁正在近期接受媒体采访时表示,AI未来的发展将向终端化与轻量化发展,随着多模态、强化学习等技术进步,服务机器人、无人驾驶车辆、无人机的规模化部署将成为可能。
交银国际发布研报称,看好垂类大模型在办公、零售、客服、金融、营销、教育、文娱领域场景落地,以及云服务提供商BAT(百度、阿里巴巴、腾讯)价值重估的机会。摩根资产管理表示,将关注以AI为驱动力的科技产业、新能源产业、高端制造业以及以创新药为主的医疗健康产业。
中证网声明:凡本网注明“来源:中国证券报·中证网”的全部作品,版权均属于中国证券报、中证网。中国证券报·中证网与作品作者联合声明,任何组织未经中国证券报、中证网以及作者书面授权不得转载、摘编或利用其它方式使用上述作品。
武汉宏海科技股份有限公司向不特定合格投资者公开发行股票并在北交所上市网上路演
中科星图测控技术股份有限公司向不特定合格投资者公开发行股票并在北京证券交易所上市网上路演
- 15963662591
- xue@wfanxcl.com
- 山东省潍坊市坊子区北海路8616号商会大厦1424室