2025-05-16_国产大模型「五强争霸」，决战AGI！-行业资讯-网站开发软件制作-北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司--北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司-

国产大模型「五强争霸」，决战AGI！来源：新智元DeepSeek的横空出世，已经彻底改变了全球的AI局势。从此，不仅中美大模型竞争格局改变，国产大模型的产业版图，也被一举打破！纵观中国基础大模型的市场，可以看到，如今的基础大模型版图已然改天换地，演变为全新的五强格局—— 字节、阿里、阶跃星辰、智谱，以及DeepSeek。新基模五强突围，下一个制胜点在哪？脱颖而出的这五强，为何能成为留在最后的玩家？答案很简单——要么有钱，要么有人。前者，道理不言自明。训练大模型是明牌重注，要么得自家有粮，要么就得有大腿。像字节、阿里、DeepSeek，都属于有粮的类型；而智谱和阶跃星辰，则无疑属于后者。其中，上海队的阶跃星辰，最新一轮融资发生在24年底至25年初，B轮已融资数亿美金；北京队的智谱，在2025年3月已经拿下18亿人民币的融资。而说到人，当然就是高密度人才，尤其要有行业认可的技术领军人物。我们仔细盘盘就能发现，五强在这方面是分足鼎立，各有骨干。字节的吴永辉，阿里的吴泳铭、周靖人，阶跃星辰的姜大昕、张祥雨、朱亦博，智谱的唐杰、张鹏，DeepSeek的梁文锋，都是在业界足以撼动局势的人物。满足了有钱又有人，在这方面起跑线上各家都差不多，接下来要比拼的，就是硬货了。基模五强，各领风骚其实仔细分析，就能发现这五强的共性。要么是全才，模型的能力要能做到全面覆盖，且性能在第一梯队。要么就是专才，模型在某一方面遥遥领先。阿里：开源王者，全球第三阿里以「开源王者」的独特定位，不仅在国内市场占据重要席位，更在全球AI开源生态中，稳居全球TOP 3模型贡献者。斯坦福2025年人工智能指数报告可以说，阿里是国内过最开源自研LLM互联网巨头，也是全球唯一一家实现「全尺寸、全模态」开源的云计算厂商。可以说，作为开源最早、最完整的大公司，阿里在AI的投入上最坚决，也是如今布局最全、最先赚到钱的中国互联网大厂。自2023年以来，通义团队累积开源200+模型，涵盖了千问（Qwen）大语言模型和万相（Wan）视觉生成模型两大基座系列。这些模型覆盖了文本生成、视觉/语音理解生成、文生图，以及视频生成等全模态，参数规模从0.5B到235B不等，跨越119种语言及方言。两年前，国内LLM市场尚处于「百模」混战阶段，阿里率先将Qwen-7B开源，吸引了全球开发者的关注。截至目前，Qwen全球下载量超3亿，衍生模型数量超10万，超越Llama成为全球第一开源模型。在Hugging Face社区，2024年Qwen系列占全球模型下载量的30%以上，稳居第一。 25年2月，Hugging Face全球开源大模型榜单中，排名前十开源模型全部基于Qwen二次开发在这场「烧钱」的游戏中，未来三年，阿里还将投入3800亿元用于AI研发，用于云和AI硬件基础设施，总额超过去十年总和。这一投入规模在国内互联网公司中首屈一指，恰恰展现了阿里在AI赛道上的战略决心。相较于其他大模型玩家，阿里凭借成熟的商业化路径和广泛的客户基础，率先实现了投入到回报的闭环。截止2025年1月底，通过阿里云百炼平台调用通义大模型API的企业已超过29万。字节：巨型航母，重回创业字节的大模型以「综合能力强」为特色，覆盖了文本生成、图像理解、视频生成、语音处理等多模态领域。在这场技术与资源的巅峰对决之中，字节不仅在自研大模型和AI应用领域，展现出了「凶残的战斗力」。目前，字节旗下的AI应用超20多款，爆火核心产品「豆包」凭借其强大文本生成和多模态能力，迅速占领用户心智，月活用户超1亿。视频生成工具「即梦」也被赋予了更高的战略优先级，已在虚拟偶像、电商直播等领域，实现商业化落地。同样，字节在AI编程领域不敢落后。他们推出的AI编程工具Trae，直接对标Cursor等AI集成开发环境。在企业服务方面，基于豆包大模型，火山引擎「飞连」也在多场景落地AI应用等。字节的全面布局，还体现在其生态整合能力上。通过抖音、今日头条、飞书等平台，字节将大模型嵌入到内容推荐、协同办公中，形成了技术到应用的生态闭环。而如今，字节以「巨型航母重回创业」姿态，凭借雄厚资金、超高人才密度、多方向全面布局，成为中国AI赛道领跑者之一。阶跃星辰：低调的大模型国家队跟其他家相比，阶跃星辰可以算是这五强中最低调的大模型国家队了。可以说，阶跃星辰是生于上海、长于上海的国家队。2024年底，阶跃星辰完成了总额达数亿美元的融资，核心投资方包括上海国有资本投资有限公司及其旗下基金，战略和财务投资人包括腾讯投资、五源资本、启明创投等。如今，才成立2年的阶跃星辰，已累计发布22款自研基座模型，覆盖文字、语音、图像、视频、音乐、推理，其中有16款是多模态模型，性能领跑全行业，成为行业内公认的「多模态卷王」。其中，Step-1o Vision便在2025年初分别在知名大模型竞技场Chatbot Arena和国内权威评估平台「司南」（OpenCompass）中，分别拿下了视觉领域中国大模型第一，以及多模态模型榜单第一的成绩。更难得的是，阶跃星辰的多模态矩阵既全面，又在全行业领先。要知道，多模态模型的核心，就是综合能力，既要求语音、图片、视频多个模态的能力，又要求模型能理解、生成、推理。在此布局上，阶跃星辰的每条线都达到了第一梯队。而多模还有一大难点，就是融合过程中不能损失单个模特的性能，尤其不能降智。而阶跃星辰采取了原生多模的方式，在此方面经验独到。在阶跃星辰看来，多模态是通往AGI的必经之路。随着多模态交互和推理的融合愈加成熟，更多Agent会在智能终端上涌现。现在，阶跃星辰正在发力彻底解决视觉领域根本难题——表征和对齐的基础问题，也即「predict next frame」。未来，按照阶跃星辰的多模研发路径，AI将能建模物理世界交互，模拟整个世界，构建世界模型。至此，AGI就将实现。在成立之初，姜大昕团队曾绘制过这样一幅智能演进路线图，将智能进化分为模拟世界、探索世界、归纳世界三个阶段与此同时，阶跃星辰的核心技术人员已经在一线亲历十年AI发展，这支队伍的人才密度极高，既有技术洞察，又有实战经验，堪称是基模的「梦之队」。其中，创始人、CEO姜大昕曾担任微软全球副总裁，微软亚洲互联网工程院副院长、首席科学家。入选2025年IEEE Fellow的姜大昕博士，是唯一来自中国大模型创业公司的入选者。而首席科学家张祥雨，其参与著作的《用于图像识别的深度残差学习》论文（ResNet）是21世纪以来全球被引用次数最多的论文，引用量已超过25万次。商业化方面，目前已有多家头部企业和大量AI应用开发者对阶跃的多模态模型表示认可，纷纷接入。同时，阶跃还将智能终端Agent视为大模型落地的核心突破点，已和吉利汽车、千里科技、OPPO、智元机器人、原力灵机、TCL等达成了深度合作。智谱：全栈创新，发力智能体作为国内首个开启IPO大模型创业公司，智谱背靠清华技术底蕴以「学院派」独特气质脱颖而出，在基座模型、多模态技术和智能体展开全面布局。目前，智谱已经建立了新一代认知大模型技术体系，研发了全栈自主GLM系模型，性能指标与国际顶尖LLM对齐。去年8月，GLM-4-Plus问世在多个任务上表现优异，与GPT-4系不相上下。今年4月，智谱再次开源32B/9B系列GLM模型，包括基座、推理和沉思模型。以320亿参数比肩千亿参数主流模型性能。其中的GLM-Z1-Rumination沉思模型，便是智谱对AGI下一代技术的最新探索。在智能体方面，智谱先于OpenAI提出Phone Use概念并推出Agent产品，并发布了全球首个集深度研究与实际操作于一体L3级智能体——AutoGLM沉思。如今，他们正凭借AutoGLM及GLM-PC与全球车企、PC及手机厂商展开深度合作，推动大模型从Chat走向Act。智谱的商业化路径以2G和2B业务为核心，深度绑定政府和企业需求。其构建了MaaS私有化部署和智能体平台等服务模型，形成了包含百万规模开发者的模型服务新生态。据统计，MaaS平台支撑80余万企业、应用开发者。这种学院派创业模式，使得智谱在技术深度和战略稳定上，占据领先优势。 DeepSeek：研究导向，厚积薄发 DeepSeek，则是五强中目前最受国外瞩目的一位。在中美AI竞赛中，也是被提及最多、存在感最强的一家。可以说，这是一位特立独行的技术奇兵，直接以一己之力，掀翻了大模型的牌桌。 DeepSeek技术的特点，就是聚焦语言模型，特别是数理能力，走坚定的开源路线。上下滑动查看今年过年时，DeepSeek-R1给全世界带来了亿点点震撼，以极低的计算资源，取得了媲美GPT-4等顶级AI模型的性能。相比OpenAI、Anthropic训模型时动辄投入的数亿美元资金、数万张高端GPU，DeepSeek四两拨千斤的核心秘诀，就在于下面这种极致的工程优化。比如，MoE架构让模型总参数量达到671B，而在运行时却只需激活37B，大幅降低了计算需求；多token预测（MTP），则提高了AI的训练效率，避免逐字预测；多头潜注意力（MLA），让模型更精准地分配了计算资源。总之，DeepSeek成功的关键，就在于偏研究型的导向，而非以盈利为短期目标。从研究角度鼓励工程师提效，不必面临财务变现压力。而DeepSeek团队，也汇聚了多位顶尖人才。创始人梁文锋，在用人上也有着自己独特的原则。比如，以应届和毕业一两年的人才为主，不追求规模，而是构建小而精的团队。随着大规模的破圈，云厂商、行业伙伴纷纷积极接入，让模型的生命力持续旺盛。在DeepSeek的热潮下，如今已经有亿万普通用户开始拥抱AI。决战下一阶段「智能上限」与「多模态能力」当「基模五强」的格局初步形成，竞争的焦点也随之转向更为核心和前沿的技术领域。技术决胜点，聚焦何处？显然，追求更高的「智能上限」和突破的「多模态能力」，已成为通往AGI路上必须抢攻的两大技术高地。一方面，追求智能的上限，仍是当下大模型领域最重要的事情。当前领先的模型虽然在许多任务中表现惊艳，但在逻辑推理、常识理解、长文本处理等方面，仍有较大的提升空间。提升智能上限的最终目标，是迈向能够执行任何人类智力任务的AGI，这需要模型具备更深层次的理解、学习、推理和创造能力。另一方面，多模态理解与生成的统一是走向AGI的必经之路。人类通过多种感官与世界交互，并获取信息。要让AI真正理解并融入复杂的世界，就必须赋予其处理和融合文本、图像、音频、视频等多种模态信息的能力。当理解与生成统一，不仅能推动智能体在智能终端的普及，还能通过具身智能与物理世界交互，自己收集环境数据，构建世界模型。在世界模型的基础上，再加上复杂任务的规划、抽象概念归纳的能力，强化学习算法能力，以及超级对齐能力，就有可能实现AGI。总而言之，未来对更高智能上限的无尽探索和多模态能力的深度融合，将是决定这场竞赛胜负的关键。如今站在AGI的门槛前，「基模五强」的竞争不仅是技术的较量，更是资源、人才、生态的全面博弈。字节、阿里、阶跃星辰、智谱、DeepSeek这五大领军者，正以其各自独特的优势和战略远见，引领中国AI不断逼近世界前沿。而这场竞争的终点，或许正是AGI的曙光。参考资料：https://qwenlm.github.io/zh/blog/https://seed.bytedance.com/zh/https://platform.stepfun.com/https://www.deepseek.com/https://zhipuai.cn/https://chat.z.ai推荐阅读 MIT新晋副教授何恺明《计算机视觉进展》课程，附Slides与资料下载西电IEEE Fellow团队出品！最新《Transformer视觉表征学习全面综述》如何做好科研？这份《科研阅读、写作与报告》PPT，手把手教你做科研奖金675万！3位科学家，斩获“中国诺贝尔奖”！最新 2022「深度学习视觉注意力」研究概述，包括50种注意力机制和方法！【重磅】斯坦福李飞飞《注意力与Transformer》总结，84页ppt开放下载！2021李宏毅老师最新40节机器学习课程！附课件+视频资料欢迎大家加入DLer-大模型技术交流群！ ??长按识别，邀请您进群！

上一篇：2024-09-11_ACL杰出论文奖｜GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试集，全面提升大模型心智能力

下一篇：2021-09-03_困扰爱因斯坦的「幽灵般的超距作用」，是如何被贝尔定理证明确实存在的？

TAG标签：

网站开发网络凭借多年的网站建设经验，坚持以“帮助中小企业实现网络营销化”为宗旨，累计为4000多家客户提供品质建站服务，得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线：13245491521 13245491521 ，我们会详细为你一一解答你心中的疑难。项目经理在线

13245491521

与我们取得联系