2024-09-09_面壁小钢炮 3.0 重磅发布！“无限”长文本，性能超 Kimi-行业资讯-网站开发软件制作-北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司--北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司-

面壁小钢炮 3.0 重磅发布！“无限”长文本，性能超 Kimi 整理 | 褚杏娟近日，面壁智能宣布，旗舰端侧模型面壁「小刚炮」系列进化为全新 MiniCPM 3.0 基座模型，再次以小博大，以 4B 参数，带来超越 GPT-3.5 的性能。据介绍，MiniCPM 3.0 量化后仅 2GB 内存，端侧友好，主要特点包括：无限长文本，榜单性能超越 Kimi，超长文本也不崩；性能比肩 GPT-4o 的端侧最强 Function Calling；超强 RAG 外挂三件套，中文检索第一、生成超 Llama3-8B。 MiniCPM 3.0 开源地址： GitHub: ?? https://github.com/OpenBMB/MiniCPM HuggingFace: ?? https://huggingface.co/openbmb/MiniCPM3-4B “提前近 4 个月，我们实现了初代面壁小钢炮发布时立下的 Flag：今年内让 GPT-3.5 水平的模型在端侧跑起来！”面壁智能团队表示。据悉，MiniCPM 3.0 再次挖掘端侧模型的极致性能，仅 4B 参数，在包括自然语言理解、知识、代码、数学等多项能力上对 GPT-3.5 实现赶超，在 Qwen2-7B、 Phi-3.5、GLM4-9B、LLaMa3-8B 等一众中外知名模型脱颖而出。历经数次调整，面壁团队构建了全新技术架构。围绕 Scaling Law 的核心，面壁将提升知识密度视为高效大模型的第一性原理（知识密度 = 模型能力 / 参与计算的模型参数），并且提出了大模型时代的“摩尔定律”：模型知识密度不断提升，平均每 8 个月提升一倍，内部称为“面壁定律”。新一代小钢炮集长文本、Function Call 与 RAG 等大模型重要能力于一身，在这些呼声极高的模型功能上，MiniCPM 3.0 集结各家所长。面壁“无限”长文本，性能超 Kimi 上下文长度是衡量大模型基础能力的一项重要指标，更长的上下文长度意味大模型拥有更大的“内存”和更长的“记忆”，不仅能提高大模型处理数据的能力上限，还能拓宽大模型应用的广度和深度。面壁提出 LLMxMapReduce 长本文分帧处理技术，一举实现“无限”长文本。除了超越 GPT-4、KimiChat 等标杆模型的优异表现（ InfiniteBench 榜单成绩），面壁还表示，文本越长，4B 小钢炮凭借愈加稳定的表现，可以展现出越强的性能优势。 InfiniteBench 大模型长文本能力的权威评测集检索、数学、代码、问答和摘要等多维度能力评估 ① MiniCPM 3.0 表现超越 GPT-4、KimiChat、Qwen2-70B； ② 千亿模型 Qwen2-70B、Llama3-70b 结合 LLMxMapReduce 也取得更佳表现。 InfiniteBench Zh.QA 评测结果显示，4B 参数的面壁小钢炮整体性能优于 Kimi，在更长的文本上表现出相较更强的稳定性。 LLMxMapReduce 技术框架图 GPT-4o 级 Function calling ，终端 Agent 应用蓄势待发智能体应用是端侧 AI 必争之地，其中一项至关重要的技术是 Function Calling（函数调用），它能够将用户模糊化的输入语义转换为机器可以精确理解执行的结构化指令，并让大模型连接外部工具和系统，例如通过语音在手机上调用日历、天气、邮件、浏览器等 APP 或相册、文件等本地数据库，从而打开终端设备 Agent 应用的无限可能，也让人机交互更加自然和方便。据介绍，MiniCPM 3.0 拥有端侧最强 Function calling 性能，在权威评测榜单 Berkeley Function-Calling Leaderboard 上，其性能接近 GPT-4o，并超越 Llama 3.1-8B、Qwen-2-7B、GLM-4-9B 等众多模型。 RAG 外挂三件套端侧模型也能“开外挂”，RAG（检索增强生成技术）让模型引用外部知识库，检索到最新、最可靠的专业知识，确保生成内容更加可信，大大减少大模型的幻觉问题。大模型 +RAG 在行业中极其实用，尤其是对法律、医疗等依赖专业知识库、对大模型幻觉容忍度极低的垂直行业。这次，面壁一口气带来超强 RAG 外挂三件套：MiniCPM-Embedding（检索模型）、MiniCPM-Reranker（重排序模型）和面向 RAG 场景的 LoRA 插件（生成模型），款款优秀： MiniCPM-Embedding（检索模型）中英跨语言检索取得 SOTA 性能，在评估模型文本嵌入能力的权威评测集 MTEB 的检索榜单上中文第一、英文第十三； MiniCPM-Reranker（重排序模型）在中文、英文、中英跨语言测试上取得 SOTA 性能；经过针对 RAG 场景的 LoRA 训练后，MiniCPM 3.0-RAG-LoRA 在开放域问答（NQ、TQA、MARCO）、多跳问答（HotpotQA）、对话（WoW）、事实核查（FEVER）和信息填充（T-REx）等多项任务上的性能表现，超越 Llama3-8B 和 Baichuan2-13B 等业内优秀模型。内容推荐2024年8月18-19日，AICon 全球人工智能开发与应用大会·上海站成功举办，汇聚超过60位大模型行业先锋，全方位剖析大模型训练与推理机制、多模态融合、智能体Agent前沿进展、检索增强（RAG）生成策略、端侧模型优化与应用等热点内容。经过嘉宾授权，「AI前线」为你独家整理了一份演讲PPT合集，不容错过。关注「AI前线」，回复关键词「PPT」免费获取。报告推荐大模型「大脑」足够聪明到支撑 AI Agent 落地了吗？其他模块能力现状如何？理想中的智能体和现阶段有哪些差距？AI Agent 产品形态有何不同？数据分析、营销、教育、金融、文娱游戏等 AI Agent 应用现状如何？有哪些典型案例了吗？AI Agent 未来还将如何发展？以上问题的回答尽在《中国AI Agent应用研究报告 2024》。今日荐文亏太多！LG 1400人自愿离职，赔偿金达36月工资；马斯克发悟空AI图变天命人；实习生要开直升机、做饭？官方回应 | AI周报创业2年肝出爆款AI 工具！碾压VS Code、让OpenAI 员工都倒戈，开发者们集体上头！国产 GPU 公司被曝“流氓式解散”！员工欠薪记账、明星创始人成“老赖”，总部已人去楼空 Flux、SD等图片生成模型遭“封禁”，但这次硅谷大厂不反对了！韩国“N号房”事件因 Deep Fake 再现，受害者向中国网友求救你也「在看」吗？?? 阅读原文

上一篇：2019-06-16_我不喜欢Go语言的十个理由

下一篇：2022-11-18_专业级中文AI文图创作：智源中英双语AltDiffusion开源

TAG标签：

网站开发网络凭借多年的网站建设经验，坚持以“帮助中小企业实现网络营销化”为宗旨，累计为4000多家客户提供品质建站服务，得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线：13245491521 13245491521 ，我们会详细为你一一解答你心中的疑难。项目经理在线

13245491521

与我们取得联系