AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布
AI日报
9月30日?AIbase1、智谱发布开源大模型GLM-4.6:编程能力对齐Claude Sonnet4
2、DeepSeek发布V3.2-exp模型,开创性稀疏注意力机制 将API 成本降低一半
3、Anthropic放大招!Claude Sonnet4.5碾压GPT-5,编码界“新王者”诞生
4、ChatGPT 聊天即买!AI 革命电商:一键下单,告别浏览器跳转
5、OpenAI 即将推出AI版TikTok,全网视频内容将由AI创造
6、Claude Code 2.0震撼升级:检查点+VS Code插件,编程效率飙升3倍
7、百度地图升级小度想想 2.0:出行智能助手全面进化
8、蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview
9、DeepMind 重磅推出 “帧链” 概念:视频模型或将实现全面视觉理解10.通义千问发布 Qwen3-LiveTranslate-Flash 实现实时翻译突破
11.火山引擎发布豆包大模型1.6-vision 视觉理解能力实现重大突破
1.智谱发布开源大模型GLM-4.6:编程能力对齐Claude Sonnet4
智谱AI发布了新一代开源大模型GLM-4.6,其在Agentic Coding等关键能力上实现大幅提升,编程能力已对齐国际顶尖模型Claude Sonnet4,并超越DeepSeek-V3.2-Exp,成为国内最强代码生成模型。
亮点提要:
? GLM-4.6在编程能力上达到国际顶尖水平,对齐Claude Sonnet4。
?? 成功在寒武纪国产芯片上实现FP8+Int4混合量化部署,推动国产硬件发展。
?? 基于vLLM框架,在摩尔线程GPU上以原生FP8精度稳定运行,提升AI生态自主性。
详情入口:
地址:https://z.ai/blog/glm-4.6
2.DeepSeek发布V3.2-exp模型,开创性稀疏注意力机制 将API 成本降低一半
DeepSeek发布了名为V3.2-exp的新实验模型,通过创新的‘稀疏注意力’机制显著降低了长上下文操作的推理成本。该模型结合了‘闪电索引器’和‘细粒度标记选择系统’,提高了处理长上下文片段的效率,并在初步测试中展示了API调用成本降低50%的优势。
亮点提要:
? DeepSeek推出V3.2-exp模型,采用稀疏注意力机制优化长上下文处理。
?? 闪电索引器与细粒度标记选择系统协同提升模型效率。
?? 初步测试显示API调用成本可降低50%,为AI应用提供更经济的解决方案。
3.Anthropic放大招!Claude Sonnet4.5碾压GPT-5,编码界“新王者”诞生
Anthropic发布了Claude Sonnet4.5模型,该模型在编码基准测试中表现卓越,支持多平台应用,并在安全性和对齐性方面有显著提升。其性能和实用性为AI代理的发展带来了新的机遇。
亮点提要:
? Claude Sonnet4.5在编码任务中表现出色,代码编辑准确率提升至0%。
?? 支持多平台应用,包括网页、移动端和API接口,提升了开发效率。
?? 强化了安全性和对齐性,降低了风险行为,适用于高风险企业场景。
4.ChatGPT 聊天即买!AI 革命电商:一键下单,告别浏览器跳转
ChatGPT 推出‘即时结账’功能,用户可在聊天界面直接完成单件商品购买,无需跳转链接或浏览器。这一创新基于 OpenAI 与 Stripe 合作开发的‘代理商务协议’,旨在重塑在线购物体验。
亮点提要:
?? ChatGPT 推出‘即时结账’功能,简化购物流程。
?? ‘代理商务协议’由 OpenAI 与 Stripe 合作开发,确保交易安全和兼容性。
?? 未来将扩展至多件购物车和国际市场,支持 Shopify 商家及 Etsy 卖家。
5.OpenAI 即将推出AI版TikTok,全网视频内容将由AI创造
OpenAI即将推出一款名为“AI版TikTok”的社交应用,基于Sora2视频生成模型,所有内容均由AI自动生成。该应用在设计上与TikTok相似,但视频时长限制为10秒,且提供身份验证功能,允许用户使用自己的肖像进行视频创作。此外,OpenAI还采取了安全措施,确保用户肖像和版权内容的合理使用。
亮点提要:
?? Sora2模型生成的视频时长限制为10秒,专注于短小精悍的内容传播。
?? 用户可认证身份,Sora2可使用其肖像进行视频生成,并允许其他用户标记使用。
??? OpenAI将发送提醒,即使未公开视频,同时版权方需主动提出退出才能避免内容生成。
6.Claude Code 2.0震撼升级:检查点+VS Code插件,编程效率飙升3倍
Claude Code v2.0的发布标志着AI编程生态的重大革新。其新增的检查点功能、VS Code插件以及Sonnet4.5模型的优化,显著提升了开发者的效率和体验。这些更新不仅增强了AI在复杂任务中的自主性,还为开发者提供了更安全、高效的工具。
亮点提要:
? Claude Code v2.0引入了检查点机制,允许AI在长任务中自动保存状态,提升项目开发的安全性。
??? 新推出的VS Code插件支持内联差异预览和图形化交互,极大提升了协作效率。
?? Sonnet4.5模型在OSWorld基准测试中得分高达61.4%,表现出色,尤其擅长构建复杂的代理系统。
7.百度地图升级小度想想 2.0:出行智能助手全面进化
百度地图在第七届世界新能源汽车大会上发布了小度想想 2.0,这一升级版出行智能体通过引入地图出行知识库和实时搜索数据,提升了对复杂出行意图的理解与推理能力。同时,跨端记忆体的构建让用户在不同设备间使用更加流畅,而智能助手的即时、近期及长期记忆能力则能提供个性化的推荐服务,显著提升了出行体验。
亮点提要:
?? 引入地图出行知识库和实时搜索数据,提升复杂出行意图的理解与推理能力。
?? 构建跨端记忆体,实现手机、车机等多设备无缝衔接。
?? 具备即时、近期及长期记忆能力,提供个性化推荐服务。
8.蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview
蚂蚁集团推出的Ring-1T-preview是全球首个开源的万亿参数推理大模型,在多项测试中表现优异,展现了强大的自然语言推理和代码生成能力,为AI技术的发展提供了新的可能性。
亮点提要:
?? 全球首个开源的万亿参数推理大模型,推动AI技术发展。
?? 在多项测试中超越多个开源模型,接近GPT-5水平。
?? 团队正在对模型进行后续训练,进一步挖掘其潜力。
9.DeepMind 重磅推出 “帧链” 概念:视频模型或将实现全面视觉理解
DeepMind 提出了‘帧链’(CoF)概念,使视频生成模型具备了在时间和空间上进行推理的能力。该研究展示了Veo3模型在多个视觉任务中的强大通用能力,并预示未来可能取代专用模型。
亮点提要:
?? 帧链概念让视频模型具备时空推理能力,类似语言模型的链式思维。
?? Veo3模型展示出强大的通用视觉能力,能解决未专门训练的任务。
?? 视频生成模型有望取代专用模型,开启机器视觉新时代。
详情入口:
?? https://papers-pdfs.assets.alphaxiv.org/2509.20328v1.pdf
10.通义千问发布 Qwen3-LiveTranslate-Flash 实现实时翻译突破
通义千问推出的 Qwen3-LiveTranslate-Flash 系统在多语言实时音视频翻译方面实现了显著的技术突破,支持多种语言及方言的翻译。
亮点提要:
??该系统支持 18 种语言的离线和实时翻译,包括多种方言,为国际交流提供全面支持。
?? Qwen3-LiveTranslate-Flash 通过视觉上下文增强技术提升翻译准确性,破解翻译中的难题。
? 实现最低 3 秒的同传延迟,并在多领域复杂环境中超越多款主流翻译模型的表现。
11.火山引擎发布豆包大模型1.6-vision 视觉理解能力实现重大突破
火山引擎今日发布了其最新的人工智能产品 —— 豆包大模型1.6-vision。这一版本的发布标志着在视觉理解领域的一次重要突破,进一步推动了 AI 技术的进步与应用。亮点提要:
?? 豆包大模型 1.6-vision 通过优化算法与增强学习,提升了图像识别与目标检测的准确性和处理速度。
?? 模型具备优秀的可扩展性,支持用户根据需求进行定制化开发,适应不同行业的应用场景。
?? 同时发布的 “Viking 长期记忆” 功能解决了 AI 应用中的 “金鱼记忆” 问题,推动智能化转型。
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线