全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2025-05-27_AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

您的位置:首页 >> 新闻 >> 行业资讯

AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型 AI日报 5月27日?AIbase1、中国信通院发布软件开发智能体标准 2、阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型,性能媲美Claude-3.7 3、GPT-4o 语音模式全新升级:唱歌功能上线,AI交互进入新境界 4、秘塔AI搜索推出全新“极速”模型:最高400 tokens/秒响应速度 5、谷歌推出 LMEval:统一评估大语言与多模态模型的新工具 6、谷歌Chrome浏览器新增Gemini AI助手,实时屏幕感知能力引关注 7、全球首例!阿联酋全民免费使用ChatGPT Plus,AI国际化战略重大里程碑 8、苏州成立60亿元人工智能母基金,助力产业转型升级 9、Kyutai Unmute 发布!10秒定制语音,AI对话进入超低延迟时代! 10、UAV-Flow项目突破无人机控制,语言指令实现精准飞行 11、Claude即将大升级!百万字符上下文+记忆功能,AI交互要逆天了! 12、百度心响 iOS 版正式上线,智能体应用实现全面覆盖 13、夸克发布行业首个“高考深度搜索”,一句话生成志愿填报方案 14、Chrome v137 开发者工具重磅升级 Gemini 智能标注让性能分析秒变神器! 15、美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平 16、Direct3D-S2 横空出世!千兆级3D生成提速近10倍,AI建模进入新纪元! 本播客由扣子空间(space.coze.cn)一键生成,速来体验「AI + 播客」的独特魅力吧!1.中国信通院发布软件开发智能体标准 中国信通院联合多家企业发布开发智能体标准,标志着AI智能体商业化进入新阶段。AIAgent市场快速增长,企业积极布局,推动数字化转型。 亮点提要: ?? 中国信通院发布开发智能体标准,AI智能体商业化迈入新阶段。 ?? 全球AIAgent市场预计2024年达51亿美元,2030年增至471亿美元,年复合增长率44.8%。 ?? 税友股份和赛意信息等企业积极布局AI智能体,提升服务能力,推动数字化转型。 2.阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型,性能媲美Claude-3.7 本文介绍了阿里巴巴发布的QwenLong-L1-32B,一款专为长上下文推理设计的大型语言模型,其性能表现超越多个竞争对手,并通过强化学习显著提升长文本推理能力。 亮点提要: ?? 全球首个通过强化学习训练的长文本情境推理模型,采用GRPO和DAPO算法,大幅提升推理准确性与效率。 ?? 在七个长文本情境文档问答基准测试中表现出色,处理复杂长文本任务能力领先。 ?? 发布完整解决方案体系,包括高性能模型、优化数据集、强化学习方法及评估体系,推动长文本AI应用产业化。 详情入口: ?? https://github.com/Tongyi-Zhiwen/QwenLong-L1 3.GPT-4o 语音模式全新升级:唱歌功能上线,AI交互进入新境界 GPT-4o 的高级语音模式迎来重大更新,新增唱歌功能,同时提升了自然语音交互能力。尽管唱歌表现仍有待优化,但其多模态交互能力和情感表达已经展现了巨大潜力。 亮点提要: ??唱歌功能上线,AI能根据指令生成旋律、歌词,甚至模仿特定风格的演唱。 ?高级语音模式实现端到端处理,响应延迟仅320毫秒,支持更自然的情感交流。 ??新增笑声、哭声等情感表达功能,拓展了AI在娱乐和教育领域的应用场景。 4.秘塔AI搜索推出全新“极速”模型:最高400 tokens/秒响应速度 秘塔AI搜索推出了全新‘极速’模型,通过GPU上的kernel fusion技术和CPU上的动态编译优化策略,大幅提升了搜索效率,大部分问题可在2秒内得到解答。 亮点提要: ?? 在单张H800 GPU上实现最高400 tokens/秒的响应速度。 ?? 新模型在速度、准确率和逻辑性方面表现出色。 ?? 提供测速站点(kuai.metaso.cn)让用户亲身体验快速响应。 5.谷歌推出 LMEval:统一评估大语言与多模态模型的新工具 LMEval 是谷歌发布的开源框架,用于简化和标准化大型语言及多模态模型的评估,支持跨平台模型对比,提供增量评估和可视化分析功能。 亮点提要: ?? LMEval 开源框架实现跨公司 AI 模型评估流程统一,提升效率。 ??? 支持文本、图像和代码评估,兼容新增输入格式,灵活扩展。 ?? 提供 LMEvalboard 工具,直观展示模型性能,便于深度分析。 详情入口: ?? https://github.com/google/lmeval 6.谷歌Chrome浏览器新增Gemini AI助手,实时屏幕感知能力引关注 我对于谷歌在Chrome浏览器中引入Gemini AI助手感到非常兴奋。这项技术不仅提升了用户体验,还展示了谷歌在AI领域的创新能力。Gemini AI助手通过实时感知屏幕内容并提供个性化帮助,让浏览更加高效和便捷。 亮点提要: ?Gemini AI助手能实时感知屏幕内容,提供智能化帮助。 ??仅向AI Pro和AI Ultra订阅用户开放,目前处于测试版。 ??未来计划扩展至更多场景与设备,提升整体用户体验。 7.全球首例!阿联酋全民免费使用ChatGPT Plus,AI国际化战略重大里程碑 阿联酋将成为全球首个向全体居民免费提供ChatGPT Plus高级版服务的国家,这标志着人工智能普及化的关键一步。 亮点提要: ?? 阿联酋将免费提供ChatGPT Plus服务,覆盖所有居民,推动AI技术的广泛使用。 ?? 建设星际之门阿联酋AI数据中心,计划构建1千兆瓦的人工智能计算集群,提升地区AI地位。 ?? OpenAI与阿联酋合作,开发符合本土需求的AI解决方案,促进全球AI技术的普及与应用。 8.苏州成立60亿元人工智能母基金,助力产业转型升级 江苏苏州成立了一支60亿元的人工智能产业专项母基金,聚焦算力基础设施、数据、人才等领域,推动‘人工智能+制造业’等行业融合应用,加速产业转型升级。 亮点提要: 苏州成立60亿基金,专注AI算力、数据、人才等关键环节,推动多行业融合应用。 基金由20家机构共同出资,执行事务合伙人占比1%,园区已形成完整AI产业生态。 预计2024年园区将聚集超1800家AI企业,助力苏州成为国家级AI发展试验区。 9.Kyutai Unmute 发布!10秒定制语音,AI对话进入超低延迟时代! 法国AI实验室Kyutai推出的Unmute系统为文本大语言模型赋予了强大的语音交互能力,包括智能对话、超低延迟和个性化定制功能。 亮点提要: ?? Unmute通过模块化设计让文本模型快速获得语音输入和输出功能,无需重新训练模型。 ??? 具备智能判断与接话、随时打断及文本流式合成等功能,对话体验更接近人类。 个性化定制功能只需10秒语音样本即可生成专属AI声音,满足多样化需求。 详情入口: ?? https://unmute.sh/ 10.UAV-Flow项目突破无人机控制,语言指令实现精准飞行 UAV-Flow项目通过自然语言处理技术,让用户仅凭语音指令即可实现对无人机的精确控制,大幅降低操作门槛,推动其在消费、工业和救援等场景的应用。 亮点提要: ?? 无人机可通过语音指令如‘向前飞50米’或‘围绕目标盘旋’实现精准控制。 ?? UAV-Flow集成了语音识别、语义理解及动态路径规划,适应多种复杂环境。 ?? 应用场景广泛,包括消费娱乐、工业巡检及紧急救援,提升操作安全性与效率。 详情入口: ?? https://prince687028.github.io/UAV-Flow/ 11.Claude即将大升级!百万字符上下文+记忆功能,AI交互要逆天了! Anthropic计划对Claude进行多项重要功能升级,包括上下文窗口扩展、记忆功能增强、输出能力升级、多文件格式支持扩展以及视觉功能改进,这些改进将使Claude在长文本处理、跨模态任务和企业级应用中更具竞争力。 亮点提要: ?? 上下文窗口扩展至百万字符,大幅提升超长文本处理能力。 ?? 新增记忆功能,实现多轮对话更连贯、个性化的响应。 ?? 扩展输出Token限制及多文件格式支持,增强企业级应用场景。 12.百度心响 iOS 版正式上线,智能体应用实现全面覆盖 作为一款多智能体协作应用,百度心响iOS版的上线标志着智能体应用普及的新阶段。它降低了使用门槛,提供了多种实用功能,如旅游攻略生成、深度研究支持以及健康咨询服务,致力于满足普通用户的多样化需求。 亮点提要: ?? 用户可在APP Store免费下载心响iOS版,享受便捷的智能体服务。 ??? 心响能自动生成旅游攻略、深度研究报告,助力高效规划与获取信息。 ?? 提供与线下医生相似的健康咨询服务,帮助用户更好地理解健康问题。 13.夸克发布行业首个“高考深度搜索”,一句话生成志愿填报方案 针对高考志愿填报信息繁杂的问题,夸克推出了‘高考深度搜索’功能,帮助考生和家长更高效地获取权威、准确的信息。 亮点提要: ? 提供高考深度搜索功能,支持个性化志愿填报方案生成。 ?? 数据来源于自建高考知识库,包括历年志愿数据及就业考研信息。 ?? 使用检索增强生成技术,降低大模型幻觉率,确保内容准确性。 14.Chrome v137 开发者工具重磅升级 Gemini 智能标注让性能分析秒变神器! Chrome v137引入Gemini AI智能助手,通过智能标注、CSS修改、性能洞察和截图功能大幅提升开发效率。 亮点提要: ? Gemini智能标注功能简化性能分析流程,快速理解复杂性能数据。 ?? AI驱动CSS调试,一键修改与保存,显著提升前端开发效率。 ?? 新增性能洞察功能,发现隐藏问题,优化网站加载速度与运行时性能。 15.美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平 美团在AI领域取得显著进展,包括接近GPT-4o水平的大模型研发、业务决策助手的推出、以及NoCode编程工具的开发等,展示了其在智能化服务生态系统的雄心。 亮点提要: ?? 美团 AI 大模型能力接近 GPT-4o 水平,将推出业务决策助手。 ?? 内部工程师的52% 代码由 AI 生成,提升工作效率。 ?? 推出 NoCode 编程工具,面向非技术用户,简化编程过程。 16.Direct3D-S2 横空出世!千兆级3D生成提速近10倍,AI建模进入新纪元! Direct3D-S2通过创新的空间稀疏注意力机制,显著提升了高分辨率3D图像生成的质量与效率,为千兆级3D生成提供了更具可扩展性的解决方案。 亮点提要: ?? 空间稀疏注意力(SSA)机制大幅提升生成效率,前向传播速度提升3.9倍,反向传播速度提升9.6倍。 ?? 统一稀疏体视格式提高训练稳定性,在10243分辨率下仅需8块GPU即可完成训练。 ?? 开源计划预计5月底前公布,推动3D生成技术在全球范围内的普及与应用。 详情入口: ?? https://github.com/DreamTechAI/Direct3D-S2 ↓点击阅读原文,进AIbase官网. 阅读原文

上一篇:2025-09-17_AI日报:阿里云开源通义DeepResearch;迪士尼将起诉MiniMax;全球首位 AI 全栈工程师 Orchids 问世 下一篇:2025-09-11_AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

TAG标签:

21
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价