2025-08-21_AI日报：智谱AI发布AutoGLM 2.0；百度蒸汽机2.0视频生成大模型上线；谷歌推出AI新功能的Pixel 10系列手机-行业资讯-网站开发软件制作-北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司--北京网站开发_Ui设计_软件开发_YOLO_3D高斯_云服务器购买浙江网站建设-浙江网站开发|浙江网站制作|浙江网络公司-网络科技有限公司-

AI日报：智谱AI发布AutoGLM 2.0；百度蒸汽机2.0视频生成大模型上线；谷歌推出AI新功能的Pixel 10系列手机 AI日报 8月21日?AIbase1、智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网 2、腾讯元宝接入腾讯视频点击可直接跳转观看 3、字节跳动发布开源大语言模型 Seed-OSS，助力开发者与研究者 4、企业已向生成式 AI投资大量资金，但95%的回报为零 5、微软测试Windows11 Copilot新功能:AI智能搜索文件和图片 6、Liquid AI 推出 LFM2-VL：低延迟的超高效视觉语言模型 7、OpenAI 首次突破月收入10亿美元，算力需求依然紧张 8、谷歌Pixel10抢跑AI赛道:搭载情感识别功能，领先苹果两年布局智能手机未来 9、百度蒸汽机2.0视频生成大模型重磅升级行业首创多人有声视频生成 10、ElevenLabs 发布 v3 Alpha API：支持超过 70 种语言和无限数量的虚拟角色 1.智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网智谱AI推出的AutoGLM 2.0是一款具有划时代意义的AI代理产品，它通过强大的自然语言理解和多平台操作功能，实现了用户与数字世界的无缝交互。从点外卖到订机票，再到社交媒体内容创作和办公自动化，AutoGLM 2.0展示了其在提升生活和工作效率方面的巨大潜力。亮点提要： ?? AutoGLM 2.0具备强大的自然语言理解能力，能够执行复杂的跨平台任务。 ?? 它支持多个主流应用平台，实现自动化操作，极大提升了用户体验。 ?? 开放API接口，使AutoGLM 2.0可以融入各种智能设备，推动智能化生活的普及。详情入口： ?? https://autoglm.zhipuai.cn/htdocs/download.html 2.腾讯元宝接入腾讯视频点击可直接跳转观看腾讯元宝与腾讯视频合作，用户可通过元宝平台直接跳转至腾讯视频观看影视作品，极大提升了观影便捷性。亮点提要： ?? 用户可在腾讯元宝平台直接搜索并跳转至腾讯视频观看影视作品。 ?? 元宝支持通过片名、情节或台词快速检索影视内容。 ?? 用户可与元宝探讨影视作品的创作背景和剧情内涵。 3.字节跳动发布开源大语言模型 Seed-OSS，助力开发者与研究者字节跳动的 Seed 团队推出了 Seed-OSS 系列开源大型语言模型，专注于长文本理解、推理能力和开发者友好特性。Seed-OSS-36B 模型拥有360亿参数和512K的上下文处理能力，适用于学术研究和实际开发任务。亮点提要： ?? Seed-OSS 系列模型基于因果语言模型架构，支持长文本理解和推理能力。 ?? 提供两种版本：Seed-OSS-36B-Base 和 Seed-OSS-36B-Base-woSyn，满足不同需求。 ?? 支持灵活的“思考预算”控制，提升推理效率并优化推理任务表现。详情入口： ?? https://github.com/ByteDance-Seed/seed-oss 4.企业已向生成式 AI投资大量资金，但95%的回报为零尽管企业在生成式人工智能（AI）领域投入了高达300亿至400亿美元的资金，但最新的麻省理工学院(MIT)报告显示，95% 的组织并未从中获得任何回报。这一数据引发了人们对 AI 投资效果的深刻思考。亮点提要： ?? 95% 的组织在生成式 AI 投资中未获得任何回报，反映出技术整合的挑战。 ?? 只有 5% 的 AI 试点项目成功创造出数百万美元的价值，绝大多数企业未见显著收益。 ?? 短期内生成式 AI 实施不太可能导致大规模失业，影响主要体现在外部成本优化方面。 5.微软测试Windows11 Copilot新功能:AI智能搜索文件和图片微软正在为Copilot应用引入AI驱动的智能文件搜索功能，允许用户通过自然语言描述进行文件检索。该功能基于AI技术，提升了文件管理效率，并扩展了AI在操作系统中的应用范围。亮点提要： ? 引入自然语言描述搜索功能，提升文件检索体验。 ??? 新增家庭体验界面，展示最近使用的应用、文件和对话记录。 ??? 支持图片分析功能，实现多媒体内容交互。 6.Liquid AI 推出 LFM2-VL：低延迟的超高效视觉语言模型 Liquid AI 发布了 LFM2-VL 系列，这是一种专为低延迟和设备适应性部署优化的视觉语言基础模型。该系列包括两个高效的变体：LFM2-VL-450M 和 LFM2-VL-1.6B，分别适用于资源受限环境和高端移动设备。其 GPU 推理速度比现有模型快两倍，并在图像描述、视觉问答等任务上保持竞争力。亮点提要： ?? LFM2-VL 提供超高效的 GPU 推理速度，比现有模型快两倍，适合各种设备使用。 ??? 支持原始分辨率处理图像，确保大图像细节不失真。 ?? 两种模型均为开放权重，可在 Hugging Face 上下载，适合研究和商业应用。详情入口： ?? https://huggingface.co/collections/LiquidAI/lfm2-vl-68963bbc84a610f7638d5ffa 7.OpenAI 首次突破月收入10亿美元，算力需求依然紧张 OpenAI 在财务和算力方面面临挑战，但其业务规模迅速扩大，并与多家科技公司展开合作以应对计算资源需求。亮点提要： ?? OpenAI 首次实现月收入突破10亿美元，但算力需求持续紧张。 ?? 与微软的紧密合作推动 AI 产品快速发展。 ?? 最新推出的 ChatGPT-5 引发广泛关注，订阅量加速增长。 8.谷歌Pixel10抢跑AI赛道:搭载情感识别功能，领先苹果两年布局智能手机未来谷歌在Pixel10系列中全面升级了AI功能，包括Gemini Live的语音识别、Magic Cue主动助手、Camera Coach摄影辅助以及突破性的语音翻译功能。这些创新展示了谷歌在AI驱动智能手机领域的领先地位。亮点提要： ?? Pixel10系列搭载Tensor G5处理器，支持最新Gemini Nano模型，实现AI能力的质的飞跃。 ?? Magic Cue功能通过AI提供上下文建议，重新定义用户交互体验。 ?? 语音翻译功能支持多种语言互译，为商务和旅行用户提供便利。 9.百度蒸汽机2.0视频生成大模型重磅升级行业首创多人有声视频生成百度蒸汽机（MuseSteamer）音视频一体化模型迎来重要里程碑，完成2.0版本升级，在行业内首次实现多人有声视频一体化生成功能，标志着AI视频生成技术进入新的发展阶段。亮点提要： ?? 此次升级突破了单人视频生成的限制，支持多个人物的音视频同步呈现。 ?? 百度蒸汽机 2.0 推出 Turbo、Lite、Pro 及全系有声版，满足不同用户需求。 ?? 技术突破为教育、内容创作及营销等领域提供了新的解决方案。 10.ElevenLabs 发布 v3 Alpha API：支持超过 70 种语言和无限数量的虚拟角色 ElevenLabs 推出的 v3 Alpha API 是一款突破性的文本转语音工具，支持超过 70 种语言，并具备对话模式和高级音频标签功能，为开发者提供了更自然、富有情感的语音生成能力。亮点提要： ?? 支持超过 70 种语言，实现多语言语音生成。 ?? 引入对话模式，支持多角色互动和语气变化。 ?? 高级音频标签功能，精确控制语音情感与节奏。 ↓点击阅读原文，进AIbase官网. 阅读原文

上一篇：2025-04-27_AI日报：Kimi全新音频基础模型Kimi-Audio；夸克AI超级框上线 “拍照问夸克”；国行版苹果AI智能要来了

下一篇：2025-06-04_AI日报： ChatGPT免费开放记忆功能；华为WATCH 5智能手表接入双大模型；Claude Pro升级重磅功能

TAG标签：

网站开发网络凭借多年的网站建设经验，坚持以“帮助中小企业实现网络营销化”为宗旨，累计为4000多家客户提供品质建站服务，得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线：13245491521 13245491521 ，我们会详细为你一一解答你心中的疑难。项目经理在线

13245491521

与我们取得联系