AI日报:智谱AI发布AutoGLM 2.0;百度蒸汽机2.0视频生成大模型上线;谷歌推出AI新功能的Pixel 10系列手机
AI日报
8月21日?AIbase1、智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网
2、腾讯元宝接入腾讯视频 点击可直接跳转观看
3、字节跳动发布开源大语言模型 Seed-OSS,助力开发者与研究者
4、企业已向生成式 AI投资大量资金,但95%的回报为零
5、微软测试Windows11 Copilot新功能:AI智能搜索文件和图片
6、Liquid AI 推出 LFM2-VL:低延迟的超高效视觉语言模型
7、OpenAI 首次突破月收入10亿美元,算力需求依然紧张
8、谷歌Pixel10抢跑AI赛道:搭载情感识别功能,领先苹果两年布局智能手机未来
9、百度蒸汽机2.0视频生成大模型重磅升级 行业首创多人有声视频生成
10、ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色
1.智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网
智谱AI推出的AutoGLM 2.0是一款具有划时代意义的AI代理产品,它通过强大的自然语言理解和多平台操作功能,实现了用户与数字世界的无缝交互。从点外卖到订机票,再到社交媒体内容创作和办公自动化,AutoGLM 2.0展示了其在提升生活和工作效率方面的巨大潜力。
亮点提要:
?? AutoGLM 2.0具备强大的自然语言理解能力,能够执行复杂的跨平台任务。
?? 它支持多个主流应用平台,实现自动化操作,极大提升了用户体验。
?? 开放API接口,使AutoGLM 2.0可以融入各种智能设备,推动智能化生活的普及。
详情入口:
?? https://autoglm.zhipuai.cn/htdocs/download.html
2.腾讯元宝接入腾讯视频 点击可直接跳转观看
腾讯元宝与腾讯视频合作,用户可通过元宝平台直接跳转至腾讯视频观看影视作品,极大提升了观影便捷性。
亮点提要:
?? 用户可在腾讯元宝平台直接搜索并跳转至腾讯视频观看影视作品。
?? 元宝支持通过片名、情节或台词快速检索影视内容。
?? 用户可与元宝探讨影视作品的创作背景和剧情内涵。
3.字节跳动发布开源大语言模型 Seed-OSS,助力开发者与研究者
字节跳动的 Seed 团队推出了 Seed-OSS 系列开源大型语言模型,专注于长文本理解、推理能力和开发者友好特性。Seed-OSS-36B 模型拥有360亿参数和512K的上下文处理能力,适用于学术研究和实际开发任务。
亮点提要:
?? Seed-OSS 系列模型基于因果语言模型架构,支持长文本理解和推理能力。
?? 提供两种版本:Seed-OSS-36B-Base 和 Seed-OSS-36B-Base-woSyn,满足不同需求。
?? 支持灵活的“思考预算”控制,提升推理效率并优化推理任务表现。
详情入口:
?? https://github.com/ByteDance-Seed/seed-oss
4.企业已向生成式 AI投资大量资金,但95%的回报为零
尽管企业在生成式人工智能(AI)领域投入了高达300亿至400亿美元的资金,但最新的麻省理工学院(MIT)报告显示,95% 的组织并未从中获得任何回报。这一数据引发了人们对 AI 投资效果的深刻思考。
亮点提要:
?? 95% 的组织在生成式 AI 投资中未获得任何回报,反映出技术整合的挑战。
?? 只有 5% 的 AI 试点项目成功创造出数百万美元的价值,绝大多数企业未见显著收益。
?? 短期内生成式 AI 实施不太可能导致大规模失业,影响主要体现在外部成本优化方面。
5.微软测试Windows11 Copilot新功能:AI智能搜索文件和图片
微软正在为Copilot应用引入AI驱动的智能文件搜索功能,允许用户通过自然语言描述进行文件检索。该功能基于AI技术,提升了文件管理效率,并扩展了AI在操作系统中的应用范围。
亮点提要:
? 引入自然语言描述搜索功能,提升文件检索体验。
??? 新增家庭体验界面,展示最近使用的应用、文件和对话记录。
??? 支持图片分析功能,实现多媒体内容交互。
6.Liquid AI 推出 LFM2-VL:低延迟的超高效视觉语言模型
Liquid AI 发布了 LFM2-VL 系列,这是一种专为低延迟和设备适应性部署优化的视觉语言基础模型。该系列包括两个高效的变体:LFM2-VL-450M 和 LFM2-VL-1.6B,分别适用于资源受限环境和高端移动设备。其 GPU 推理速度比现有模型快两倍,并在图像描述、视觉问答等任务上保持竞争力。
亮点提要:
?? LFM2-VL 提供超高效的 GPU 推理速度,比现有模型快两倍,适合各种设备使用。
??? 支持原始分辨率处理图像,确保大图像细节不失真。
?? 两种模型均为开放权重,可在 Hugging Face 上下载,适合研究和商业应用。
详情入口:
?? https://huggingface.co/collections/LiquidAI/lfm2-vl-68963bbc84a610f7638d5ffa
7.OpenAI 首次突破月收入10亿美元,算力需求依然紧张
OpenAI 在财务和算力方面面临挑战,但其业务规模迅速扩大,并与多家科技公司展开合作以应对计算资源需求。
亮点提要:
?? OpenAI 首次实现月收入突破10亿美元,但算力需求持续紧张。
?? 与微软的紧密合作推动 AI 产品快速发展。
?? 最新推出的 ChatGPT-5 引发广泛关注,订阅量加速增长。
8.谷歌Pixel10抢跑AI赛道:搭载情感识别功能,领先苹果两年布局智能手机未来
谷歌在Pixel10系列中全面升级了AI功能,包括Gemini Live的语音识别、Magic Cue主动助手、Camera Coach摄影辅助以及突破性的语音翻译功能。这些创新展示了谷歌在AI驱动智能手机领域的领先地位。
亮点提要:
?? Pixel10系列搭载Tensor G5处理器,支持最新Gemini Nano模型,实现AI能力的质的飞跃。
?? Magic Cue功能通过AI提供上下文建议,重新定义用户交互体验。
?? 语音翻译功能支持多种语言互译,为商务和旅行用户提供便利。
9.百度蒸汽机2.0视频生成大模型重磅升级 行业首创多人有声视频生成
百度蒸汽机(MuseSteamer)音视频一体化模型迎来重要里程碑,完成2.0版本升级,在行业内首次实现多人有声视频一体化生成功能,标志着AI视频生成技术进入新的发展阶段。
亮点提要:
?? 此次升级突破了单人视频生成的限制,支持多个人物的音视频同步呈现。
?? 百度蒸汽机 2.0 推出 Turbo、Lite、Pro 及全系有声版,满足不同用户需求。
?? 技术突破为教育、内容创作及营销等领域提供了新的解决方案。
10.ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色
ElevenLabs 推出的 v3 Alpha API 是一款突破性的文本转语音工具,支持超过 70 种语言,并具备对话模式和高级音频标签功能,为开发者提供了更自然、富有情感的语音生成能力。
亮点提要:
?? 支持超过 70 种语言,实现多语言语音生成。
?? 引入对话模式,支持多角色互动和语气变化。
?? 高级音频标签功能,精确控制语音情感与节奏。
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线