AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布
AI日报
5月21日?AIbase1、每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能
2、腾讯混元宣布模型矩阵全面升级,新推视觉推理模型T1-Vision和语音通话模型混元Voice
3、美图与阿里巴巴达成战略合作 获得2.5亿美元投资
4、豆包·语音播客模型发布
5、百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
6、谷歌发布Flow AI剪辑工具:Veo3 与 Imagen4 驱动、镜头控制与场景扩展
7、从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成
8、谷歌Imagen 4图像模型震撼发布:2K画质与精准文本渲染重塑AI创作
9、谷歌Gemini 2.5 Pro Deep Think发布:并行推理重塑AI复杂问题解决
10、谷歌虚拟试衣间重磅上线!上传照片秒变时尚模特,AI一键比价+自动下单
11、谷歌公测AI编码助手Jules:Gemini 2.5 Pro驱动,挑战OpenAI的Codex
12、苹果计划在 iOS 19 中向第三方开发者开放 AI 模型
13、京东云宣布五大AI营销产品限时免费,助力商家提升销售效率
14、字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
15、英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界
1.每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能
谷歌推出了全新的 AI Ultra 订阅计划,提供最高级别的 AI 模型访问和丰富的高级功能,适合电影制作人、开发者及创意专业人士。计划包含最新的 Gemini 应用、Flow 工具、30TB 存储空间等,订阅费用为每月249.99美元。
亮点提要:
?? 提供最高级别的 AI 模型访问和丰富的高级功能,适合追求最佳 AI 体验的用户。
?? Flow 工具支持高质量视频生成,掌握高级摄影控制并体验 Veo3 功能。
?? 提供30TB 存储空间,确保用户创作和文件的安全性。
详情入口:
?? https://blog.google/products/google-one/google-ai-ultra/
2.腾讯混元宣布模型矩阵全面升级,新推视觉推理模型T1-Vision和语音通话模型混元Voice
腾讯混元全面升级其模型矩阵,推出T1-Vision和混元Voice等新模型,TurboS在国际评测中表现优异,多模态技术取得新进展,同时推动开源技术发展。
亮点提要:
?? 混元推出T1-Vision和混元Voice,增强视觉和语音处理能力。
?? TurboS模型在全球评测中跻身前八,理科推理能力提升超10%。
?? 腾讯混元开源多模态技术,支持行业创新与合作伙伴发展。
3.美图与阿里巴巴达成战略合作 获得2.5亿美元投资
美图公司与阿里巴巴达成战略合作,阿里巴巴通过可转债形式投资2.5亿美元,双方将在电商、AI技术、云计算等领域展开深度合作。
亮点提要:
阿里巴巴以可转债形式投资美图2.5亿美元,助力其AI技术和电商业务发展。
美图与阿里巴巴将在电商工具开发及云服务采购上深化合作,提升商家运营效率。
合作需满足政府审批条件,旨在推动技术创新和业务增长。
4.豆包·语音播客模型发布
火山引擎推出的豆包·语音播客模型通过流式模型构建,实现了文本到播客的快速转化,带来高效、互动性强的创作体验。
亮点提要:
??对话自然流畅,模拟真人播客口语习惯,提升听感真实度。
?端到端便捷链路,从创作到成品仅需秒级时间,极大提高效率。
??支持深度搜索与超长文本转播客,随时紧跟热点并丰富内容。
5.百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
百度文心大模型 X1Turbo 在信通院评估中获国内首个“4+ 级”最高评级,展示出卓越的技术实力。
亮点提要:
?? 文心 X1Turbo 在24项能力评估中表现突出,16项能力满分,特别是在逻辑推理和代码推理方面。
?? 基于文心大模型4.5升级,X1Turbo 性能更强、成本更低,且安全可靠度得到认可。
?? 百度在AI技术研发中持续创新,X1Turbo 的成功标志着国内AI技术的重要突破。
6.谷歌发布Flow AI剪辑工具:Veo3 与 Imagen4 驱动、镜头控制与场景扩展
在2025年的Google I/O开发者大会上,谷歌推出了面向影视创作者的全新AI剪辑工具Flow,集成了Veo3、Imagen4和Gemini三大AI模型,通过自然语言提示和模块化工作流简化视频创作过程,为专业人士和初学者提供电影级视觉叙事能力。
亮点提要:
?? Flow整合Veo3、Imagen4和Gemini,通过简单文本提示生成高质量AI视频片段,支持角色对话和环境音效。
?? Scenebuilder与Camera Controls功能赋予创作者对视频片段的无缝编辑和镜头控制能力。
?? 内置Asset Management与Flow TV平台,优化素材管理和提供学习资源,助力创意社区发展。
详情入口:
?? https://labs.google/flow/about
7.从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成
谷歌发布的Veo3视频生成模型,不仅支持音视频一体化生成,还具备超高分辨率和多样化风格支持,为创作者提供强大工具的同时,也强调了安全性与责任性。
亮点提要:
?? Veo3可同时生成高清视频与匹配音频,简化创作流程,物理模拟和口型同步效果出色。
?? 支持4K分辨率,捕捉细微描述,适应多种风格需求,适合专业及教育领域使用。
?? 仅限特定用户开放,集成安全功能如数字水印与筛选器,未来将扩展应用场景。
8.谷歌Imagen 4图像模型震撼发布:2K画质与精准文本渲染重塑AI创作
谷歌推出了最新一代图像生成模型Imagen4,具有超高分辨率、精准文本渲染和多种风格支持,为创作者提供强大工具。
亮点提要:
?超高分辨率与细节表现力:支持2K分辨率,细节捕捉显著提升,满足专业设计需求。
??改进的文本渲染与风格多样性:生成清晰文字,支持多种艺术风格,扩展创作者表达空间。
??快速生成模式与生态整合:速度提升10倍,集成多个平台,确保内容可追溯,降低误用风险。
9.谷歌Gemini 2.5 Pro Deep Think发布:并行推理重塑AI复杂问题解决
谷歌DeepMind在2025年Google I/O开发者大会上推出Gemini2.5Pro Deep Think模式,采用并行推理技术,大幅提升数学、编码和多模态推理能力,支持开发者灵活调整推理质量和成本。
亮点提要:
?? Deep Think模式通过并行推理技术,显著提升复杂任务表现,如数学、编码和多模态推理。
?? 引入思考预算功能,开发者可平衡响应质量、延迟和成本,适应不同场景需求。
?? 当前仅对受信任测试者开放,未来几周将逐步扩展至更广泛的应用领域。
10.谷歌虚拟试衣间重磅上线!上传照片秒变时尚模特,AI一键比价+自动下单
谷歌在I/O2025大会上推出了全新的AI虚拟试衣工具,用户上传照片即可快速生成逼真的穿搭效果图,同时支持多条件搜索、比价分析和自动下单,极大提升了在线购物的个性化和便利性。
亮点提要:
? 使用AI虚拟试衣工具,上传照片后几秒内就能生成逼真的穿搭效果图,体验高度个性化。
?? 集成多条件搜索、实时比价和自动下单功能,简化购物流程,提升购物效率。
?? 基于Gemini2.5和Shopping Graph技术,精准捕捉服装细节,支持多种体型和品牌。
11.谷歌公测AI编码助手Jules:Gemini 2.5 Pro驱动,挑战OpenAI的Codex
谷歌推出的AI编码助手Jules进入全球公测阶段,基于Gemini 2.5 Pro模型,通过异步任务处理和GitHub集成提升开发者效率,透明工作流和免费配额吸引用户,未来扩展潜力巨大。
亮点提要:
?? 异步任务处理与GitHub无缝集成,修复Bug、编写测试等任务自动化。
?? 透明工作流,生成详细计划和代码变更差异,确保代码质量与团队规范。
?? 支持Python和JavaScript,未来扩展至更多语言,挑战OpenAI Codex和GitHub Copilot。
详情入口:
?? https://jules.google/
12.苹果计划在 iOS 19 中向第三方开发者开放 AI 模型
苹果计划在 iOS19 中向第三方开发者开放其 AI 模型,促进应用创新并增强硬件吸引力。初期将开放能在本地设备上运行的小型 AI 模型,开发者可通过新工具包利用 Apple Intelligence 创建新功能。
亮点提要:
?? 苹果计划在 iOS19 中开放 AI 模型,推动应用创新与硬件吸引力提升。
?? 开发者可利用 Apple Intelligence 创建新功能,初期仅开放本地小型 AI 模型。
?? 苹果目标是通过简化开发流程,将操作系统打造成 AI 软件平台的核心。
13.京东云宣布五大AI营销产品限时免费,助力商家提升销售效率
京东推出五大AI营销产品,包括数字人直播、商家客服智能体、商品图生成服务、视频混剪平台等,免费提供给商家,以提升销售效率和运营能力。
亮点提要:
?? 京东免费推出五大AI营销产品,助力商家提升销售效率。
?? 数字人直播可全天候带货,降低直播成本,提高转化率。
?? 京点点平台和视频混剪工具助力商家优化图文和视频营销。
14.字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
字节跳动发布了一款名为BAGEL的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。该模型在多模态理解、文本到图像生成、图像编辑等方面表现出色,采用了混合变换器专家(MoT)架构,并通过多模态预训练实现了持续性能提升。
亮点提要:
?? BAGEL 是一款开源多模态基础模型,拥有70亿个活跃参数,超越多项标准基准测试。
??? 该模型在图像生成和编辑任务中表现出色,能够进行自由形式的图像编辑和世界导航。
?? 通过多模态预训练,BAGEL 展示了持续的性能提升,适应了复杂的多模态推理任务。
详情入口:
?? https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT
15.英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界
英伟达发布的Cosmos-Reason1系列模型,通过物理AI监督微调和强化学习提升AI在物理常识和具身推理上的能力,为机器人和自动驾驶领域带来新可能。
亮点提要:
?? 英伟达发布Cosmos-Reason1系列模型,增强AI在物理推理中的能力。
?? 采用双本体系统,结合视频和文本数据进行同步推理。
?? 在物理常识和具身推理基准测试中表现优异。
详情入口:
?? https://github.com/nvidia-cosmos/cosmos-reason1
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线