AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;机器人世界模型开源平台发布
AI日报
8月14日?AIbase1、一张图秒变游戏大片!腾讯混元开源Hunyuan-GameCraft
2、超越FLUX Kontext!新图像编辑模型nano-banana角色还原能力超强
3、字节开源Agent专用模型 M3-Agent-Control,基于Qwen 3 32B训练
4、Kimi即将推出依托K2驱动的全球版PPT生成功能
5、阿里1688推出“诚信通 AI 版”会员,10月全面上线
6、苹果智能家居中心再度延期至2026年中期,全新Siri成核心亮点
7、智元机器人发布机器人世界模型开源平台——Genie Envisioner
8、全球 AI 独角兽数量激增至 498 家,总值达 2.7 万亿美元
9、谷歌为 Slides 和 Vids 引入全新 AI 图像编辑功能,轻松替换和扩展背景
10、昆仑万维发布Skywork Deep Research Agent v2
1.一张图秒变游戏大片!腾讯混元开源Hunyuan-GameCraft
腾讯混元团队推出的Hunyuan-GameCraft是一款基于HunyuanVideo底模的高动态交互式游戏视频生成框架,能够通过简单的输入生成高质量的游戏视频,显著降低了制作成本并提升了创作效率。
亮点提要:
?? Hunyuan-GameCraft通过输入一张图、文字描述和动作指令,生成高清动态游戏视频。
?? 该工具解决了传统游戏内容生产中的动作僵硬、场景静态和成本高昂问题。
?? 支持自由流畅的动作控制,适用于消费级硬件,降低游戏开发门槛。
详情入口:
?? https://hunyuan-gamecraft.github.io/
2.超越FLUX Kontext!新图像编辑模型nano-banana角色还原能力超强
Nano-Banana模型在图像编辑领域表现出色,尤其在角色还原、场景重构和图像融合方面超越了FLUX Kontext模型,展现了强大的潜力。
亮点提要:
?? 角色还原能力:Nano-Banana模型能够精准保留图像中人物角色的细节特征,确保编辑后的图像保持高度的视觉真实性。
?? 场景重构能力:该模型在处理复杂的背景替换或场景转换任务时,能生成自然连贯的画面效果。
??? 图像融合技术:Nano-Banana在处理多元素融合场景时,能够实现平滑过渡,几乎消除不同元素之间的违和感。
详情入口:
?? https://lmarena.ai/?chat-modality=image
3.字节开源Agent专用模型 M3-Agent-Control,基于Qwen 3 32B训练
字节跳动最新推出的AI模型M3-Agent-Control,基于Qwen 3 32B训练,拥有328亿参数,采用BF16张量类型,展示了其在AI领域的创新实力。该模型旨在推动智能技术的开放和普及,为开发者和企业提供了更多可能性。
亮点提要:
?? M3-Agent-Control是一个基于Qwen 3 32B训练的高性能AI模型,拥有328亿参数。
?? 该模型采用了BF16张量类型,能够更快地响应并提供更高效的结果。
?? 字节跳动致力于通过开放源代码和科学共享的方式,加速人工智能技术的发展。
详情入口:
?? https://huggingface.co/ByteDance-Seed/M3-Agent-Control
4.Kimi即将推出依托K2驱动的全球版PPT生成功能
Kimi K2模型凭借其强大的性能和开源特性,在AI领域取得了显著成就,并即将推出全球版PPT生成功能,进一步提升用户效率。
亮点提要:
?? Kimi K2模型拥有1万亿总参数和326亿活跃参数,性能卓越。
?? Kimi K2在多个基准测试中表现优异,超越了DeepSeek等开源模型。
?? 新功能将为用户提供更高效、智能的PPT生成体验,推动AI办公场景普及。
5.阿里1688推出“诚信通 AI 版”会员,10月全面上线
阿里巴巴旗下1688平台将推出全新商家会员产品——‘诚信通 AI 版’,计划于2025年10月正式上线。新入驻商家必须开通AI版,现有基础版将在过渡期后下架。同时,1688还将升级免费AI数字员工功能,帮助商家提升获客和运营效率。
亮点提要:
?? 阿里1688推出‘诚信通 AI 版’,2025年10月全面上线。
?? 新入驻商家需开通AI版,现有基础版将在过渡期后下架。
?? 升级免费AI数字员工功能,助力商家高效获客与运营。
6.苹果智能家居中心再度延期至2026年中期,全新Siri成核心亮点
苹果正在开发的类似iPad的智能家居中心设备因技术问题被推迟至2026年中期发布。该设备将配备7英寸显示屏和扬声器系统,外观设计类似Google Nest Hub,并搭载专为家庭成员共同使用而设计的新操作系统Charismatic。
亮点提要:
?? 苹果智能家居中心因技术问题推迟至2026年中期发布。
?? 设备配备7英寸显示屏,外观设计类似Google Nest Hub。
?? 基于大型语言模型的全新Siri将成为该设备的核心功能。
7.智元机器人发布机器人世界模型开源平台——Genie Envisioner
智元机器人在上海发布了 Genie Envisioner(GE)平台,通过整合未来帧预测、策略学习与仿真评估,实现了机器人操控的全新技术路径。
亮点提要:
?? GE 平台突破了传统机器人学习模式,采用以视频生成的闭环架构,实现端到端推理与执行。
?? 核心组件包括 GE-Base、GE-Act 和 GE-Sim,分别负责视频生成、动作模块和神经仿真。
?? 智元机器人计划开源 GE 的代码和工具,推动机器人主动思考与执行的转变,扩展应用场景。
详情入口:https://genie-envisioner.github.io/
8.全球 AI 独角兽数量激增至 498 家,总值达 2.7 万亿美元
文章指出,AI 行业正迅速崛起,吸引了大量投资和财富。目前全球已有近 500 家 AI 独角兽公司,总价值达到 2.7 万亿美元,并且在过去两年中诞生了 100 家新的独角兽公司。这表明 AI 正以创纪录的速度创造亿万富翁,并可能迎来“万亿富翁”时代。
亮点提要:
?? 全球已有 498 家 AI 独角兽,总值达到 2.7 万亿美元。
?? 过去两年中,AI 行业新创立的 100 家独角兽公司显示出迅猛的增长势头。
?? AI 创始人和投资者的财富激增,多个亿万富翁纷纷诞生,未来可能会迎来“万亿富翁”时代。
9.谷歌为 Slides 和 Vids 引入全新 AI 图像编辑功能,轻松替换和扩展背景
谷歌推出了基于 Gemini 的两项新 AI 图像编辑功能,分别用于替换和扩展图片背景。这些功能通过文本提示实现图像处理,提升用户在 Google Slides 和 Vids 中的创作效率。
亮点提要:
??? 用户可通过文本提示快速替换图片背景,适用于产品展示或统一头像背景。
?? 支持扩展图片背景,将竖屏图片转换为横屏格式,避免图像扭曲。
?? 功能预计8月14日全面上线,覆盖 Google Workspace 多个订阅版本及插件用户。
10.昆仑万维发布Skywork Deep Research Agent v2
昆仑万维发布Skywork Deep Research Agent v2,显著增强了天工超级智能体的核心引擎,引入了多模态深度调研和浏览器智能体,提升了信息处理能力和用户体验。
亮点提要:
?? 引入多模态深度调研Agent,提升信息检索与生成能力。
?? 推出多模态深度浏览器智能体,革新社交媒体内容分析模式。
?? Skywork Deep Research Agent v2在权威评测中表现优异,刷新行业SOTA纪录。
详情入口:
?? https://skywork.ai
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线