AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型;谷歌Veo3新增图像转视频功能
AI日报
7月11日?AIbase1、智谱上线了类似Manus的PPT生成功能AI Slides,免费使用无限制
2、可灵 AI 发布可图2.1模型:图像生成能力大幅提升,支持180种风格
3、NVIDIA 推出 DiffusionRenderer:全新 AI 模型实现视频到可编辑的逼真 3D 场景
4、墨刀AI重磅上线:输入想法30秒生成高保真、可编辑原型
5、上传10张照片,AI秒变时尚大片!Higgsfield Soul ID火爆全球,颠覆你的数字自我
6、谷歌DeepMind开源GenAI Processors:一键构建实时AI工作流
7、谷歌Veo3新增图像转视频功能,七周内用户创作超4000万个视频
8、Mistral AI 发布 Devstral2507:为代码中心语言建模而生
1.智谱上线了类似Manus的PPT生成功能AI Slides,免费使用无限制
智谱推出了全新的AI Slides功能,基于GLM-Experimental模型,能够根据用户提供的主题或文档快速生成高质量的PPT。该功能结构清晰、数据图表直观,并且完全免费,用户可通过chat.z.ai体验。
亮点提要:
?? AI Slides可根据主题或文档快速生成高质量PPT。
?? 生成的PPT结构清晰,运用图表展示数据,便于理解。
?? 用户可在chat.z.ai免费体验AI Slides功能。
详情入口:
?? https://chat.z.ai
2.可灵 AI 发布可图2.1模型:图像生成能力大幅提升,支持180种风格
可灵 AI 发布了新一代图像生成模型 '可图2.1',在指令遵循、人像美感和电影质感等方面有显著提升,并且具备强大的文字生成能力。新模型支持超过180种风格响应,为用户提供更丰富的创作选择。
亮点提要:
?? 新模型在复杂指令理解方面表现突出,能够精准生成高质量图像。
?? 文字生成功能增强,支持180种风格响应,拓宽创作空间。
?? 可灵 AI 推出可图2.1模型,图像生成能力显著提升,用户可免费体验7天。
3.NVIDIA 推出 DiffusionRenderer:全新 AI 模型实现视频到可编辑的逼真 3D 场景
NVIDIA 和其合作伙伴推出的 DiffusionRenderer 是一项突破性的技术,能够将视频生成与编辑结合,实现对3D场景的理解和操作。该模型通过神经逆渲染器和神经前向渲染器协同工作,提升了视频的真实感和适应性,并在多项任务中表现出色。
亮点提要:
?? DiffusionRenderer 结合生成与编辑功能,为3D场景创作带来新可能。
?? 神经逆渲染器和神经前向渲染器协同提升视频真实感和适应性。
?? 实际应用包括动态光照、材料编辑和对象插入,助力创作者轻松进行视频创作。
详情入口:
?? https://youtu.be/jvEdWKaPqkc
4.墨刀AI重磅上线:输入想法30秒生成高保真、可编辑原型
墨刀AI推出全新原型生成功能,用户只需30秒即可从想法生成高保真、可编辑的原型,支持多轮对话优化和局部修改,提升产品设计与验证效率。
亮点提要:
?? 30秒内生成可编辑原型,支持多终端适配和多轮对话优化
?? 支持多种图像输入,智能解析草图、线框图等生成界面
?? 双模式编辑与自动生成文档,实现设计即代码,覆盖多场景
5.上传10张照片,AI秒变时尚大片!Higgsfield Soul ID火爆全球,颠覆你的数字自我
Soul ID是Higgsfield AI推出的一款革命性AI工具,能够通过上传10张以上个人照片生成高度个性化的虚拟形象。其核心功能包括真实感与多样性的完美融合、多样化风格预设以及自动提示词优化,为内容创作者和时尚博主提供了强大的创作工具。
亮点提要:
?? 个性化训练:用户只需上传10张以上照片即可生成专属AI角色。
?? 多样化风格预设:内置60多种高级风格预设,一键切换多种视觉语言。
?? 自动提示词优化:用户输入简单描述,AI即可自动优化生成条件,输出高质量图像。
详情入口:
?? https://higgsfield.ai/
6.谷歌DeepMind开源GenAI Processors:一键构建实时AI工作流
谷歌DeepMind开源了GenAI Processors库,为开发者提供了一个轻量级、高效的工具,用于构建异步、可组合的生成式AI工作流。该库支持多模态数据处理,显著提升了基于Gemini API的应用程序开发效率。
亮点提要:
?? GenAI Processors通过模块化设计简化复杂AI工作流的开发过程。
?? 支持音频、视频和文本等多模态数据的异步流处理,提升实时应用效率。
?? 开源社区协作将进一步扩展库的功能,覆盖更多场景和编程语言。
详情入口:
?? https://github.com/google-gemini/genai-processors
7.谷歌Veo3新增图像转视频功能,七周内用户创作超4000万个视频
谷歌在AI视频生成领域持续发力,推出图像转视频功能并强化内容识别机制,显示出市场对AI创作工具的强烈需求。
亮点提要:
??? 谷歌通过Gemini应用程序新增图像到视频生成功能,扩展AI创作工具能力。
?? 用户可上传照片生成视频片段,并添加描述音频,支持下载或分享作品。
?? 所有使用Veo3模型生成的视频将带有可见和不可见的数字水印,确保内容可追溯性。
8.Mistral AI 发布 Devstral2507:为代码中心语言建模而生
Mistral AI 与 All Hands AI 合作推出 Devstral2507 系列模型,包含开源的 Devstral Small1.1 和企业版的 Devstral Medium2507。这些模型专注于代码推理、程序合成和结构化任务执行,适用于大型软件代码库的实际应用。Devstral Small1.1在 SWE-Bench 基准测试中得分53.6%,而 Devstral Medium2507得分为61.6%,表现优于一些商业模型。
亮点提要:
?? Devstral2507系列包括开源的 Devstral Small1.1 和企业版的 Devstral Medium2507,旨在提升代码推理与自动化能力。
?? Devstral Small1.1 在 SWE-Bench 基准测试中得分53.6%,而 Devstral Medium2507 得分61.6%,后者表现优于一些商业模型。
?? 两款模型支持与代码代理框架集成,适用于从本地开发到企业级服务的多种应用场景。
详情入口:
?? https://huggingface.co/mistralai/Devstral-Small-2507
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线