全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2025-07-02_AI日报:百度发布视频生成模型MuseSteamer与“绘想”平台;阿里音频驱动全身数字人模型OmniAvatar

您的位置:首页 >> 新闻 >> 行业资讯

AI日报:百度发布视频生成模型MuseSteamer与“绘想”平台;阿里音频驱动全身数字人模型OmniAvatar AI日报 7月2日?AIbase1、开源端到端语音大模型Step-Audio-AQAA:听懂音频直接生成自然语音 2、百度发布“绘想”平台与MuseSteamer:AI生成视频,一张图即可搞定专业级大片! 3、浙大与阿里联合发布OmniAvatar:音频驱动全身数字人模型震撼登场 4、百度搜索迎来十年来最大改版:AI智能框、百看、AI助手全面进化 5、xAI控制台新增Grok4及Grok4Code引用,标志着下一代AI模型即将发布 6、Gemini Live重磅升级!无缝连接Google应用,智能生活触手可及 7、武汉首发全国首辆 AI 外卖配送车,配送效率大幅提升 8、Anthropic年化收入已达40亿美元,较年初增长近4倍、与 Cursor 竞争加剧 1.开源端到端语音大模型Step-Audio-AQAA:听懂音频直接生成自然语音 Step-Audio-AQAA 是一个开源的端到端语音大模型,能够直接从原始音频输入生成自然流畅的语音输出,显著提升了人机交互的体验。该模型由双码本音频标记器、骨干 LLM 和神经声码器三部分组成,能够高效处理语音中的复杂信息,为未来的智能语音应用奠定了坚实的基础。 亮点提要: ?? Step-Audio-AQAA 可以直接从音频输入生成自然语音,提升人机交互体验。 ?? 模型架构由双码本音频标记器、骨干 LLM 和神经声码器三个模块组成,能够高效捕捉语音中的复杂信息。 ?? Step-Audio-AQAA 的推出标志着语音交互技术的重要进展,为未来智能语音应用提供了新思路。 详情入口: ?? https://huggingface.co/stepfun-ai/Step-Audio-AQAA 2.百度发布“绘想”平台与MuseSteamer:AI生成视频,一张图即可搞定专业级大片! 百度发布“绘想”平台与MuseSteamer,通过生成式AI和多模态技术提供全面的视频生成解决方案,满足搜索、广告等场景需求。MuseSteamer具备强大的可控性和高性价比,用户只需上传图片即可生成专业级视频内容,极大简化了视频制作流程。 亮点提要: ?? MuseSteamer支持音视频一体化生成,实现电影级制作效果。 ?? 支持连续10秒动态视频生成,提升创作效率。 ??? 用户仅需上传一张图片即可生成专业级视频内容。 详情入口: ?? https://huixiang.baidu.com/ 3.浙大与阿里联合发布OmniAvatar:音频驱动全身数字人模型震撼登场 浙大与阿里联合发布的OmniAvatar模型在音频驱动数字人技术上取得重大突破,能够生成自然流畅的全身数字人视频,尤其在歌唱场景中表现出色。该模型支持通过文本提示精细控制生成细节,并具备多场景应用潜力,为营销、教育及娱乐等领域带来创新可能。 亮点提要: ?? 音频驱动技术实现全身数字人视频生成 ?? 支持文本提示控制细节,提升灵活性 ?? 开源项目为商业场景提供广阔应用空间 4.百度搜索迎来十年来最大改版:AI智能框、百看、AI助手全面进化 百度搜索进行了十年来最大规模的改版,引入了智能框、百看和AI助手等创新功能,显著提升了用户的搜索体验和创作能力。 亮点提要: ?? 智能框支持千字输入,增强多模态交互能力。 ?? 百看功能升级,支持混合内容输出和智能体服务。 ??? AI助手新增视频通话功能,提升创作与搜索能力。 5.xAI控制台新增Grok4及Grok4Code引用,标志着下一代AI模型即将发布 xAI在开发者控制台中新增了对Grok4及Grok4Code的引用,预示着下一代人工智能模型的发布即将来临。Grok4被描述为‘全能型AI的巅峰之作’,而Grok4Code则专注于编程优化。这两款模型的引用表明其公开发布已进入最后准备阶段。 亮点提要: ?? Grok4作为xAI的旗舰模型,专注于自然语言处理、数学推理和综合推理能力的提升。 ?? Grok4Code专为编程优化,计划与代码编辑器无缝整合,提高开发效率。 ?? xAI通过API提供Grok4访问权限,未来将扩展至多模态能力,降低开发者整合门槛。 6.Gemini Live重磅升级!无缝连接Google应用,智能生活触手可及 Gemini Live的升级通过与Google生态系统的深度整合,提升了用户的智能交互体验,同时兼顾了隐私保护,展现了其在智能助手领域的潜力。 亮点提要: ??Gemini Live将与Google Maps、Calendar等应用深度整合,提升跨应用操作效率。 ??支持多模态交互,如扫描信息自动生成任务或日程,增强实用性。 ??Google注重隐私保护,用户可自主管理权限以确保数据安全。 7.武汉首发全国首辆 AI 外卖配送车,配送效率大幅提升 武汉推出全国首辆搭载 AI 技术的外卖配送车 —— 智音车,据悉,智音车配备了北斗双频芯片,能够实现人车绑定的智能管理,具备身份识别、自动降速、优化路线以及全程可追溯等多种功能。 亮点提要: ?? 智音车在武汉首发,配备北斗双频芯片,提升外卖配送效率。 ?? 外卖小哥配送效率提升30%,日均多赚80元。 ?? 定位精度高达1米,智音车技术前景广阔。 8.Anthropic年化收入已达40亿美元,较年初增长近4倍、与 Cursor 竞争加剧 文章指出,AI独角兽Anthropic年化收入已达40亿美元,较年初增长近四倍,同时其竞争对手Cursor也在积极扩展业务,双方竞争加剧。Cursor依赖Anthropic的技术,并通过引入高管和创新提升竞争力。 亮点提要: ?? Anthropic年化收入达到40亿美元,较年初增长近四倍。 ?? Cursor通过引入Anthropic的高管增强市场竞争力。 ?? 人工智能技术快速发展,编程工具需求持续增加。 ↓点击阅读原文,进AIbase官网. 阅读原文

上一篇:2025-08-15_AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;宇树 H1夺机器人史首枚1500米金牌 下一篇:2025-09-02_AI日报:腾讯开源3D世界模型;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

TAG标签:

24
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价