全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2025-08-07_AI日报:阿里新发布Qwen3-4B模型; GPT-5详细信息提前泄露;MiniMax Speech 2.5语音生成模型上线

您的位置:首页 >> 新闻 >> 行业资讯

AI日报:阿里新发布Qwen3-4B模型; GPT-5详细信息提前泄露;MiniMax Speech 2.5语音生成模型上线 AI日报 8月7日?AIbase1、阿里新发布Qwen3-4B模型:小巧强劲,手机也能跑 AI! 2、小红书发布开源多模态大模型 dots.vlm1,以 NaViT 视觉编码器领跑行业 3、MiniMax Speech 2.5语音生成模型上线:多语种表现力更强 4、Midjourney 推出 HD 视频模式,专为专业人士打造高品质影像 5、Cursor1.4正式发布:聚焦异步长程任务,加速大型代码库自动化进程 6、谷歌否认AI搜索功能影响网站流量,但数据显示零点击搜索激增 7、MiniCPM-V4.0开源发布,堪称“手机上的 GPT-4V” 8、AMD、高通宣布旗下硬件支持 gpt-oss 系列开放模型 9、腾讯重磅开源WeKnora!解锁复杂文档智能解析,知识管理进入AI新时代 10、重磅!OpenAI 旗舰模型 GPT-5详细信息疑似在 GitHub 上提前泄露 11、FlowSpeech:全球首个书面语转口语的 TTS 1.阿里新发布Qwen3-4B模型:小巧强劲,手机也能跑 AI! 阿里通义千问团队推出的Qwen3-4B系列模型,在小型语言模型领域取得了重要突破,为移动端AI应用提供了新的技术路径。该模型不仅在性能上表现出色,还具备高效的资源利用能力,能够满足实际应用场景的需求。 亮点提要: ?? Qwen3-4B系列模型在性能与体积之间实现了平衡优化,适合移动设备运行。 ?? Qwen3-4B-Instruct-2507超越了闭源小型模型GPT-4.1-nano的表现,接近大规模模型Qwen3-30B-A3B的能力。 ?? Qwen3-4B-Thinking-2507在数学推理评测中获得高分,展现了强大的逻辑推理能力。 2.小红书发布开源多模态大模型 dots.vlm1,以 NaViT 视觉编码器领跑行业 小红书 Hi Lab 发布开源多模态大模型 dots.vlm1,其基于 NaViT 视觉编码器和 DeepSeek V3 大语言模型,展现出卓越的性能,尤其在图表推理、STEM 数学推理等方面表现突出,标志着开源多模态模型达到新高度。 亮点提要: ?? 原生自研的 NaViT 视觉编码器,支持动态分辨率,提升泛化能力。 ?? 构建了大规模清洗精细的训练集,提升图文对齐质量。 ?? 在多模态评测中表现优异,接近闭源模型 Gemini2.5Pro 和 Seed-VL1.5。 3.MiniMax Speech 2.5语音生成模型上线:多语种表现力更强 MiniMax推出了新一代语音生成模型Speech2.5,其在多语种表现力、音色复刻和语种覆盖范围等方面实现了显著提升。该模型不仅在中文方面保持全球最强水平,同时英文及其他多语种的表现也得到全面提升,为多个行业带来了便利和创新机会。 亮点提要: ?? Speech2.5在多语种表现力上取得飞跃性进步,支持40种语言切换。 ??? 音色复刻达到行业天花板级精度,可保留不同地区的口音特色。 ?? 多语种覆盖范围扩展至40个语种,包括多种新增语言,助力全球化内容创作。 4.Midjourney 推出 HD 视频模式,专为专业人士打造高品质影像 Midjourney 推出全新的 HD 视频模式,为专业用户提供更高清、更高质量的视频生成工具。该模式在分辨率和清晰度上显著提升,但成本也相应增加。此功能进一步巩固了 Midjourney 在 AI 视频生成领域的竞争力。 亮点提要: ?? HD 视频模式提供更高的像素分辨率,满足专业用户对高质量影像的需求。 ?? HD 模式成本约为 SD 模式的 3.2 倍,但能带来更优质的视觉效果。 ?? Midjourney 通过不断优化技术,与 OpenAI 的 Sora 和 Runway 的 Gen-4 等竞争者展开激烈角逐。 5.Cursor1.4正式发布:聚焦异步长程任务,加速大型代码库自动化进程 Cursor1.4版本的发布标志着其在AI驱动开发工具领域的进一步领先。该版本增强了异步和长程任务处理能力,优化了大型代码库的索引与搜索功能,并推动了AI编码工具向全自动化的转型。 亮点提要: ?? 异步任务处理能力显著提升,支持后台Agent运行并实现任务队列管理。 ?? 针对大型代码库进行了精准优化,提升了代码补全和查询效率。 ?? 推动AI编码工具向全自动化的转型,增强Agent自主性及协作功能。 详情入口: ?? https://cursor.com/en/changelog 6.谷歌否认AI搜索功能影响网站流量,但数据显示零点击搜索激增 谷歌反驳了关于AI搜索功能对网站流量造成冲击的指控,声称自然点击量保持稳定且点击质量有所提升。然而,数据表明零点击搜索比例显著增加,显示用户行为正在发生转变。 亮点提要: ?? 谷歌声称AI搜索功能未显著影响网站流量,但零点击搜索比例上升。 ?? 谷歌强调点击质量提高,但未提供具体数据支持其结论。 ?? 用户趋势转向其他平台,如Reddit和TikTok,导致谷歌流量变化。 7.MiniCPM-V4.0开源发布,堪称“手机上的 GPT-4V” MiniCPM-V4.0作为一款轻量级多模态大模型,凭借卓越的性能和优化设计,在图像、视频理解和多轮对话等任务中表现出色。其在移动设备上的高效运行能力,为AI应用提供了新的可能性。 亮点提要: ?? MiniCPM-V4.0基于SigLIP2-400M和MiniCPM4-3B构建,参数量仅为4.1B,却展现出强大的图像、视频理解能力。 ?? 在iPhone16Pro Max上实测,首次响应延迟不到2秒,解码速度超过17token/秒,具备高并发处理能力。 ?? 提供丰富的生态支持,兼容主流框架,并提供iOS应用及详细教程,降低开发者使用门槛。 详情入口: ?? https://github.com/OpenBMB/MiniCPM-o 8.AMD、高通宣布旗下硬件支持 gpt-oss 系列开放模型 AMD与高通联合宣布支持OpenAI的gpt-oss系列模型,标志着边缘计算和AI结合的重要进展。锐龙AI Max+395处理器成为首款运行gpt-oss-120b的消费级AI PC处理器,而高通骁龙平台展示了gpt-oss-20b的出色推理能力。 亮点提要: ?? AMD与高通宣布支持OpenAI的gpt-oss系列模型,推动边缘计算与AI结合。 ?? 锐龙AI Max+395处理器成为全球首款运行gpt-oss-120b的消费级AI PC处理器。 ?? 高通骁龙平台展示gpt-oss-20b的优秀推理能力,开发者可轻松访问模型。 9.腾讯重磅开源WeKnora!解锁复杂文档智能解析,知识管理进入AI新时代 腾讯开源的WeKnora是一款基于大语言模型的文档理解与检索工具,能够处理多模态文档并提供高效的结构化内容提取和智能交互功能。其模块化设计和强大的语义处理能力为多个行业带来了技术革新。 亮点提要: ?? WeKnora支持多模态文档解析,可从PDF、Word、图片等格式中提取结构化内容。 ?? 基于大语言模型的智能交互功能,支持多轮对话和自然语言查询。 ?? 模块化架构设计,便于灵活配置和扩展,适配不同行业需求。 详情入口: ?? https://github.com/Tencent/WeKnora 10.重磅!OpenAI 旗舰模型 GPT-5详细信息疑似在 GitHub 上提前泄露 文章揭示了GPT-5的性能飞跃、多版本布局以及其可能带来的影响,展示了OpenAI在大语言模型领域的进一步突破。 亮点提要: ?? GPT-5被描述为OpenAI最先进的大语言模型,具有强大的推理能力和代码质量。 ?? GPT-5将推出多个版本,以满足不同用户和场景的需求。 ?? 泄露信息的真实性引发广泛关注,开发者期待官方确认GPT-5的技术细节。 11.FlowSpeech:全球首个书面语转口语的 TTS FlowSpeech是一款创新的AI文本转语音工具,能够将书面文字转化为自然流畅的口语表达。它通过上下文感知和多模态支持技术,解决了传统TTS工具在语调变化和情感表达上的不足,为用户提供更贴近真实对话的语音体验。 亮点提要: ?? FlowSpeech专注于书面语向口语的转换,提升语音合成的自然性。 ?? 智能内容筛选功能可自动识别并剪裁不适合朗读的内容,提高语音质量。 ?? 开发团队计划推出个性化声音定制服务,拓展应用边界。 详情入口: ?? https://listenhub.ai/zh?tab=flowspeech ↓点击阅读原文,进AIbase官网. 阅读原文

上一篇:2025-08-11_AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放 下一篇:2025-03-05_AI日报:抖音测试接入豆包AI;即梦接入DeepSeek支持智能提示词生成;腾讯回应使用元宝不会改变版权归属

TAG标签:

9
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价