AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch
AI日报
5月9日?AIbase1、无需邀请码!扣子空间宣布开放测试
2、音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom
3、成本降低88%:阿里巴巴ZeroSearch技术颠覆AI训练模式
4、OpenAI 推出 GitHub 连接器,ChatGPT 深度研究工具迎来新功能
5、联想发布天禧个人超级智能体,将布局在各类终端设备
6、OpenAI 在亚洲推出数据驻留计划,助力本地企业合规
7、Multiverse发布全球首款AI生成多人在线游戏,以超低成本改写游戏开发规则
8、秘塔AI搜索上线“讲题”功能 降低家长辅导门槛
9、Genspark 推出“AI Sheets”电子表格AI工具,革新数据处理体验
10、Google Gemini API迎来隐式缓存功能 自动节省开发成本高达75%
11、PixVerse v4登陆Replicate,AI视频生成速度与质量再突破
12、快手祭出“内容净化器”KuaiMod!多模态AI专治各种劣质内容
13、英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现
1.无需邀请码!扣子空间宣布开放测试
扣子空间(Coze Space)正式开放测试,用户无需邀请码即可登录使用。该平台展示了强大的AI协作能力,已吸引内测用户创建了多种优质案例。扣子空间不仅提供通用AI助手,还上线了用户研究、华泰A股观察及舆情分析等专家Agent,满足不同行业需求。
亮点提要:
??? 扣子空间开放测试,用户可直接登录官网使用,无需邀请码。
????? 三个专家Agent上线,分别为用户研究、华泰A股观察和舆情分析,满足多行业需求。
?? 开发团队承诺持续优化平台功能,提升用户体验,欢迎用户反馈。
2.音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom
腾讯推出的HunyuanCustom是一款革命性的一致性视频生成工具,能够通过单张图像生成生动的视频内容,并实现音频与口型的精准同步。HunyuanCustom不仅支持多种场景模拟,还具备强大的视频编辑功能,为创作者提供了更多的创意空间,未来在创意产业中有望带来更多精彩作品。
亮点提要:
??? HunyuanCustom允许用户仅通过一张图像生成深度伪造风格的视频,简化了视频制作流程。
?? 利用LatentSync系统,该工具实现了音频与口型的精准同步,提升了观众的沉浸感。
?? HunyuanCustom具备视频到视频(V2V)编辑功能,用户可智能替换视频内容,增强创意空间。
详情入口:
?? https://aivideo.hunyuan.tencent.com/
3.成本降低88%:阿里巴巴ZeroSearch技术颠覆AI训练模式
阿里巴巴集团推出的ZeroSearch技术通过模拟方法改变了AI系统的信息搜索训练方式,消除了对昂贵搜索引擎API的依赖。这项技术不仅解决了搜索引擎返回文档质量的不确定性和高昂的API调用成本,还通过强化学习框架显著降低了AI训练的经济负担。
亮点提要:
?? ZeroSearch技术通过模拟方法提升AI搜索能力,消除对真实搜索引擎的依赖。
?? 该技术将AI训练成本降低了88%,使高级AI训练更加平民化。
?? ZeroSearch在多个模型上验证成功,预示AI系统将更自给自足,改变技术格局。
4.OpenAI 推出 GitHub 连接器,ChatGPT 深度研究工具迎来新功能
OpenAI 最近宣布对其 AI 驱动的深度研究工具进行升级,新增 GitHub 连接器,旨在帮助开发者更有效地分析代码库和工程文档。该功能允许用户直接询问代码相关问题,极大地方便了编程工作。
亮点提要:
?? OpenAI 推出新的 GitHub 连接器,允许开发者分析代码库和工程文档。
??? ChatGPT 深度研究工具可帮助用户拆解产品规格并学习如何实现新的 API。
?? OpenAI 加强安全措施,限制特定功能的使用,仅对经过验证的组织开放。
5.联想发布天禧个人超级智能体,将布局在各类终端设备
在上海世博中心举行的创新科技大会上,联想集团推出了天禧个人超级智能体,标志着混合式人工智能的重大突破。天禧具备感知与交互、认知与决策、自主与演进三大核心功能,能够实时感知环境并与用户互动,理解复杂意图并提供个性化建议。
亮点提要:
?? 联想发布天禧个人超级智能体,标志着混合式人工智能的突破。
?? 天禧智能体能够实时感知环境,并为用户提供个性化的购物建议。
?? 天禧具备自主任务执行能力,可以减轻用户的日常负担。
6.OpenAI 在亚洲推出数据驻留计划,助力本地企业合规
OpenAI最近宣布在亚洲推出一项全新的数据驻留计划,旨在帮助当地企业更好地满足数据主权要求。此计划适用于多个产品,包括ChatGPT Enterprise、ChatGPT Edu和OpenAI API,允许用户选择将数据存储在日本、印度、新加坡和韩国等地。
亮点提要:
?? OpenAI 推出亚洲数据驻留计划,支持企业满足本地数据主权要求。
?? 数据存储地点包括日本、印度、新加坡和韩国,确保用户数据安全。
?? 该计划是 OpenAI 国际扩张的一部分,旨在构建必要的基础设施。
7.Multiverse发布全球首款AI生成多人在线游戏,以超低成本改写游戏开发规则
EnigmaLabsAI团队推出的Multiverse被誉为全球首款由AI生成的多人在线游戏,标志着游戏开发的新纪元。该游戏以其AI驱动的动态世界和极低的研发成本(仅1500美元)震撼行业,彻底改变了传统游戏开发的成本结构。
亮点提要:
?? Multiverse是全球首款由AI生成的多人在线游戏,采用实时动态世界模拟技术,玩家的每个动作都会影响游戏环境。
?? 该游戏的研发成本仅为1500美元,颠覆了传统游戏开发的高成本模式,为独立开发者提供了机会。
?? Multiverse的完全开源开发理念激发了社区活力,全球开发者可以自由学习与改进,推动了技术的快速迭代。
详情入口:
?? https://github.com/EnigmaLabsAI/Multiverse
8.秘塔AI搜索上线“讲题”功能 降低家长辅导门槛
AI秘塔公司推出的“塔子老师讲题”功能,旨在缓解家长在辅导孩子作业时面临的知识焦虑与时间压力。该功能通过AI技术实现题目自动识别和解题步骤的可视化讲解,覆盖从小学到成人考证的各个学段。
亮点提要:
?? 该功能利用AI技术实现题目自动识别和解题步骤可视化,旨在降低家长辅导门槛。
?? 覆盖小学至成人考证的全学段题目,支持拍照上传后自动解析,提供详细的解题过程。
?? 平均讲解时长约3分钟,复杂题目可拆解为5-7个分析节点,帮助学生更好理解知识点。
9.Genspark 推出“AI Sheets”电子表格AI工具,革新数据处理体验
人工智能初创公司Genspark推出的“AI Sheets”电子表格AI工具,通过智能化手段简化数据处理流程,提升用户办公效率。该工具支持聊天操作,自动完成数据搜索、整理、分析与可视化,颠覆传统电子表格使用方式。
亮点提要:
?? 自动数据分析与可视化:用户输入提示,工具自动生成图表或可视化结果。
?? 智能信息检索:AI自动查找公司、人物、产品等相关数据,无需手动输入。
?? AI替代公式:通过自然语言指令批量处理数据,突破Excel复杂公式的限制。
10.Google Gemini API迎来隐式缓存功能 自动节省开发成本高达75%
Google最近在其Gemini API中推出了隐式缓存功能,旨在帮助开发者在使用AI模型时显著降低成本,最高可节省75%。这一功能通过自动识别和重用相似请求的内容,简化了开发者的操作流程,减少了手动配置的需求。
亮点提要:
?? 隐式缓存功能可自动识别并重用相似请求内容,帮助开发者节省高达75%的费用。
?? 与显式缓存不同,隐式缓存无需手动定义高频请求,简化了操作流程。
?? Google建议开发者在请求开头放置重复上下文,以提高命中缓存的几率。
详情入口:
?? https://developers.googleblog.com/en/gemini-2-5-models-now-support-implicit-caching/
11.PixVerse v4登陆Replicate,AI视频生成速度与质量再突破
PixVerse v4在Replicate平台的上线为内容创作者带来了前所未有的高清视频生成体验。新版本不仅支持多种分辨率的视频生成,还在生成速度和视觉效果上实现了显著提升。它的创新功能如音效同步和风格迁移,为用户提供了更丰富的创作可能性。
亮点提要:
?? PixVerse v4支持生成5秒至8秒的高清视频,分辨率覆盖540p至1080p,生成速度和画面细节令人惊叹。
?? 新版本引入音效同步和风格迁移功能,用户可轻松生成带有自然音效的视频,并一键切换至多种艺术风格。
?? PixVerse v4通过开源和低门槛的API接入,让个人用户和小型企业也能轻松创作视频,极大降低了创作门槛。
详情入口:
?? https://platform.pixverse.ai
12.快手祭出“内容净化器”KuaiMod!多模态AI专治各种劣质内容
在短视频日益成为人们生活重要组成部分的背景下,快手推出了KuaiMod,旨在通过多模态大模型优化短视频平台生态。KuaiMod的核心是对短视频内容质量的判别,通过建立包含1000条视频的数据集,提升内容识别的准确性,并引入强化学习策略,实时更新模型以应对用户偏好的变化。
亮点提要:
?? KuaiMod通过建立1000条视频数据集,制定了首个短视频内容质量判别基准测试。
?? 采用强化学习策略,KuaiMod能够根据用户反馈实时更新和优化判别模型。
?? 初步测试显示,KuaiMod的内容质量判别准确率高达92.4%,显著提升了内容识别效果。
详情入口:
?? https://kuaimod.github.io/
13.英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现
英伟达最新发布的Open Code Reasoning(OCR)模型套装引起了技术界的广泛关注,展示了其在人工智能领域的创新能力。该模型套装包含多种参数规模的模型,旨在为开发者提供强有力的代码推理和生成工具。
亮点提要:
?? 英伟达的OCR模型套装包括32B、14B和7B三种不同参数规模,基于优化的Nemotron架构,适应多语言和多任务学习。
?? 32B模型专为高性能推理设计,14B模型平衡计算需求与性能,7B模型则适合资源受限的环境。
?? 在LiveCodeBench基准测试中,OCR模型的表现超越OpenAI的o3-Mini和o1(low)模型,显示出卓越的推理能力和实际应用潜力。
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线