全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2025-04-27_AI日报:Kimi全新音频基础模型Kimi-Audio;​夸克AI超级框上线 “拍照问夸克”;国行版苹果AI智能要来了

您的位置:首页 >> 新闻 >> 行业资讯

AI日报:Kimi全新音频基础模型Kimi-Audio;​夸克AI超级框上线 “拍照问夸克”;国行版苹果AI智能要来了 AI日报 4月27日?AIbase1、Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆 2、Step1X-Edit:开源图像编辑新标杆 3、夸克AI超级框升级 上线“拍照问夸克”功能:啥都能答 4、国行版苹果AI智能要来了?iOS 18.5正式版预计5月份推送 5、谷歌AI发布601个真实世界的生成式AI应用案例,涵盖各行业 6、微软发布全新Agent操作系统UFO2 ,深度整合Windows与智能自动化 7、OpenAI 推出 ChatGPT 新版本:更智能、更直观的 GPT-4o 8、Ema推新型语言模型EmaFusion:成本和准确性方面击败了 O3、Gemini 9、Liquid AI推出Hyena Edge,开创智能手机边缘设备的新时代 10、LemonAI 推出实时音视频 AI 数字人模型 Slice Live 11、智谱与生数科技达成战略合作 专注大模型联合创新 12、宝马中国宣布新车型接入DeepSeek 含5系、全新X3 1.Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆 Moonshot AI最近推出的Kimi-Audio是一款开源音频基础模型,旨在推动音频理解、生成和交互技术的发展。该模型基于Qwen2.5-7B架构,结合Whisper技术,支持多种音频任务,如语音识别和音频问答。 亮点提要: ?? Kimi-Audio具备强大的多功能音频处理能力,支持语音识别、音频问答等多项任务。 ?? 该模型在超过13亿小时的多样化音频数据上进行训练,展现了卓越的性能表现。 ?? Kimi-Audio的开源策略降低了音频AI技术的使用门槛,促进了全球AI技术的民主化进程。 详情入口: ?? https://github.com/MoonshotAI/Kimi-Audio 2.Step1X-Edit:开源图像编辑新标杆 Step1X-Edit是由Stepfun AI团队推出的开源图像编辑模型,结合了多模态大语言模型与扩散变换器,展现出强大的图像生成能力。其开源特性和高性能表现吸引了业界的广泛关注,尤其是在GEdit-Bench基准测试中表现优异。 亮点提要: ??: Step1X-Edit结合多模态大语言模型与扩散变换器,能高效生成高质量图像。??: GEdit-Bench基准测试显示其性能超越现有开源模型,接近闭源模型水平。??: 开源特性为研究和开发提供了基础,推动了图像编辑技术的创新与普及。 详情链接:https://huggingface.co/spaces/stepfun-ai/Step1X-Edit 3.夸克AI超级框升级 上线“拍照问夸克”功能:啥都能答 阿里巴巴旗下的夸克AI超级框于4月25日推出了“拍照问夸克”功能,这一创新利用视觉理解和推理模型,能够快速识别和理解用户在现实生活中遇到的各种问题。用户通过拍照可以获取准确的信息和答案,涵盖多个领域,包括文物讲解、商品识别、健康分析等。 亮点提要: ?? 新功能“拍照问夸克”基于视觉理解,能快速识别图片中的内容并提供相关信息。 ?? 用户可以通过上传商品图片直接跳转到淘宝同款链接,提升购物体验。 ?? 该功能支持多种语言提问和翻译,适用于旅行、健康、工作等多个场景。 4.国行版苹果AI智能要来了?iOS 18.5正式版预计5月份推送 苹果公司即将在5月向中国用户推送iOS 18.5正式版更新,带来备受关注的Apple智能功能。这一功能已在其他地区上线,中国用户等待了近一个月。Apple智能是一套基于个人场景的AI系统,提供多样化服务,包括照片消除和智能回复等。 亮点提要: ?? Apple智能功能将于5月正式推送给中国用户,标志着苹果进入生成式AI时代。 ?? 该功能包括照片消除、通知摘要和智能回复等多样化服务,但仅支持iPhone 15 Pro及以上机型。 ?? 用户需确保设备至少有7GB可用存储空间,这对部分用户的存储管理可能带来挑战。 5.谷歌AI发布601个真实世界的生成式AI应用案例,涵盖各行业 谷歌云最近发布了一份报告,展示了601个来自全球顶尖企业的生成式AI应用案例,显示出这一技术的快速发展和广泛应用。相比去年仅有的101个案例,增长了六倍,涵盖了汽车、金融、医疗等多个行业。 亮点提要: ??601个生成式AI应用案例展示了技术在各行业的广泛应用,较去年增长六倍。 ?? AI代理分类清晰,展示了AI在客户服务、内部生产力和安全等方面的多重角色。 ?? 各行业的实际应用案例凸显了生成式AI从实验走向生产的重要趋势。 详情入口: ?? https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders 6.微软发布全新Agent操作系统UFO2 ,深度整合Windows与智能自动化 微软近期推出的UFO2版本在自动化领域带来了显著进步,特别是在与Windows系统的深度集成方面。新版本能够直接调用Windows的原生API,极大提升了自动化任务的执行效率。与OpenAI的Operator相比,UFO2在多个测试场景中的成功率明显更高,尤其在处理复杂任务和跨应用操作时表现出色。 亮点提要: ?? UFO2与Windows系统深度集成,能直接调用原生API,提升自动化效率。 ?? UFO2的自动化任务成功率显著高于OpenAI的Operator,表现出色。 ??? 新增的画中画模式实现自动化任务与用户操作的隔离,提升用户体验。 详情入口: ?? https://github.com/microsoft/UFO?tab=readme-ov-file 7.OpenAI 推出 ChatGPT 新版本:更智能、更直观的 GPT-4o OpenAI 最近对其 ChatGPT 的 GPT-4o 版本进行了重要更新,重点在于如何更好地保存记忆以及提升在科学、技术、工程和数学(STEM)领域的技能。新版本旨在引导对话更有效地朝着富有成效的结果发展,同时提升模型的智能水平和人格特质。尽管存在某些“光滑”过度的问题,OpenAI 承诺未来将进行改进。 亮点提要: ?? 更新的 GPT-4o 版本在记忆保存和 STEM 技能方面进行了优化。 ?? OpenAI 承认模型在某些情况下存在 “光滑” 过度的问题,未来将改进。 ?? 开发者可选择新推出的 GPT-4.1系列,以获得更稳定的 API 体验。 8.Ema推新型语言模型EmaFusion:成本和准确性方面击败了 O3、Gemini Ema公司推出了新型语言模型EmaFusion,声称在成本和准确性上超越了多款知名AI模型。EmaFusion采用“级联”判断系统,能够动态平衡成本与准确性,并允许用户根据任务需求进行微调。其准确率达到94.3%,运行成本显著降低,成为企业AI发展的新选择。 亮点提要: ?? EmaFusion 的准确率达到94.3%,成本是市场平均水平的四分之一。 ?? EmaFusion 能够智能拆解复杂任务,并将其分配给最适合的 AI 模型。 ?? Ema 正与 KPMG、Hitachi 等全球领军企业合作,推动企业 AI 的发展。 详情入口: ?? https://www.ema.co/emafusion 9.Liquid AI推出Hyena Edge,开创智能手机边缘设备的新时代 Liquid AI近期推出了新型卷积模型Hyena Edge,旨在为智能手机及边缘设备提供更高效的人工智能解决方案。该模型在计算效率和内存使用上超越了传统的Transformer++模型,尤其适合资源受限的环境。 亮点提要: ?? Hyena Edge 是Liquid AI公司推出的新型卷积模型,专为智能手机等边缘设备设计。 ?? 该模型在计算效率和内存使用上优于传统的 Transformer++ 模型,适合资源受限的环境。 ?? Hyena Edge 在多个标准语言模型基准测试中表现卓越,并计划在未来开源以促进技术普及。 详情入口: ?? https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices 10.LemonAI 推出实时音视频 AI 数字人模型 Slice Live LemonAI 最近推出了其创新产品 Slice Live,这是一款全球首创的实时音视频 AI 模型。用户只需上传一张照片,即可与虚拟角色进行实时视频通话。Slice Live 采用先进的 Transformer 模型,以每秒25帧的速度渲染每个像素,确保画面流畅且真实。 亮点提要: ?? 用户只需上传一张照片,即可与虚拟角色进行实时视频通话。 ?? Slice Live 在娱乐和教育领域提供沉浸式互动体验,带来生动的学习内容。 ?? LemonAI 承诺持续探索隐私保护,确保用户数据安全。 11.智谱与生数科技达成战略合作 专注大模型联合创新 4月27日,清华大学旗下的智谱与生数科技宣布达成重大战略合作,旨在通过双方在大语言模型和多模态生成模型的技术积累,共同推进国产大模型的技术创新与产业落地。 亮点提要: ?? 智谱与生数科技将联合研发大语言模型和多模态生成模型,推动技术创新。 ?? 双方的合作将整合各自的技术特长,打造更具竞争力的行业解决方案。 ?? 合作将聚焦政企服务、文化旅游等领域,共同推动AI技术的规模化应用。 12.宝马中国宣布新车型接入DeepSeek 含5系、全新X3 宝马中国在第三季度将推出搭载DeepSeek技术的新车型,此技术将应用于第九代操作系统的多款新车,增强车主与车辆的互动体验。用户可通过BMW智能个人助理以自然语言进行交流,系统能够理解并响应口语化指令,提供便捷的驾驶体验。 亮点提要: ?? 宝马将在第三季度推出搭载DeepSeek技术的新车型,提升车载智能交互体验。 ??? 用户可通过BMW智能个人助理以自然语言进行交流,系统能理解口语化指令。 ?? DeepSeek技术旨在增强用户与车辆的互动,提供更便捷的驾驶体验。 ↓点击阅读原文,进AIbase官网. 阅读原文

上一篇:2025-03-04_AI日报:可生成汉字!智谱开源文生图模型CogView4;大模型工具Ollama存在严重漏洞;腾讯元宝下载量超DeepSeek 下一篇:2025-08-21_AI日报:智谱AI发布AutoGLM 2.0;百度蒸汽机2.0视频生成大模型上线;谷歌推出AI新功能的Pixel 10系列手机

TAG标签:

11
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价