AI日报:微软必应推出全新视频创作工具;小米将多枚Kimi商标转让给月之暗面;谷歌推AI Edge Gallery应用
AI日报
6月3日?AIbase1、小米将多枚“Kimi” 商标转让给月之暗面
2、微软必应推出全新视频创作工具Bing Video Creator,用户可轻松生成 AI 视频
3、ElevenLabs推全新语音交互平台Conversational AI 2.0:AI语音助手比真人还懂你
4、谷歌 Gemini Live 功能正式登陆 iOS 平台,开启 AI 识别新体验
5、Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频
6、OpenAI用Rust重新打造Codex CLI,告别Node.js
7、NUS 推出 OmniConsistency:低成本实现图像风格化一致性,挑战 GPT-4o!
8、Hume AI重磅发布EVI 3:懂你情绪的语音AI,比GPT-4o还快!
9、内幕曝光:苹果拥有媲美ChatGPT的 1500 亿参数AI模型却拒绝发布
10、谷歌推出AI Edge Gallery应用,实现离线智能手机AI处理
11、Cerebras 推理 API 全面开放,开发者每日获百万免费 Token
12、英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍1.
1.小米将多枚“Kimi” 商标转让给月之暗面
小米将“Kimi”商标转让给专注于AI助手的月之暗面,此举可能是小米优化资源的战略调整,同时助力月之暗面拓展其智能助手业务。
亮点提要:
?? 小米将多枚‘Kimi’商标转让给北京月之暗面科技有限公司,优化非核心商标资源。
?? 月之暗面推出的Kimi智能助手于2023年上线,此次商标转让为其发展提供支持。
?? 此次交易可能为双方带来更好的市场发展机遇,推动智能助手领域的发展。
2.微软必应推出全新视频创作工具Bing Video Creator,用户可轻松生成 AI 视频
微软必应推出了基于OpenAI Sora模型的Bing视频创作器,用户可通过文本提示免费生成短视频,但目前仅支持移动设备且生成速度较慢。
亮点提要:
? 新功能:Bing视频创作器首次免费开放,用户只需简单文字描述即可生成短视频。
?? 限制:目前仅支持移动设备,未在桌面端推出,影响部分用户的使用体验。
?? 激励机制:用户可通过搜索或购物获取积分,免费生成10段视频后需付费继续生成。
3.ElevenLabs推全新语音交互平台Conversational AI 2.0:AI语音助手比真人还懂你
ElevenLabs发布了Conversational AI 2.0,该平台在对话流畅性、多语言支持和企业级应用能力上实现了重大突破,为客服、营销和内容创作等领域带来全新可能。
亮点提要:
? 引入先进轮流对话模型,精准捕捉用户对话节奏,避免中断,提升对话流畅性。
? 支持32+语言无缝切换,内置自动语言检测功能,助力全球化企业客户服务。
? 集成了RAG技术,从企业知识库提取信息,确保回答专业性和准确性。
详情入口:
?? https://elevenlabs.io/blog/conversational-ai-2-0
4.谷歌 Gemini Live 功能正式登陆 iOS 平台,开启 AI 识别新体验
谷歌的Gemini Live功能已上线iOS和iPadOS平台,支持AI识别场景和屏幕内容,且目前免费使用。该功能通过摄像头和屏幕共享提供便捷的信息获取体验,但目前仅限美国地区用户使用。
亮点提要:
?Gemini Live现已支持iOS/iPadOS,利用AI快速识别物体并提供信息。
??屏幕共享功能让用户能轻松分享屏幕内容,增强互动体验。
??功能目前仅在美国可用,谷歌正推动AI技术更广泛的应用。
5.Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频
Character.AI 推出了 AvatarFX 工具,允许用户创建自定义动画视频,并新增了 '场景' 和 '流' 功能,同时面临滥用问题。
亮点提要:
?? Character.AI 推出 AvatarFX 工具,用户可创建自定义动画视频。
?? 新增的 '场景' 和 '流' 功能让用户能分享角色创作。
?? Character.AI 因滥用事件受诉讼,平台存在安全隐患。
详情入口:
?? https://blog.character.ai/character-ai-unveils-new-ways-to-create/
6.OpenAI用Rust重新打造Codex CLI,告别Node.js
OpenAI宣布将其AI编程工具Codex CLI从Node.js迁移到Rust语言重写,这一举措带来了性能优化、安全性提升及零依赖安装等优势。
亮点提要:
?? Codex CLI由TypeScript和Node.js迁移到Rust,带来性能优化与安全性提升。
?? Rust实现零依赖安装,支持沙箱环境运行,增强跨平台兼容性。
?? Rust语言特性助力Codex CLI成为模型上下文协议客户端和服务器,性能卓越。
7.NUS 推出 OmniConsistency:低成本实现图像风格化一致性,挑战 GPT-4o!
新加坡国立大学团队发布OmniConsistency项目,通过独特学习框架和模块化架构,在极低成本下实现图像风格化与一致性的完美结合,为开发者提供强大工具。
亮点提要:
? 利用配对图像数据学习风格迁移一致性,仅需2600对高质量图像和500小时GPU算力即可达到惊艳效果。
?? 支持模块化架构,兼容现有风格化LoRA模块,轻松整合进各类项目。
?? 在开源生态中注入商业级能力,推动AI艺术创作发展。
详情入口:
?? https://github.com/showlab/OmniConsistency
8.Hume AI重磅发布EVI 3:懂你情绪的语音AI,比GPT-4o还快!
Hume AI发布了第三代语音交互模型EVI3,具备卓越的情感理解能力和个性化交互体验,标志着语音AI在情感交互和自然沟通领域的重大突破。
亮点提要:
? EVI3能精准识别用户语音中的情绪并生成特定风格的声音和个性,实现情感智能与语音交互的完美融合。
?? 具备超低延迟与智能响应,推理延迟低至300毫秒,情感表达和自然度超越GPT-4o。
?? 支持多场景应用,包括客户服务、内容创作等,未来还将扩展多语言支持以覆盖全球市场。
详情入口:
?? https://demo.hume.ai/
9.内幕曝光:苹果拥有媲美ChatGPT的 1500 亿参数AI模型却拒绝发布
苹果将在WWDC上开放基础模型,但性能有限,且其更强大的内部AI模型未有公开计划。领导层分歧导致多项AI项目延期,WWDC更多是营销包装秀。
亮点提要:
?? 苹果计划开放的AI模型参数仅约30亿,性能偏小且有限,主要支持基础功能。
?? 苹果内部有更大规模的AI模型,最大达1500亿参数,但仅用于内部测试,未有公开计划。
? 苹果领导层分歧严重,多个AI项目延期,WWDC发布的多为小幅更新而非创新功能。
10.谷歌推出AI Edge Gallery应用,实现离线智能手机AI处理
谷歌推出了AI Edge Gallery应用,允许用户在手机上离线运行复杂的AI模型,增强隐私保护,支持多种AI功能,但安装和使用体验仍有提升空间。
亮点提要:
?? 谷歌推出AI Edge Gallery应用,支持离线运行AI模型,增强隐私保护。
?? 应用支持Hugging Face模型下载,提供多轮对话、视觉问答等AI功能,所有处理在本地完成。
?? 本地处理方式解决隐私问题,尤其适合医疗和金融等敏感行业。
详情入口:
?? https://github.com/google-ai-edge/gallery
11.Cerebras 推理 API 全面开放,开发者每日获百万免费 Token
Cerebras Systems宣布其推理API全面开放,取消等待名单限制,并提供每日百万免费Token,显著提升AI推理效率,尤其在实时语音、视频处理等领域表现卓越。
亮点提要:
?? 推理API开放且每日提供百万免费Token,大幅降低开发者成本。
? 推理速度达GPU的20倍,尤其适用于复杂推理模型及代码生成任务。
?? 支持主流开源模型,无缝嵌入Hugging Face和Meta平台,简化开发者流程。
12.英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍
英伟达联合MIT与香港大学发布Fast-dLLM框架,通过创新机制大幅提升扩散模型推理速度,同时保持生成质量,为AI应用提供强大支持。
亮点提要:
?? 快速提升:通过块状近似KV缓存机制实现最高27.6倍推理速度提升。
?? 创新技术:置信度感知并行解码策略确保生成质量,减少依赖冲突。
?? 实测表现:多项基准测试显示速度与准确率的良好平衡,推动扩散模型广泛应用。
详情入口:
?? https://nvlabs.github.io/Fast-dLLM/
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线