AI日报: OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%
AI日报
4月24日?AIbase1、OpenAI发布gpt-image-1 API,4o图像生成能力正式开放
2、谷歌 Gemini 月活跃用户突破 3.5 亿,仍与 ChatGPT 存在差距
3、OpenAI预测2029年收入激增至1250亿美元
4、Ostris发布Flex.2-preview,8B参数扩散模型革新ComfyUI工作流
5、英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述
6、纳米AI发布MCP万能工具箱,简化AI工具集成与调用
7、腾讯云代码助手CodeBuddy推出Craft软件开发智能体
8、昆仑万维开源Skywork-R1V 2.0版本
9、智谱宣布旗下多款大模型产品降价 其中GLM-4-Plus降价90%
10、JSON Visuals for ChatGPT发布,解锁无限图像风格创作
11、国家知识产权局:中国成为全球AI专利最大拥有国,占比达60%
12、199元!小米新款智能音箱发布:AI大模型加持,智能对话再升级
1.OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能
OpenAI最近推出了gpt-image-1图像生成API,开发者可以将这一先进技术轻松集成到各种应用中。这一功能自上线以来,吸引了大量用户,生成了超过7亿张图像。gpt-image-1不仅支持多种图像风格,还内置安全护栏,确保生成内容符合公司政策。
亮点提要:
?? OpenAI推出gpt-image-1图像生成API,开发者可轻松集成到应用中。
??? 用户在新功能上线第一周便生成超过7亿张图像,吸引了数百万新用户。
?? gpt-image-1的图像生成成本合理,低至每张图像2美分。
2.谷歌 Gemini 月活跃用户突破 3.5 亿,仍与 ChatGPT 存在差距
谷歌的人工智能聊天机器人Gemini在过去一年中实现了显著的用户增长,月活跃用户数达到了3.5亿,日活跃用户数也从900万增至3500万。然而,与市场领先者ChatGPT的6亿月活跃用户相比,Gemini仍有差距。
亮点提要:
?? Gemini的月活跃用户数已达3.5亿,日活跃用户增至3500万。
?? ChatGPT的月活跃用户为6亿,仍领先Gemini。
?? 谷歌通过与三星的合作及产品整合,推动Gemini快速增长。
3.OpenAI预测2029年收入激增至1250亿美元
OpenAI近期发布的收入预测显示,到2029年,其总收入预计将达到1250亿美元,其中AI代理业务和渠道收入将成为主要驱动力。2023年,OpenAI的收入达到37亿美元,周活跃用户超过5亿,显示出显著增长。
亮点提要:
?? 预计到2029年,OpenAI收入将达1250亿美元,AI代理业务成为主要增长点。
?? 2023年收入达37亿美元,周活跃用户超过5亿,显示出显著增长。
?? 预计未来四年将实现现金流转正,毛利润占比将提升至近70%。
4.Ostris发布Flex.2-preview,8B参数扩散模型革新ComfyUI工作流
Ostris团队推出了Flex.2-preview,这是一款基于8亿参数的文本到图像扩散模型,旨在优化ComfyUI工作流。该模型在图像生成的控制能力上表现卓越,支持多种功能如图像修补和深度控制,已在Hugging Face开源,迅速吸引了AI艺术创作社区的关注。
亮点提要:
?? 通用控制支持:内置线条、姿态和深度控制,精确引导生成结果,适合多种创作需求。
??? 图像修补能力:支持高级图像修补,用户可通过掩码进行内容替换或修复,提升创作灵活性。
?? ComfyUI集成:模型专为ComfyUI优化,提供节点化工作流支持,简化复杂任务配置。
详情入口:
?? https://huggingface.co/ostris/Flex.2-preview
5.英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述
NVIDIA AI团队推出的Describe Anything3B(DAM-3B)模型在多模态学习领域引起了广泛关注。该模型能够根据用户指定的图像或视频区域生成详细描述,超越了传统图像标注的局限性。
亮点提要:
??? DAM-3B具备区域化描述能力,能够根据用户指定区域生成详细描述,提升描述的精准性和丰富性。
?? NVIDIA开源了DAM-3B的代码、模型权重和数据集,推动了多模态AI研究的透明性和社区协作。
?? 模型在内容创作、智能交互和无障碍技术等多个领域展现出广泛的应用前景,推动社会包容性进步。
详情入口:
?? https://github.com/NVlabs/describe-anything
6.纳米AI发布MCP万能工具箱,简化AI工具集成与调用
纳米AI推出的MCP万能工具箱旨在简化Model Context Protocol的配置复杂性,提供一站式解决方案。该工具箱预配置了100多个MCP服务和18个常用API密钥,支持多种功能如图像、音频和视频生成。它的发布引发了AI开发者社区的广泛关注,社区反馈积极,认为其高效性与易用性显著提升了开发者的工作效率。
亮点提要:
?? 预配置100多个MCP服务,开发者无需手动配置即可直接调用,降低接入门槛。
?? 内置18个常用API密钥,用户可省去自行获取密钥的繁琐步骤,简化初始配置。
?? 支持多模态生成,通过自然语言指令生成图像、音频和视频,提升创作效率。
详情入口:
?? https://bot.n.cn/download?src=AIBotCode
7.腾讯云代码助手CodeBuddy推出Craft软件开发智能体
腾讯云于4月24日发布了全新升级的代码助手CodeBuddy,推出Craft软件开发智能体。此工具将AI编程从简单的代码补全提升至项目交付,显著提高了开发效率。开发者只需用自然语言输入需求,Craft便能自动生成完整的项目代码,并支持主流IDE。Craft还支持MCP协议,实现代码的无缝接入测试、构建和部署,兼容腾讯生态系统,助力团队高效协作。
亮点提要:
?? Craft智能体能将开发者的自然语言需求转化为完整的项目代码,极大简化开发流程。
?? 支持MCP协议,使得AI生成的代码能够无缝接入测试和部署环节,提高了开发的连贯性。
?? CodeBuddy已在腾讯内部广泛应用,85%的开发者使用该工具,显著提升了整体开发效率。
详情入口:
?? https://cnb.cool
8.昆仑万维开源Skywork-R1V 2.0版本
昆仑万维于4月24日发布了其多模态推理模型Skywork-R1V2.0,显著提升了视觉与文本推理能力,尤其在高考理科难题和通用任务场景中表现优异。该模型在多个权威基准测试中刷新了开源SOTA纪录,展现出与商业闭源模型相媲美的能力。R1V2.0的开源不仅体现了昆仑万维在多模态领域的技术实力,也为全球开发者和研究者提供了强大的工具,推动了多模态生态的建设。
亮点提要:
?? R1V2.0在中文理科题目推理方面表现突出,成为免费AI解题助手,刷新多个开源SOTA纪录。
?? 采用多模态奖励模型Skywork-VL Reward和混合偏好优化机制,提升模型在多任务、多领域下的适应能力。
?? 昆仑万维致力于推动开源和创新,R1V2.0的开源为AGI的发展提供了新的基座模型,未来将继续推出领先的大模型与数据集。
详情入口:
?? https://github.com/SkyworkAI/Skywork-R1V
9.智谱宣布旗下多款大模型产品降价 其中GLM-4-Plus降价90%
智谱BigModel开放平台于4月24日宣布其多款大模型产品价格大幅调整,进入了“亿时代”,使企业能够以低成本接触到先进的AI技术。此次调整包括GLM-4-FlashX、GLM-Z1系列和GLM-4-Plus等多个产品,特别是GLM-4-Plus的降价幅度高达90%。
亮点提要:
?? GLM-4-FlashX模型每亿tokens价格仅为10元,推理速度与GPT-4相当,表现优异。
?? GLM-Z1-AirX推理速度是DeepSeek-R1的8倍,性价比高,GLM-Z1-Air价格仅为DeepSeek-R1的1/30。
?? GLM-4-Plus价格降至5元/百万tokens,行业领先,满足多行业场景需求。
10.JSON Visuals for ChatGPT发布,解锁无限图像风格创作
JSON Visuals for ChatGPT的发布为图像生成带来了全新的创意维度,用户可以利用超过50种美学代码和随机化器,轻松生成个性化的视觉内容。该工具不仅提升了生成的灵活性,还支持高分辨率输出,适用于数字艺术、品牌营销、游戏设计等多个领域。
亮点提要:
? 50+美学代码,支持多样化风格生成,满足创作需求。
?? 属性随机化器,自动调整风格属性,探索创意无限可能。
?? 高兼容性,快速生成高分辨率图像,提升用户体验。
详情入口:
?? https://json.visuals.zip/
11.国家知识产权局:中国成为全球AI专利最大拥有国,占比达60%
在国务院新闻办公室的发布会上,国家知识产权局局长申长雨宣布,中国在人工智能领域展现出强劲的发展势头,已成为全球AI专利的最大拥有国,专利数量占全球总量的60%。这一成就不仅反映了科技创新的突破,也彰显了中国在新兴产业中的领导地位。
亮点提要:
?? 中国在全球人工智能专利中占据60%份额,成为最大拥有国。
?? 国家知识产权局推出多项政策,支持人工智能技术的快速发展与应用。
?? 2024年知识产权授权数据喜人,社会满意度提升至82.36分。
12.199元!小米新款智能音箱发布:AI大模型加持,智能对话再升级
小米新款智能音箱以199元的亲民价格正式发布,虽然在硬件配置上相比Pro版有所精简,但其AI大模型的引入使得智能交互体验得到了显著提升。新音箱支持连续对话与指令语控,用户能够更高效地操控智能家居。
亮点提要:
?? 外观设计延续Pro版简约风格,采用清爽浅灰色外壳,尺寸更小巧。
?? 功能上有所取舍,取消红外遥控和Type-C音频连接,但声学配置依然出色。
?? AI大模型加持,支持连续对话和远程备车功能,智能交互体验显著提升。
↓点击阅读原文,进AIbase官网.
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线