全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2025-03-18_AI日报:混元推5个开源3D模型;Anthropic MCP传输机制升级;Mistral开源模型Mistral Small3.1

您的位置:首页 >> 新闻 >> 行业资讯

AI日报:混元推5个开源3D模型;Anthropic MCP传输机制升级;Mistral开源模型Mistral Small3.1 AI日报 3月18日?AIbase1、腾讯混元推出 5 个开源3D模型:30 秒生成,兼容多平台 2、Anthropic发布MCP传输机制重大升级:告别长连接,迎接更灵活的Streamable HTTP 3、生数科技Vidu将打造首部海外AI原创科幻动漫剧集 4、谷歌云重磅推出高清语音模型 Chirp 3,支持248种声音 5、马斯克xAI收购视频生成初创公司Hotshot,AI视频领域竞争再升级 6、Roblox开源Cube3D:首个基础AI模型实现3D对象生成 7、Zoom AI助手AI Companion功能升级 8、128K超长记忆!Mistral最新开源模型Mistral Small 3.1登场,参数方面优于 GPT-4o Mini 9、谁说视频只能“一镜到底”?字节创新技术LCT,让AI像导演一样拍摄电影大片! 10、32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo 1.腾讯混元推出 5 个开源3D模型:30 秒生成,兼容多平台 腾讯混元宣布推出五个全新开源3D生成模型,基于Hunyuan3D-2.0,具备更快的生成速度和更丰富的细节。Turbo系列模型利用FlashVDM框架实现生成加速,缩短至30秒内完成。升级后的3D AI创作引擎支持多视图输入,用户可通过上传少量图片快速生成高质量3D模型,降低制作成本。 亮点提要: ? Turbo系列模型通过FlashVDM框架实现数十倍加速,生成时间缩短至30秒。 ??? Hunyuan3D-2-MV模型能更好地捕捉细节,生成符合用户预期的3D资产。 ??? 升级后的引擎支持多视图输入,用户只需上传2-4张图片即可快速生成高质量3D模型。 2.Anthropic发布MCP传输机制重大升级:告别长连接,迎接更灵活的Streamable HTTP Anthropic对Model Context Protocol(MCP)进行了重大更新,推出了Streamable HTTP传输方式,取代了传统的HTTP+SSE方案。新机制允许客户端与服务器之间更高效的双向通信,支持无状态服务器运行,简化了部署流程,并提高了系统的可扩展性。 亮点提要: ?? 移除专用的/sse端点,所有消息通过统一的/message端点传输,简化了通信流程。 ?? 服务器可动态将HTTP请求升级为SSE流,支持灵活的双向通信,解决了SSE的单向限制。 ?? 新方案兼容性大幅提升,适用于各种网络基础设施,支持无状态模式,降低了资源消耗。 详情入口: ?? https://github.com/modelcontextprotocol/specification/pull/206 3.生数科技Vidu将打造首部海外AI原创科幻动漫剧集 生数科技有限公司与Aura Productions达成战略合作,计划推出首部海外AI原创科幻动漫剧集。双方将共同制作50集短篇科幻动漫系列,利用Vidu的先进视频生成技术,提升制作效率和质量,预示着未来动漫创作将更加智能化和高效化。 亮点提要: ?? 合作推出50集短篇科幻动漫系列,计划在全球主流社交媒体平台发布。 ?? Vidu的多主体一致性功能确保角色与场景的无缝融合,实现高质量动画叙事。 ?? Vidu2.0版本大幅提升视频生成效率,能在10秒内快速生成高质量视频。 4.谷歌云重磅推出高清语音模型 Chirp 3,支持248种声音 谷歌云在伦敦的DeepMind总部推出了高清语音模型Chirp3,旨在为开发者提供强大的语音合成工具。该模型支持248种不同的声音和31种语言,能够帮助开发者创建智能语音助手、有声读物和视频配音等应用。为了确保负责任的使用,谷歌限制了语音克隆功能的访问权限,并重申了对数据隐私的承诺。 亮点提要: ?? 谷歌云推出Chirp3语音模型,支持248种声音和31种语言,助力开发者构建智能应用。 ?? 谷歌限制语音克隆功能的访问权限,以确保伦理AI的实践和防止滥用。 ?? 谷歌发起计划提升英国AI技能,并向初创企业提供云基础设施支持,促进创新。 详情入口: ?? https://cloud.google.com/text-to-speech/docs/chirp3-hd 5.马斯克xAI收购视频生成初创公司Hotshot,AI视频领域竞争再升级 埃隆·马斯克旗下的xAI公司收购了视频生成AI初创公司Hotshot,标志着其在多模态AI技术领域的进一步扩展。Hotshot以其独特的技术优势和强大的算力支持,致力于提升视频生成能力。 亮点提要: ?? Hotshot专注于AI视频生成,利用600万个视频片段进行训练,提升了模型理解视频内容的能力。 ?? 收购后,Hotshot将继续扩大视频生成器的开发,利用xAI的Colossus超级计算机的强大算力。 ?? 此次收购标志着马斯克在AI技术领域的进一步布局,预示着AI视频生成技术将迎来新一轮的突破。 6.Roblox开源Cube3D:首个基础AI模型实现3D对象生成 Roblox近日推出并开源了Cube3D,这是其首个用于生成3D对象的基础AI模型,旨在提升3D创作效率。该模型通过创新的训练方法,将3D对象标记化,能够快速生成完整的3D形状。 亮点提要: ??? Cube3D是Roblox首个开源的3D对象生成AI模型,旨在提高开发者的创作效率。 ?? 该模型通过创新的训练方法,能够将3D对象标记化并预测下一个形状,快速构建完整的3D对象。 ?? Roblox计划将Cube3D发展为多模态模型,未来将支持文本、图像和视频输入,增强创作工具的功能。 详情入口: ?? https://www.chinaz.com/ainews/16358.shtml 7.Zoom AI助手AI Companion功能升级 Zoom公司最近宣布了其AI助手Zoom AI Companion的新一轮功能升级,标志着这一工具的演变,旨在提升用户在视频会议中的互动体验和工作效率。新功能包括自动识别和完成待办事项的Zoom Tasks、转录线下对话的新语音录音器、以及定制AI助手等,预计将显著增强用户的生产力和协作能力。随着这些创新的推出,Zoom继续致力于提升各行业的工作效率。 亮点提要: ?? Zoom Tasks功能可以自动识别会议中的待办事项并完成相关任务。 ??? 新语音录音器能够转录线下对话并提供实时会议笔记。 ?? 定制AI助手功能将于4月推出,用户可根据需求定制功能。 详情入口: ?? https://www.chinaz.com/ainews/16367.shtml 8.128K超长记忆!Mistral最新开源模型Mistral Small 3.1登场,参数方面优于 GPT-4o Mini Mistral AI发布了开源模型Mistral Small3.1,凭借240亿参数的设计,其性能可与谷歌和OpenAI的产品相媲美。该模型在文本处理和多模态理解上有显著提升,支持128k tokens的上下文窗口,处理速度达到每秒150个tokens。Mistral的开源策略旨在吸引全球开发者,推动创新,同时强调其在AI领域的绿色和可持续发展。 亮点提要: ?? Mistral Small3.1具备240亿参数,性能媲美谷歌和OpenAI的同类产品,推动AI市场竞争。 ?? 该模型支持128k tokens的上下文窗口,处理速度高达每秒150个tokens,适用于长文档和快速响应场景。 ?? Mistral采取开源策略,发布Apache2.0许可证,强调欧洲数字主权,吸引全球开发者参与创新。 详情入口: ?? https://top.aibase.com/tool/mistral-small-3-1 9.谁说视频只能“一镜到底”?字节创新技术LCT,让AI像导演一样拍摄电影大片! 长上下文调整(LCT)技术的出现,极大提升了AI生成视频的叙事能力,使其能够像电影导演一样自由切换镜头,构建更连贯的故事场景。通过引入全注意力机制、交错的3D位置嵌入和异步噪声策略,LCT解决了多镜头生成中的视觉一致性和时间动态问题。这项技术不仅提高了视频内容的创造力,也为未来的长视频生成和交互式编辑开辟了新思路。 亮点提要: ?? LCT技术使AI视频生成模型能够执导多镜头叙事视频,提升叙事能力。 ?? 通过全注意力机制和交错的3D位置嵌入,LCT确保视觉一致性和时间动态。 ?? LCT支持自回归镜头扩展,便于长视频创作和交互式修改。 详情入口: ?? https://top.aibase.com/tool/zhangshangxiawentiaoyoulct 10.32B参数的“逆袭”!OLMo 2 32B横空出世,叫板GPT-3.5 Turbo OLMo232B是艾伦人工智能研究所发布的最新大型语言模型,凭借320亿参数和完全开源的特性,挑战了许多专有模型。通过精细的训练过程,OLMo232B在多项基准测试中超越了GPT-3.5Turbo和GPT-4o mini,展现出卓越的性能和更高的训练效率。 亮点提要: ?? OLMo232B是完全开源的语言模型,公开了所有数据、代码和训练过程,促进全球研究合作。 ?? 该模型拥有320亿参数,在多项基准测试中超越了GPT-3.5Turbo,证明了开源模型的强大实力。 ? OLMo232B在训练效率上表现优异,仅使用三分之一的计算资源,展现出高效的AI开发潜力。 详情入口: ?? https://github.com/allenai/OLMo-core ↓点击阅读原文,进AIbase官网. 阅读原文

上一篇:2025-05-28_AI日报:腾讯混元发布并开源语音数字人模型;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放 下一篇:2024-12-07_Mozilla Firefox 打造 Deep Fake Detector:多模型一键精准识别 AI 内容

TAG标签:

10
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价