智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型
整理 | 褚杏娟 近日,智谱宣布清言 App 推出“视频通话”功能,同时官宣了新一代基座大模型 GLM-4-Plus,此外还将 CogVideoX-5B 开源、GLM-4-Flash 免费。
全新的“视频通话”功能来了
清言 App 迎来“视频通话”功能,这是清言 App 继 7 月上线生成视频功能清影 Ying 后又一重大更新,也是国内首个面向 C 端开放的视频通话。
清言视频通话跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。用户拨打清言的视频通话窗口,即可与它进行流畅通话,即便频繁打断它也能迅速反应。清言可以理解摄像头拍摄到的内容,可以听懂指令并准确执行。这样的体验就如同和真人视频通话一样。
下面是在游戏陪伴、作业辅导、作业辅导和一些生活场景下,清言视频通话功能的表现:
据悉,清言 App 视频通话功能将于 8 月 30 日上线,首批面向清言部分用户开放,同时开放外部申请。
清影视频通话内测开通链接:https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf
GLM-4-Plus 发布并上线开放平台
GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本,在语言理解、指令遵循、长文本处理等方面性能得到全面提升。
GLM-4-Plus 使用了大量模型辅助构造高质量合成数据以提升模型性能,利用 PPO 有效有效提升模型推理(数学、代码算法题等)表现,更好反映人类偏好。
语言文本能力方面,GLM-4-Plus 和 GPT4o 及 405B 参数量的 Llama3.1 相当。
LCB: LiveCodeBench
NCB: NaturalCodeBench
*represents reproduced results
长文本能力则通过更精准的长短文本数据混合策略,取得了更强的长文本的推理效果,比肩国际先进水平。
GLM-4V-Plus 还可以理解网页内容,并将其转换为 html 代码,在图像和视频理解能力方面位居前列。
GLM-4V-Plus 能够理解并分析复杂的视频内容,同时具备时间感知能力。
下面是针对该视频相关问题,GLM-4V-Plus 做出的回答。
用户:这个穿绿色衣服的球员在整个视频都做了什么?
GLM-4V-Plus:在整个视频中,穿绿色衣服的球员在场上运球,然后跳起将球投入篮筐。
用户:这个视频的精彩时刻是什么?发生在第几秒?
GLM-4V-Plus:这个视频的精彩时刻发生在第 4 秒,当时穿绿色衣服的球员跳起并将球投入篮筐。
GLM-4-Plus 现已在智谱大模型开放平台部署,企业和开发者即日起可以通过智谱开放平台 bigmodel.cn 上的 API 调用智谱最新的基座大模型。
GLM-4-Plus API 文档更新在:https://bigmodel.cn/dev/api#glm-4
GLM-4V-Plus API 文档更新在:https://bigmodel.cn/dev/api#glm-4v
MaaS 模型介绍页(包含最新模型的概要介绍):https://bigmodel.cn/dev/howuse/model
文生图模型升级文生图模型迎来最新版本 CogView-3-Plus,其效果接近目前最佳的 MJ-V6 及 FLUX 等模型,并支持图片编辑功能。
CogView-3-Plus 更新在::https://bigmodel.cn/dev/api#cogview
模型再开源
另外,继 CogVideoX 2B 版本开源后,5B 版本也于近日正式开源,性能更强,推理显存需求最低仅为 11.4GB。同时,CogVideoX-2B 的开源协议调整为更加开放的 Apache 2.0 协议,任何企业与个人均可自由使用。
随着 CogVideoX-5B 的开源,智谱不仅在开源模型数量上领先,累计下载量也突破 2000 万次,智谱以实际行动为国际开源社区做出自己应有贡献。
随着技术进步、效率提升和成本优化,智谱宣布大模型开放平台 bigmodel.cn 最具性价比的大模型,GLM-4-Flash 现已完全免费,用户可以通过调用 GLM-4-Flash 快速、免费地构建专属模型和应用。这也是智谱开放平台首个完全免费的大模型 API。
智谱表示,最新推出的基座大模型,和此前发布的 CogVideoX 等模型一道,完善了智谱自主原创的全栈大模型谱系,推动智谱实现面向世界先进水平的全面对标。
内容推荐2024年8月18-19日,AICon 全球人工智能开发与应用大会·上海站成功举办,汇聚超过60位大模型行业先锋,全方位剖析大模型训练与推理机制、多模态融合、智能体Agent前沿进展、检索增强(RAG)生成策略、端侧模型优化与应用等热点内容。经过嘉宾授权,「AI前线」为你独家整理了一份演讲PPT合集,不容错过。关注「AI前线」,回复关键词「PPT」免费获取。
会议推荐InfoQ 将于 10 月 18-19 日在上海举办 QCon 全球软件开发大会 ,覆盖前后端 / 算法工程师、技术管理者、创业者、投资人等泛开发者群体,内容涵盖当下热点(AI Agent、AI Infra、RAG 等)和传统经典(架构、稳定性、云原生等),侧重实操性和可借鉴性。现在大会已开始正式报名,可以享受 8 折优惠,单张门票立省 960 元(原价 4800 元),详情可联系票务经理 17310043226 咨询。
今日荐文
工作到凌晨两点是常态?英伟达财报揭秘:AI芯片巨头凭借超高薪酬敦促员工“拼命加班”
不发 GPT-5、直接上 GPT-6?曝 OpenAI 新模型代号 Orion,目标“杀死”幻觉
“制霸”硅谷的印度 CEO,惨遭“大清洗”?
融到2.2 亿美元才3个月就“闹崩”!5个创始人走了3个,这家 DeepMind 系创企一款AI产品都还没发!
《黑神话:悟空》被指抄袭,原作者开撕;IBM中国被曝数千研发权限突然被关;曝360儿童手表智能回答毁三观,周鸿祎道歉 | AI周报你也「在看」吗???
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线