DeepSeek-V3开源,本地仅700G可轻松运行!
来源:PaperAgent
DeepSeek V3 正式发布,模型与技术报告全开源,非常牛,又在大模型领域掀起了一股热议,概率为2句话:便宜,正式训练成本仅要557万美元(2000张H800),而GPT-4o预估一亿美金编程能力超过 Claude Sonnet 3.5根据多个基准测试,DeepSeek v3 在代码方面甚至优于 Claude Sonnet 3.5那么671B的DeepSeek V3如何本地运行尼,由于DeepSeek的框架原生采用 FP8 训练,因此仅提供 FP8 权重,预估仅700GB+显存便可轻松运行。当然也可以转换到BF16,在半精度下,需1400GB+量化到int4时需要300GB+半精度 236B的DeepSeek V2,占用 490G 显存,需要 7张 80G A100
https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/mainhttps://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf·················END·················分享
收藏
点赞
在看
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线