全国免费咨询:

13245491521

VR图标白色 VR图标黑色
X

中高端软件定制开发服务商

与我们取得联系

13245491521     13245491521

2025-05-18_记录一下最近面试情况

您的位置:首页 >> 新闻 >> 行业资讯

记录一下最近面试情况 最近在面试,面试的岗位是资深大模型算法工程师,记录一下最近的一些面试情况 ,希望可以帮到大家。 技术上的一些提问: 1. transformer的模型结构,transformer中的各种位置编码和外推策略 2. Bert的预训练任务,Bert模型的一些改进模型 3. Bert的embedding是怎么做的 4. 对Bert的CLS token的理解 5. LLM的tokenizer,bpe和bbpe的区别 6. bbpe在解码时会可能出现乱码吗 7. lora的原理和使用经验 8. 为什么要对点积注意力进行缩放,以及缩放因子为什么是根号下d_k 9. 常见的注意力机制:MHA、MQA、GQA、MLA 10. 讲一讲qwen、DeepSeek-v3 的模型架构 11. 基于Bert微调的sequence classification和token classification的区别 12. transformer的FFN为什么要先升维再降维 13. batchNorm和layerNorm的对比,为什么需要加上仿射变换 14. 模型训练显存开销主要来自哪几部分 15. 讲一讲AdamW优化器。 16. 解释一下交叉熵和KL,两者有什么关系。 17. PPO和GRPO的区别 18. 讲一下对MOE架构的理解 19. next token prediction为什么可以做出这么好的效果。 项目上的一些考察点或者问法 1. 项目解决了什么问题,创造了什么价值,量化指标 2. 你在项目中担当什么角色,承担什么工作 3. 如果你现在负责这个项目重新开始,你会怎么做 4. 会有跨部分沟通合作吗?都是如何协作的? 5. 客观评价一下这个项目 应用上的考察点 1. Agent:常见的Agent框架和模式 2. RAG:向量模型、知识库构建、分片策略、优化经验、如何评估 3. 模型微调:监督微调、强化微调、lora等 4. chatBI 其他的开放性问题 1. 最近在关注哪些技术,讲讲业界最近有什么大事 2. 自己辛辛苦苦做了很久的优化,结果直接被最新的开源技术或模型秒杀,如何看待这种情况。 3. 最近3年的职业规划 4. 你觉的自己最大的优点或者优势 5. 为什么要离职 内容来自: 知乎@JerryFly

上一篇:2022-04-29_「转」122个经典SOTA模型、223个算法实现资源,我们帮你一文汇总了 下一篇:2021-03-05_听说你的多智能体强化学习算法不work?那你用对MAPPO了吗

TAG标签:

20
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设网站改版域名注册主机空间手机网站建设网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。
项目经理在线

相关阅读 更多>>

猜您喜欢更多>>

我们已经准备好了,你呢?
2022我们与您携手共赢,为您的企业营销保驾护航!

不达标就退款

高性价比建站

免费网站代备案

1对1原创设计服务

7×24小时售后支持

 

全国免费咨询:

13245491521

业务咨询:13245491521 / 13245491521

节假值班:13245491521()

联系地址:

Copyright © 2019-2025      ICP备案:沪ICP备19027192号-6 法律顾问:律师XXX支持

在线
客服

技术在线服务时间:9:00-20:00

在网站开发,您对接的直接是技术员,而非客服传话!

电话
咨询

13245491521
7*24小时客服热线

13245491521
项目经理手机

微信
咨询

加微信获取报价