面试时间:2023面试职位:大模型算法分享时间:2023-11
- 面试经历:
- 公司来学校进行宣讲,头的建立,没有笔试,直接进入面试,是线上的面试,第一面是hr,聊了下职业规划,第二面是技术面试,面了很多的问题、包括机器学习、深度学习、强化学习等
- 面试官提的问题:
- PPO算法中使用GAE的好处以及参数γ和λ的作用是什么?
PPO算法和DQN算法的区别是什么?
有哪些PPO算法的调参经验?
在线强化学习和离线强化学习在技术和应用场景上有什么区别?
强化学习和大模型之间的关联是什么?
如何评估大模型中数据集的质量?
目前国内一般选择基于哪些基座模型继续训练?
国内做大模型的主要工作是哪几个部分?
除了数据之外,还有哪些方向的工作可以进一步优化大模型的效果?
大语言模型是怎么输出的,观察过输出的概率值吗?
有用(0) 面试感觉:一般 面试难度:困难 应聘途径:校园招聘