非常感谢大神的分享,大致过了一下,内容比较偏向八股,AI相关的部分可不可以加一些,比较推荐的实战资源或者体系的知识点介绍? 另外比较佩服大神的学习能力,我先前是有看过一些内容的,比如PPO、DPO、GRPO等一些知识点,甚至一些公式手动推导过,但是过一阵回头过来看,脑子又空空如也,甚至都想不起来某个算法大体思路。而且像LLM的RL,是相当耗费资源的,普通人实战是有一定的成本的,如果问题比较细节,很难不露馅儿。
非常感谢大神的分享,大致过了一下,内容比较偏向八股,AI相关的部分可不可以加一些,比较推荐的实战资源或者体系的知识点介绍?
另外比较佩服大神的学习能力,我先前是有看过一些内容的,比如PPO、DPO、GRPO等一些知识点,甚至一些公式手动推导过,但是过一阵回头过来看,脑子又空空如也,甚至都想不起来某个算法大体思路。而且像LLM的RL,是相当耗费资源的,普通人实战是有一定的成本的,如果问题比较细节,很难不露馅儿。