Skip to main content

TIL: 学习推理模型

从OpenAI 推出o1开始,推理模型意味着大模型从对话模型演进到了思考模型,而其能力也让人看到了更多的可能性。 到DeepSeek发布并开源R1,所发表的R1论文详细地阐述了R1的训练过程,推动了业界对推理模型的研究。从某种意义上说,DeepSeek的贡献是巨大且伟大的。