领沨资本 - 新闻动态

九章云极- 发布R1复现以及改进技术

<p><span style="color: rgb(39, 64, 119);">近日，中国人民大学STILL项目团队、北京智源研究院团队联合九章云极DataCanvas公司在大模型慢思考推理技术上形成系列技术成果，初步复现类R1推理模型，完整开源了类R1类的实现细节以及训练技巧。进一步，创新性提出使用代码工具来增强模型推理性能，在AIME数学推理测试中超越DeepSeek-R1的模型性能。相关成果已经形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》，在预印版论文网站 arXiv上公开发表。</span></p>