潞晨科技- 潞晨云微调 SDK 全量开放:对标 Tinker 范式,强化学习后训练“按 Token 计费”落地

<p><span style="color: rgb(39, 64, 119);">潞晨云围绕大模型后训练与强化学习(RL)趋势,正式开放微调 SDK。该平台对标 Thinking Machines Lab 的 Tinker,将训练过程模块化为可组合的原子能力,兼容 Tinker 接口,使开发者能在本地 Python 环境中灵活构建 SFT 到 RL 的全链路训练逻辑,而将异构集群调度等基础设施复杂度下沉至平台。在商业模式上,潞晨云推行 Serverless 架构与“按 Token 计费”模式,用户仅需为有效计算付费,大幅降低了 RLHF/RLAIF 等复杂场景的工程门槛与算力成本。目前已支持 Qwen3 系列模型,并提供 Cookbook 级实战示例。</span></p>