twinkle
0.4.0.dev0
使用指引
快速开始
Twinkle安装
服务端和客户端
NPU(昇腾)开箱指南
ModelScope上的Twinkle训练服务
Qwen3.5 训练最佳实践
组件
数据集
数据格式
模板
预处理器和过滤器
数据加载
任务处理器
模型
采样器
奖励
优势
Gym
Hub
检查点引擎
指标
损失
损失缩放
LRScheduler
补丁
组件化
训练中间件
twinkle
Twinkle DOCUMENTATION
查看页面源码
Twinkle DOCUMENTATION
使用指引
快速开始
Twinkle安装
服务端和客户端
NPU(昇腾)开箱指南
ModelScope上的Twinkle训练服务
Qwen3.5 训练最佳实践
组件
数据集
基本数据集组件
懒加载数据集
固定长度装箱数据集
流式数据集
流式固定长度装箱数据集
数据格式
消息
轨迹
模型输入
模型输入
采样输出
模型输出
模板
Template
模板对应关系
预处理器和过滤器
Preprocessor
内置预处理器
Filter
数据加载
DataLoader
任务处理器
InputProcessor
GRPOLossProcessor
模型
TwinkleModel
TransformersModel
MultiLoraTransformersModel
MegatronModel
MultiLoraMegatronModel
采样器
Sampler
vLLMSampler
TorchSampler
奖励
Reward
GSM8K 奖励
多模态奖励
OlympiadBench 奖励
优势
Advantage
GRPOAdvantage
RLOOAdvantage
Gym
Gym
Hub
Hub
检查点引擎
CheckpointEngine
NCCLCheckpointEngine
HCCLCheckpointEngine
指标
TrainMetric
LossMetric
Accuracy
CompletionRewardMetric
DPOMetric
构建指标
损失
交叉熵
分块交叉熵
DPO 损失
GKD 损失
GRPO 损失
MSE 损失
构建新的 Loss
损失缩放
损失缩放
LRScheduler
CosineWarmupScheduler
LinearWarmupScheduler
补丁
Patch
组件化
Plugin
服务安全
训练中间件
DeviceMesh/DeviceGroup
RemoteClass
Indices and tables
索引
模块索引
搜索页面