twinkle
0.4.0.dev0

使用指引

  • 快速开始
  • Twinkle安装
  • 服务端和客户端
  • NPU(昇腾)开箱指南
  • ModelScope上的Twinkle训练服务
  • Qwen3.5 训练最佳实践

组件

  • 数据集
  • 数据格式
  • 模板
  • 预处理器和过滤器
  • 数据加载
  • 任务处理器
  • 模型
  • 采样器
  • 奖励
  • 优势
  • Gym
  • Hub
  • 检查点引擎
  • 指标
  • 损失
  • 损失缩放
  • LRScheduler
  • 补丁
  • 组件化
  • 训练中间件
twinkle
  • Twinkle DOCUMENTATION
  • 查看页面源码

Twinkle DOCUMENTATION

使用指引

  • 快速开始
  • Twinkle安装
  • 服务端和客户端
  • NPU(昇腾)开箱指南
  • ModelScope上的Twinkle训练服务
  • Qwen3.5 训练最佳实践

组件

  • 数据集
    • 基本数据集组件
    • 懒加载数据集
    • 固定长度装箱数据集
    • 流式数据集
    • 流式固定长度装箱数据集
  • 数据格式
    • 消息
    • 轨迹
    • 模型输入
    • 模型输入
    • 采样输出
    • 模型输出
  • 模板
    • Template
    • 模板对应关系
  • 预处理器和过滤器
    • Preprocessor
    • 内置预处理器
    • Filter
  • 数据加载
    • DataLoader
  • 任务处理器
    • InputProcessor
    • GRPOLossProcessor
  • 模型
    • TwinkleModel
    • TransformersModel
    • MultiLoraTransformersModel
    • MegatronModel
    • MultiLoraMegatronModel
  • 采样器
    • Sampler
    • vLLMSampler
    • TorchSampler
  • 奖励
    • Reward
    • GSM8K 奖励
    • 多模态奖励
    • OlympiadBench 奖励
  • 优势
    • Advantage
    • GRPOAdvantage
    • RLOOAdvantage
  • Gym
    • Gym
  • Hub
    • Hub
  • 检查点引擎
    • CheckpointEngine
    • NCCLCheckpointEngine
    • HCCLCheckpointEngine
  • 指标
    • TrainMetric
    • LossMetric
    • Accuracy
    • CompletionRewardMetric
    • DPOMetric
    • 构建指标
  • 损失
    • 交叉熵
    • 分块交叉熵
    • DPO 损失
    • GKD 损失
    • GRPO 损失
    • MSE 损失
    • 构建新的 Loss
  • 损失缩放
    • 损失缩放
  • LRScheduler
    • CosineWarmupScheduler
    • LinearWarmupScheduler
  • 补丁
    • Patch
  • 组件化
    • Plugin
    • 服务安全
  • 训练中间件
    • DeviceMesh/DeviceGroup
    • RemoteClass

Indices and tables

  • 索引

  • 模块索引

  • 搜索页面

下一页

© 版权所有 2022-2026, ModelScope Community。

利用 Sphinx 构建,使用的 主题 由 Read the Docs 开发.