OpenStarry Blog

标签:RLHF/对齐

「RLHF/对齐」分类下共 4 篇文章。

全部选型指南 + 效率实战生成模型AI 基础RLHF/对齐AI 前沿工具教程LLM 评估RAG/检索AI Agent训练优化行业分析IDE 接入教程ChatGPT 国内接入Claude 国内接入技术深度成本优化前沿趋势迁移指南平台接入模型解读接入教程IDE 配置Coding Plan场景对比 · 客观评测平台对比 · 重写版对比评测行业洞察安全指南工具对比效率实战选型指南套餐指南
RLHF/对齐

RLHF 详解:用人类反馈强化学习训练更好的语言模型

全面解析 RLHF 的三阶段训练流程(SFT、奖励模型、PPO),理解为什么大语言模型需要人类反馈来对齐。

📅 2026-06-09
RLHF/对齐

PPO 算法详解:RLHF 中的核心优化器

深入理解 PPO 的裁剪机制和稳定性原理,掌握它在 RLHF 中如何平衡探索与利用,避免训练崩溃。

📅 2026-06-09
RLHF/对齐

GRPO:DeepSeek 提出的群体相对策略优化

解析 DeepSeek 的 GRPO 算法如何通过群体采样和相对奖励,实现更高效稳定的对齐训练,以及它在 DeepSeek 系列模型中的应用。

📅 2026-06-09
RLHF/对齐

DPO:跳过奖励模型的直接偏好优化

解析 DPO 如何用一个简单的分类损失替代复杂的 RLHF 流程,理解其背后的 Bradley-Terry 模型和数学直觉。

📅 2026-06-09