OpenStarry Blog

标签:训练优化

「训练优化」分类下共 4 篇文章。

全部选型指南 + 效率实战生成模型AI 基础RLHF/对齐AI 前沿工具教程LLM 评估RAG/检索AI Agent训练优化行业分析IDE 接入教程ChatGPT 国内接入Claude 国内接入技术深度成本优化前沿趋势迁移指南平台接入模型解读接入教程IDE 配置Coding Plan场景对比 · 客观评测平台对比 · 重写版对比评测行业洞察安全指南工具对比效率实战选型指南套餐指南
训练优化

Dropout 正则化:简单却强大的防过拟合技术

深入理解 Dropout 的工作原理:为什么随机丢弃神经元反而能提升模型泛化能力,以及在实际项目中如何正确使用 Dropout。

📅 2026-06-09
训练优化

对比学习:让模型从无标注数据中学习表征

理解对比学习的核心思想:通过拉近相似样本、推远不相似样本,让模型从海量无标注数据中学习高质量的特征表征。

📅 2026-06-09
训练优化

大模型持续学习:解决灾难性遗忘的挑战

探讨大语言模型在持续学习中面临的灾难性遗忘问题,以及 EWC、渐进网络、经验回放等主流解决方案的原理和实际应用。

📅 2026-06-09
训练优化

Batch Normalization vs Layer Normalization 对比详解

全面对比两种最常用的归一化技术:Batch Normalization 沿 batch 维度归一化,Layer Normalization 沿特征维度归一化。理解为什么 Transformer 几乎只用 LN。

📅 2026-06-09