OpenStarry Blog

标签：训练优化

「训练优化」分类下共 4 篇文章。

全部 Coding Plan IDE 配置平台接入 AI 前沿选型指南 + 效率实战 AI行业观察服务升级工具对比行业分析选型指南 AI Agent 个人AI行业事件解读 token计费 LLM 评估 API工程实践实践教程效率实战个人AI行业观察 🔧 技术教程前沿趋势 🔧 技术教程 📅 2026-07-13 大模型应用架构、出海创业、API 工程实践、系统容灾 #GLM5.2 #AI 编码算力 # 工程级代码开发 # 开发者算力服务 # 大模型订阅套餐答疑套餐指南接入教程技术教程 AI Agent 平台 Codex, OpenStarry, AI编程, GLM, 教程 GLM-5.2, API, 错误码, 开发者, 教工具教程大模型开发工具对比评测生成模型 AI 基础 RLHF/对齐 RAG/检索训练优化 IDE 接入教程 ChatGPT 国内接入 Claude 国内接入技术深度成本优化迁移指南模型解读场景对比 · 客观评测平台对比 · 重写版行业洞察安全指南

Dropout 正则化：简单却强大的防过拟合技术

深入理解 Dropout 的工作原理：为什么随机丢弃神经元反而能提升模型泛化能力，以及在实际项目中如何正确使用 Dropout。

📅 2026-06-09

对比学习：让模型从无标注数据中学习表征

理解对比学习的核心思想：通过拉近相似样本、推远不相似样本，让模型从海量无标注数据中学习高质量的特征表征。

📅 2026-06-09

大模型持续学习：解决灾难性遗忘的挑战

探讨大语言模型在持续学习中面临的灾难性遗忘问题，以及 EWC、渐进网络、经验回放等主流解决方案的原理和实际应用。

📅 2026-06-09

Batch Normalization vs Layer Normalization 对比详解

全面对比两种最常用的归一化技术：Batch Normalization 沿 batch 维度归一化，Layer Normalization 沿特征维度归一化。理解为什么 Transformer 几乎只用 LN。

📅 2026-06-09