「AI 前沿」分类下共 3 篇文章。
理解递归语言模型(RLM)如何通过递归处理机制突破传统 Transformer 的上下文窗口限制,实现对超长文本的高效理解。
深入理解 JEPA 的核心思想:在隐空间中进行预测而非像素空间,以及它为何被认为是通向世界模型的关键路径。
全面解析自回归生成的核心原理:下一个 token 预测、teacher forcing 训练策略,以及贪婪搜索、束搜索、采样等解码方法。