AI — Chris 的博客

大语言模型是怎么工作的

从 Token、注意力机制到下一个词预测，用最少的数学讲清 LLM 的核心。

不靠玄学，靠结构。让 LLM 输出更稳定、更准的实用提示词技巧。

检索增强生成的原理、流程，以及它为什么能治幻觉。

RAG 的存储底座怎么选,从够用到高性能的几个常见选项。

一行命令在自己机器上跑开源大模型,数据不出本地。

想让大模型更懂你的领域?先搞清这三种方式的成本和适用场景。

让大模型不只是聊天,而是会查资料、调 API、执行多步任务。

为什么长文档会被截断、为什么 API 按 token 计费、上下文塞满会怎样。

从纯文本到图文混合,多模态大模型能干什么、怎么用。

Claude Code / Copilot 这类工具,怎么用才能真正提效。