大语言模型是怎么工作的
从 Token、注意力机制到下一个词预测,用最少的数学讲清 LLM 的核心。
AI
分类
10 篇
从 Token、注意力机制到下一个词预测,用最少的数学讲清 LLM 的核心。
不靠玄学,靠结构。让 LLM 输出更稳定、更准的实用提示词技巧。
检索增强生成的原理、流程,以及它为什么能治幻觉。
RAG 的存储底座怎么选,从够用到高性能的几个常见选项。
一行命令在自己机器上跑开源大模型,数据不出本地。
想让大模型更懂你的领域?先搞清这三种方式的成本和适用场景。
让大模型不只是聊天,而是会查资料、调 API、执行多步任务。
为什么长文档会被截断、为什么 API 按 token 计费、上下文塞满会怎样。
从纯文本到图文混合,多模态大模型能干什么、怎么用。
Claude Code / Copilot 这类工具,怎么用才能真正提效。