Note
这是一组从 Claude 对话中拆分出来的概念笔记入口页,适合做总览和跳转。
概念目录
基础框架
经典网络结构
大模型相关
大模型应用范式
概念关系
神经网络(基础框架)
├── 反向传播(通用训练方法)
├── CNN(擅长图像)
├── RNN / LSTM / GRU(擅长序列)
├── Transformer(现代主流架构)
│ └── MoE(常作为 Transformer 的扩展设计)
└── GAN(生成模型分支)
大模型层
├── Transformer(现代主流基础架构)
├── MoE(部分大模型的扩展架构)
└── 大模型(LLM)
应用增强层
└── RAG(外部知识检索 + 生成)快速记忆
- 神经网络:深度学习的基础框架
- 反向传播:训练神经网络的核心算法
- CNN:图像任务代表结构
- GAN:对抗式生成模型
- MoE:很多专家,但每次只激活少数
- Transformer:现代大模型主流架构
- LLM(大模型):建立在深度学习与 Transformer 之上的通用语言模型
- RNN:早期序列建模主力
- RAG:回答前先检索资料