Note

这是一组从 Claude 对话中拆分出来的概念笔记入口页,适合做总览和跳转。

概念目录

基础框架

经典网络结构

大模型相关

大模型应用范式

概念关系

神经网络(基础框架)
├── 反向传播(通用训练方法)
├── CNN(擅长图像)
├── RNN / LSTM / GRU(擅长序列)
├── Transformer(现代主流架构)
│   └── MoE(常作为 Transformer 的扩展设计)
└── GAN(生成模型分支)
 
大模型层
├── Transformer(现代主流基础架构)
├── MoE(部分大模型的扩展架构)
└── 大模型(LLM)
 
应用增强层
└── RAG(外部知识检索 + 生成)

快速记忆

  • 神经网络:深度学习的基础框架
  • 反向传播:训练神经网络的核心算法
  • CNN:图像任务代表结构
  • GAN:对抗式生成模型
  • MoE:很多专家,但每次只激活少数
  • Transformer:现代大模型主流架构
  • LLM(大模型):建立在深度学习与 Transformer 之上的通用语言模型
  • RNN:早期序列建模主力
  • RAG:回答前先检索资料