NeoXmind 数字花园
Search
搜索
暗色模式
亮色模式
探索
标签: 强化学习
此标签下有2条笔记。
2026年2月17日
deepseek-r1可能找到了超越人类的办法
AI
DeepSeek
强化学习
Reasoning
2025年2月17日
一文通透grpo——通俗理解“群体相对策略优化”
AI
强化学习
DeepSeek
LLM