午夜飞行

多智能体系统知识总结

多智能体系统知识总结

中国科学院大学《多智能体系统》课程笔记

2026-04-01

学习

#Agent

寒假随拍

2026寒假小结

2026-03-02

生活

#日常

人工智能相关问题总结

一些有趣的小知识的整理~

2026-01-07

学习

#AI

2026跨年小记

2026-01-01

生活

#跨年

大语言模型时代的强化学习 (一)：基础理论与算法解析

对于https://zhuanlan.zhihu.com/p/1987273670977156594的阅后总结整理，完成了关于修正后的Dr.GRPO和Dr.GSPO的误差与方差公式的推导过程。

2025-12-27

学习

#RL

Word2Vec知识总结

From苏剑林大佬的博客摘抄

2025-09-24

学习

#NLP

自然语言处理与大模型

国科大宗成庆《自然语言处理与大模型》课程笔记

2025-09-22

学习

#NLP #LLM

Text-image Synthesis

数据合成调研任务

2025-08-11

#扩散模型 #流匹配 #自回归

Python入门

鱼书第一章&Python编程从入门到实践

2025-07-28

学习

#Python

毕业旅行（二）：敦煌&嘉峪关&张掖&兰州

2025-07-20

生活

#旅行