大语言模型系统化学习只需要看斯坦福三节课就够了:

CS25: 通识类的整体介绍
CS224N: NLP+深度神经网络+Transformer
CS336: 大语言模型从头实现,尤其是会介绍最新的进展(比如为什么现在的LLM都用SwiGLU)
如果深度了解机器学习基础,可上CS229机器学习以及CS230深度学习。