- 从零构建大模型
- (美)塞巴斯蒂安·拉施卡
- 222字
- 2025-05-07 11:43:59
关于本书
本书旨在帮助你从零开始理解并打造属于自己的类 GPT 大语言模型。本书从文本数据处理方法和编码注意力机制的基础入手,逐步引导你从零开始实现一个完整的 GPT 模型。书中还探讨了预训练机制,以及针对文本分类和指令遵循等特定任务进行微调的过程。通过本书的学习,你将深入了解大语言模型的工作原理,并学会构建自己的模型。虽然你将创建的模型在规模上不及那些大型基础模型,但它运用了相同的原理,是有力的教育工具,可以帮助你掌握构建最先进大语言模型的核心机制和技术。