大模型入门

什么是大模型

大语言模型（LLM）是基于 Transformer 架构的深度学习模型，通过海量文本数据训练而成。

常见大模型

模型	厂商	特点
GPT-4	OpenAI	综合能力强
Claude	Anthropic	安全对齐
GLM	智谱	中文优秀

基本概念

Prompt：输入给模型的提示文本
Token：模型处理文本的最小单位
微调（Fine-tuning）：在预训练模型基础上进一步训练