Skip to content

大模型入门

什么是大模型

大语言模型(LLM)是基于 Transformer 架构的深度学习模型,通过海量文本数据训练而成。

常见大模型

模型厂商特点
GPT-4OpenAI综合能力强
ClaudeAnthropic安全对齐
GLM智谱中文优秀

基本概念

  • Prompt:输入给模型的提示文本
  • Token:模型处理文本的最小单位
  • 微调(Fine-tuning):在预训练模型基础上进一步训练