大语言模型的终极之路
  • 大语言模型的终极之路
  • 更新计划
  • 大语言模型时代的NLP
    • 任务与评测
    • 参考资料
  • 基础知识
    • 负对数似然
    • Transformer
      • Cross Attention
      • 向量流动视角
      • Layer Normalization
      • Attention Block
    • 优化算法
      • 牛顿法
      • 梯度下降
  • 大语言模型
    • 大模型理论
      • Scaling Law
      • The Bitter Lesson
      • 思考,快与慢
    • 模型结构
      • MLP
      • Rotary Embedding
      • RMSNorm
      • Encoder-decoder
      • Decoder-only
      • MOE
      • 常见大模型
        • T5
        • GPT2
        • LLaMA
        • LLaMA 2
        • Mistral
        • GLM
        • Mixture
    • 如何训练一个ChatGPT
    • 微调
      • Instruction Tuning 指令微调
      • Domain Finetune 领域微调
    • 解码
      • 温度采样
      • Beam Search Decoding
  • Prompt 工程
    • Prompt, 一种技术路线
    • Prompt 写作规范
    • In-Context Learning
    • Chain-of-Thought
    • Generate Rather than Read
    • Program-of-Thought
    • Tree-of-Thought
    • 参考资料
  • 知识与幻觉
    • 知识边界
  • 大规模预训练
    • 计算资源消耗
    • Deepspeed
    • Megatron
    • 大规模数据处理
    • CUDA 算子优化
  • 强化学习
    • RLHF
      • RLHF
  • 大模型轻量化
    • 蒸馏
      • 黑盒蒸馏
      • 白盒蒸馏
        • KL 散度
    • 轻量化微调
      • LoRA
    • 量化
    • 剪枝
    • 推理加速
    • 参考资料
  • RAG-大模型检索
    • Page 3
  • 多智能体
    • Page 6
  • 多模态大模型
    • Page 1
  • 大模型安全与鲁棒
由 GitBook 提供支持
在本页
  1. 大语言模型
  2. 解码

温度采样

大语言模型的解码过程中,温度采样(Temperature Sampling)是一种常用的随机采样策略,用于生成更加多样化和创造性的文本。下面我就为你详细解释一下温度采样的原理和作用:

  1. 温度采样的基本原理: 在大语言模型的解码阶段,每一步都需要从模型输出的概率分布中采样选择下一个单词。一般采用贪心解码(Greedy Decoding),总是选择概率最高的单词,但这样生成的文本容易陷入重复和单一。温度采样引入一个温度参数T来调节概率分布,改变采样策略。

  2. 温度参数T的作用:

  • 当T=1时,采样分布不变,等同于从原始的模型输出分布中采样。

  • 当0<T<1时,调低温度,概率分布会变得更加集中,偏向于选择高概率单词,生成更加保守和确定性的文本。

  • 当T>1时,调高温度,概率分布会变得更加平缓,给低概率单词更多机会,生成更加多样和创造性的文本。

  1. 温度采样的计算过程:

  • 首先,对模型输出的logits向量除以温度T,从而调节概率分布。

  • 然后,对调整后的logits做softmax归一化,得到新的概率分布。

  • 最后,从调整后的概率分布中随机采样出下一个单词。

  • 不断重复以上过程,直到遇到终止符或达到最大长度。

  1. 温度采样的优缺点:

  • 优点是可以通过调节温度来灵活控制生成文本的多样性和创造性,适应不同的应用场景。

  • 缺点是温度太高可能导致生成不连贯和语法错误的文本,需要仔细调节温度的取值。

  1. 温度采样的应用场景:

  • 当希望生成更加确定和相关的文本时,如问答、摘要、翻译等任务,可使用较低温度。

  • 当希望生成更加开放和有创意的文本时,如写作、对话、故事生成等任务,可使用较高温度。

  • 在实际应用中,通常会尝试多个不同的温度,选择效果最佳的生成结果。

以上就是温度采样的原理和应用。通过调节温度参数,可以灵活控制语言模型生成文本的多样性和创造性,是一种简单有效的采样策略。合理运用温度采样,可以使大语言模型生成更加自然和丰富的文本。

上一页解码下一页Beam Search Decoding

最后更新于10个月前