我要投稿

大模型微调

发布日期：2025-05-19 22:34:33 浏览次数： 1744

作者：AI思考的鱼

微信搜一搜，关注“AI思考的鱼”

关于大模型微调的方式有很多，大模型微调是一种通过调整预训练模型参数来适应特定任务的技术，在机器学习和深度学习领域广泛应用。

1. Fine-Tuning

Fine-tuning 是指在保留大部分预训练权重的基础上，针对目标任务重新训练整个网络或者部分层的参数。这种方法通常适用于目标数据集较大且具有代表性的情况

2. Parameter-Efficient Fine-Tuning (PEFT)

Parameter-efficient fine-tuning 方法旨在减少可更新参数的数量，从而降低计算成本并提高效率。常见技术包括 LoRA（Low-Rank Adaptation）、Prefix Tuning 和 P-Tuning 等。

LoRA 的核心思想是在原有矩阵上引入低秩分解后的两个小型矩阵作为增量模块进行优化，仅需少量额外存储空间即可实现性能提升。

Prefix-Tuning，一种轻量级替代方法，用于对自然语言生成任务进行微调，在使语言模型参数冻结的同时，去优化一个参数量少的 continuous task-specific vector（称为prefix）。Prefix-Tuning方法启发于prompting的灵感，prompting允许子序列字符填加到此前缀后，并把prompting作为“virtual tokens”。我们将prefix-tuning应用于GPT-2，用于表格到文本的生成，也应用于BART，以进行文本摘要。

BART（Bidirectional and Auto-Regressive Transformer）是 Facebook AI（FAIR）在 2019 年提出的一种预训练文本生成模型，它结合了 BERT 的双向编码能力和 GPT 的自回归解码能力，适用于文本修复、文本摘要、问答系统、文本生成等任务。

BART 采用 Transformer 编码器-解码器（Encoder-Decoder）架构：

编码器（Encoder）：类似 BERT，输入完整的序列，进行双向建模。

解码器（Decoder）：类似 GPT，逐步预测下一个 token，进行自回归文本生成。

P-Tuning 全称为 Prompt-Tuning，它是一种微调大语言模型（Large Language Model, LLM）的方法。与传统的全参数微调（Fine-tuning）不同，P-Tuning 只在模型输入层或中间层插入可学习的“Prompt Embeddings”（也称 Prompt Tokens/Prefix 等），从而极大减少微调参数量。其核心思想可以归纳为：

·冻结（freeze）大部分或全部原始模型参数

·引入少量可训练的参数（Prompt Embeddings）

·通过梯度反向传播仅更新这部分可训练参数

模型在训练过程中会将这些 Prompt Embeddings 拼接到原输入或模型内部隐藏层的输入里，从而让预训练模型更好地针对任务进行表征/生成。因为只训练这部分 Prompt Embeddings，而模型的主体参数并未改变，所以对硬件资源和训练数据需求更小，微调速度也更快。

提示调整示例：

输入序列: [Prompt1][Prompt2] “这部电影令人振奋。”

问题: 评价这部电影的情感倾向。

答案: 模型需要预测情感倾向（例如“积极”）

【重磅】一键接入扣子、Dify，FastGPT等开发平台

立即开通>>

企业内部AI 先行者已通过扣子、Dify 等智能体开发平台积极探索 "人 + AI" 的效率革新。这些应用大多局限于小范围应用，基于此，我们打造一款开箱即用的 AI 门户-53AI Hub，让企业实现从 "场景级效率优化" 到 "企业级生产力重构" 的跨越....

提示: 没有明确的外部提示，[Prompt1][Prompt2]作为引导模型的内部提示，这里的问题是隐含的，即判断文本中表达的情感倾向。

3. Knowledge Distillation

Knowledge distillation 将复杂的大规模教师模型的知识迁移到更轻量的学生模型中去完成相同的功能。此过程一般涉及软标签生成以及温度缩放等技巧。

4. Prompt Learning

Prompt-based tuning 利用自然语言提示引导模型更好地理解输入信息，并将其转化为适合下游任务的形式处理。这种方式特别适合少样本甚至零样本地场景应用。

5.Adapter Tuning

与LoRA技术类似，适配器调整的目标是在保留预训练模型原始参数不变的前提下，使模型能够适应新的任务。适配器调整的方法是在模型的每个层或选定层之间插入小型神经网络模块，称为“适配器”。这些适配器是可训练的，而原始模型的参数则保持不变。

1.知识提取阶段：训练Adapter模块学习下游任务的特定知识，将知识封装在Adapter模块参数中。

2.知识组合阶段：将预训练模型参数与特定于任务的Adapter参数固定，引入新参数学习组合多个Adapter中的知识，提高模型在目标任务中的表现。

模型微调策略选型

微调是一种强大的工具，它能够使大型预训练模型适应于特定的任务和应用场景。正确选择和应用微调策略对于实现高效且有效的模型性能至关重要。

1、微调与迁移学习：微调实际上是迁移学习的一个实例，其中预训练的模型（通常在大型通用数据集上训练）被用作特定任务的起点。这种方法使得即使是对于小数据集的任务，也可以实现高效的学习

2、选择微调策略：选择哪种微调方法取决于多个因素，包括任务的复杂性、可用的数据量、计算资源和期望的性能。

例如，对于需要细粒度控制的复杂任务，P-Tuning v2 或 LSTM 基础的 P-Tuning 可能更适合。而对于计算资源有限的情况，可以选择 LoRA 或 Adapter Tuning 等方法。

3、微调与模型泛化能力：微调时需要注意的一个关键问题是保持模型的泛化能力。过度的微调可能会导致模型对特定训练数据过拟合，而忽略了其在实际应用中的泛化能力。

4、持续发展和创新：随着深度学习和 NLP 领域的持续发展，新的微调技术和策略不断出现。这要求从业者保持对最新研究和技术动态的关注，并根据项目需求灵活选择和调整策略。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业