模型之FIM（Fill-In-the-Middle）补全

西京刀客

于 2025-05-01 17:47:14 发布

阅读量1k

点赞数 24

CC 4.0 BY-SA版权

分类专栏： AI 文章标签： ai 模型 fim

本文链接：https://blog.csdn.net/inthat/article/details/147632109

文章目录

模型之FIM（Fill-In-the-Middle）补全

模型之FIM（Fill-In-the-Middle）补全

什么是FIM（Fill-In-the-Middle）

背景：传统训练的 GPT 模型只能根据前文内容预测后文内容，但有些应用比如代码生成器，需要我们给出上文和下文，使模型可以预测中间的内容，传统训练的 GPT 就不能完成这类任务。

FIM 是一种强大的生成技术，特别适合需要在上下文中间插入内容的场景。通过明确的前缀和后缀，模型可以更好地理解上下文，从而生成高质量的中间内容。这种技术在代码生成、文档编辑和自然语言生成中都有广泛的应用。

使用 FIM 训练的能够正确填充中间部分，FIM 是一种新的训练技巧，使得 GPT 类模型能够根据上下问填充中间部分。

FIM 的工作原理

输入分为三部分:
- 前缀 (Prefix): 输入文本的开头部分，提供上下文。
- 后缀 (Suffix): 输入文本的结尾部分，提供补充信息。
- 中间部分 (Hole): 需要模型生成的部分。
模型任务:
模型根据前缀和后缀的上下文，生成中间部分的内容。
标记 (Special Tokens):
通常会使用特殊标记（如 <fim_begin>、<fim_end> 和 <fim_hole>）来明确区分前缀、后缀和中间部分。

如果需要使用 FIM，通常需要明确指定 FIM 的相关配置，例如在 prompt 中提供前缀和后缀，并在模型配置中启用 FIM 模式。
模型本身需要支持 FIM 模式。如果模型不支持 FIM，即使提供了相关标记，模型也无法正确生成中间部分。

在 FIM 模式下，模型会根据 prompt 和 suffix 的上下文，自动推断需要生成的中间部分（即 <fim_hole>）

FIM 示例：代码补全场景

场景描述
假设你正在编辑一段代码，需要在函数体的中间插入逻辑。FIM 的目标是根据函数的上下文（前缀和后缀）生成中间部分的代码。

<fim_begin>
func calculateSum(a int, b int) int {
   
   
    // Start of function
<fim_end>
    return result
}
<fim_hole>

<fim_begin>: 标记前缀的开始。
前缀内容是函数的开头部分：
<fim_end>: 标记前缀的结束。
后缀内容是函数的结尾部分：
<fim_hole>: 标记需要生成的中间部分。
在某些实现中，<fim_hole> 是可选的，主要用于标记生成区域。如果省略 <fim_hole>，模型仍然可以通过上下文（prompt 和 suffix）推断出需要生成的部分。

{
   
   
    "prompt": "<fim_begin>func calculateSum(a int, b int) int {
   
   \n    // Start of function\n<fim_end>",
    "suffix": "    return result\n}"
}