Intrinsic Fingerprint of LLMs: Continue Training is NOT All You Need to Steal A Model!

最新推荐文章于 2025-07-10 22:53:45 发布

UnknownBody

最新推荐文章于 2025-07-10 22:53:45 发布

阅读量6

点赞数

CC 4.0 BY-SA版权

分类专栏： LLM Daily LLM Security and Privacy 文章标签：人工智能深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/149247021

LLM Daily 同时被 2 个专栏收录

1352 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

LLM Security and Privacy

72 篇文章

订阅专栏

文章主要内容总结

本文聚焦大型语言模型（LLMs）的版权和知识产权保护问题，针对现有水印技术难以抵抗持续训练和模型修改的缺陷，提出了一种基于模型内在特征的鲁棒指纹识别方法。

研究背景：随着LLM训练成本增加和模型复用普及，版权保护面临挑战。传统水印技术易被持续训练、微调或修改破坏，无法可靠追溯模型来源。
核心方法：利用注意力机制参数的内在统计特性构建指纹。具体而言，提取不同层中查询（Q）、键（K）、值（V）和输出（O）投影矩阵的标准差分布，经归一化后形成特征序列，通过计算序列间的相关系数判断模型是否存在谱系关系（如源自持续训练或修改，而非独立训练）。该方法对模型架构修改（如从密集模型转为MoE模型）和持续训练具有鲁棒性。
实验发现：
- 跨模型家族验证显示，不同模型家族的注意力参数标准差分布具有独特模式，可作为区分标志。
- 重点分析发现，华为发布的Pangu Pro MoE模型与Qwen-2.5 14B模型的注意力和前馈网络参数分布高度相似（平均相关系数0.927），表明其可能通过“升级改造”而非从头训练衍生而来&

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。