必须指出的是，盘古大模型与通义千问，谁抄袭了谁？

发表评论

A+

所属分类：财经

摘要

（原标题：盘古大模型与通义千问，谁抄袭了谁？）作者 |小信鸽
一切始于7月4日发布在代码托管平台GitHub上的技术分析报告。

请记住，

（原标题：盘古大模型与通义千问，谁抄袭了谁？）

不可忽视的是，

作者 |小信鸽

来源 | 数聚势能
导语：华为盘古3.5与阿里通义千问1.5-7B模型之间的“指纹”相关性，得分高达0.927。
一份GitHub报告带来的"盘古抄袭门"

事实上，

一切始于7月4日发布在代码托管平台GitHub上的技术分析报告。

一位名不见经传的学生（一位自称为哥斯达黎加大学的韩国学生），用一种名为“模型指纹”（LLM-Fingerprint）的技术，直指中国两大AI模型巨头――华为与阿里。

报告直指华为盘古大模型v3.5在多个关键特征上与阿里开源的通义千问v1.5高度相似，由此着手一场关于“复用”与“抄袭”的论战。

不可忽视的是，

代码或许不会说谎，但代码的相似性该如何解读？

这不仅是一场技术论战，更是一次对整个AI行业伦理和规则的拷问。

简而言之，

本文无意充当法官，裁定“抄袭”与否。本平台将深入剖析这场争议背后的技术细节、开源文化冲突与商业竞争逻辑，探讨它为狂飙突进的大模型时代，揭示了哪些深层次的挑战与机遇。

“指纹技术”指控：无法忽视的0.927

通常情况下，

这场风暴的核心，是一项名为“LLM-Fingerprint”的技术。

根据公开数据显示，

便捷来说，它就像提取人类指纹一样，通过分析模型在处理特定“触发词”（trigger words）时的响应模式――即所谓的“自注意力”分数，来为每个大模型生成一个独特的身份标识。

然而，

所谓的铁证

尽管如此，

由HonestAGI团队发布的报告显示，华为盘古3.5与阿里通义千问1.5-7B模型之间的“指纹”相关性得分高达0.927。

这个数字意味着什么？报告同时对比了其他多个主流模型，它们之间的相关性得分普遍低于0.1。

如此接近1的得分，在统计学上暗示着两个模型可能存在极强的同源性，甚至可能是基于同一底座模型进行微调的“派生”关系。

说到底，华为反驳

面对指控，华为迅速回应，但其反驳逻辑被外界认为“不甚科学”。

然而，

华为方面指出，用同为通义千问系的不同版本模型进行指纹对比，同样能得出高相关性，试图以此稀释其与盘古模型高相关性的指控效力。此外，华为强调盘古与通义在词表（tokenizer）和部分配置文件上存在不同。

然而，在技术专家看来，仅改变词表或配置文件，并不足以洗脱底层模型结构和参数相似的嫌疑。这场技术攻防，让争议变得更加扑朔迷离。

事实上，

开源罗生门：“复用”与“抄袭”一线之隔

TMGM外汇资讯：

这场争议之以致能引发如此大的波澜，是鉴于它触及了AI开源生态的核心精神与现实困境。

概括一下，站在巨人的肩膀上

大模型研发成本极高，据华为大模型负责人田奇此前透露，一次有效训练的成本高达1200万美元。

来自TMGM外汇官网：

因此，“站在巨人的肩膀上”――即基于优秀的开源模型进行复用、微调和二次开发，是行业加速创新的基石，也是普遍范式。正如Hugging Face榜单所显示的，排名前十的开源模型中，一度全部是基于阿里通义千问的二次开发衍生而来。

说出来你可能不信，

阿里的Qwen系列自开源以来，凭借其全尺寸、全模块的特点，尤其在to B市场已建立起显著优势，笔者获悉，众多企业早期均采用通义模型进行探索。

TMGM外汇行业评论：一线之隔的模糊地带

那么，“复用”与“抄袭”的界限究竟在哪里？是参数的相似度，还是是否遵循开源协议？

华为在声明中承认了其盘古v3.5在“实现中借鉴了业界优秀的成果”，并引用了Qwen的技术报告。但困扰在于，通义千问运用的是Apache 2.0开源协议，该协议允许商业运用和修改，但要求在修改过的文件中保留原始的版权、专利、商标和归属声明。