支那是开源狗的末日，阿里前副总裁贾扬清揭发--李开复公司的开源大模型，套壳Meta的LLaMA却故意不说

李开复创立了大语言模型创业公司“零一万物”。零一万物最近发布了开源模型Yi-34B，这个模型在Hugging Face上收到了很多关注。

阿里巴巴的前副总裁贾扬清在创业，他的公司要适配各种大语言模型。他最近指出，有客户找他的公司去适配一家国内的公司的新模型，贾扬清自己的公司太忙了，还没来得及适配。

结果最近有朋友告诉他，这家公司用的是LLaMA的架构，但是为了表示自己的不一样，就把代码里面的名字给改了，然后换了几个变量的名字。

贾扬清表示，有海外工程师直接指出了这一点，还有人在HuggingFace上放了一个把名字改回去的checkpoint，说现在大家可以直接用LLaMA的代码来加载了。

有国外的开发者在Y Combinator网站上发帖指出，李开复旗下的零一万物的开源模型Yi-34B采用的就是LLaMA的架构，只是重命名了两个张量。
这种明明用了对方开源架构却故意改名字的事情，就很恶心了。有人指出，如果零一万物完全使用了Meta的结构，代码库和相关资源，也就必须遵守LLaMA许可协议。不然的话，它们的开源项目就是有问题的。

零一万物很快就回复了贾扬清的指责。回复中表示：GPT 是一个业内公认的成熟架构，Llama 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构，借鉴了行业顶尖水平的公开成果，由于大模型技术发展还在非常初期，与行业主流保持一致的结构，更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作，也在持续探索模型结构层面本质上的突破。

这个回复，很多人并不买账，觉得零一万物模糊了很多东西，就是不肯承认自己套壳了。

在Hugging Face上，零一万物的团队成员Richar Lin回应承认了更改张量名称一事，表示在实验的时候，对代码进行了多次重命名，但是发表模型前忘记改回来了

原神同人曲 23-11-17

最后编辑于: 23-11-17

要评论请先登录或注册

9 个回复

takesipon

你敢开源,我就敢原创
你今天援助我,过几年我就要打倒你

23-11-18

[已注销]

小偷国，不全球排支行吗？

23-11-18

Duckdung

什么好事一沾了支就坏菜

23-11-18

[已注销]

零一万物，摩尔线程，字节跳动，都是挨踢男装逼名字

23-11-18

m5gts

被李开复这个台支闹麻了

23-11-18

大西鲨汁大西鯊！

這代碼是俺拾的哩，不是偷的。

23-11-18

dearkate00820 游戏咖

墙内买片的,最热衷举报免费资源. 什么美剧电视剧资源都卖

23-11-19

pxf43grtr 血红的绣花球，冰冷的神圣镰刀，梁家河的落日余晖，密包，你现在那？你去何处？但如你思念我，你知我会来，那些夏夜，仿佛恒久以前

开源协议来自开源运动。
开源运动，本身是对GPL的repurpose。( Webb & Doctorow, Coding Democracy; Soderberg, Resistance to the Current; Levy, Hackers Heroes of the Computer Revolution)

23-11-18