支那是开源狗的末日,阿里前副总裁贾扬清揭发--李开复公司的开源大模型,套壳Meta的LLaMA却故意不说
李开复创立了大语言模型创业公司“零一万物”。零一万物最近发布了开源模型Yi-34B,这个模型在Hugging Face上收到了很多关注。
阿里巴巴的前副总裁贾扬清在创业,他的公司要适配各种大语言模型。他最近指出,有客户找他的公司去适配一家国内的公司的新模型,贾扬清自己的公司太忙了,还没来得及适配。
结果最近有朋友告诉他,这家公司用的是LLaMA的架构,但是为了表示自己的不一样,就把代码里面的名字给改了,然后换了几个变量的名字。
贾扬清表示,有海外工程师直接指出了这一点,还有人在HuggingFace上放了一个把名字改回去的checkpoint,说现在大家可以直接用LLaMA的代码来加载了。
有国外的开发者在Y Combinator网站上发帖指出,李开复旗下的零一万物的开源模型Yi-34B采用的就是LLaMA的架构,只是重命名了两个张量。
这种明明用了对方开源架构却故意改名字的事情,就很恶心了。有人指出,如果零一万物完全使用了Meta的结构,代码库和相关资源,也就必须遵守LLaMA许可协议。不然的话,它们的开源项目就是有问题的。
零一万物很快就回复了贾扬清的指责。回复中表示:GPT 是一个业内公认的成熟架构,Llama 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。
这个回复,很多人并不买账,觉得零一万物模糊了很多东西,就是不肯承认自己套壳了。
在Hugging Face上,零一万物的团队成员Richar Lin回应承认了更改张量名称一事,表示在实验的时候,对代码进行了多次重命名,但是发表模型前忘记改回来了
原神同人曲 23-11-17
最后编辑于: 23-11-17
阿里巴巴的前副总裁贾扬清在创业,他的公司要适配各种大语言模型。他最近指出,有客户找他的公司去适配一家国内的公司的新模型,贾扬清自己的公司太忙了,还没来得及适配。
结果最近有朋友告诉他,这家公司用的是LLaMA的架构,但是为了表示自己的不一样,就把代码里面的名字给改了,然后换了几个变量的名字。
贾扬清表示,有海外工程师直接指出了这一点,还有人在HuggingFace上放了一个把名字改回去的checkpoint,说现在大家可以直接用LLaMA的代码来加载了。
有国外的开发者在Y Combinator网站上发帖指出,李开复旗下的零一万物的开源模型Yi-34B采用的就是LLaMA的架构,只是重命名了两个张量。
这种明明用了对方开源架构却故意改名字的事情,就很恶心了。有人指出,如果零一万物完全使用了Meta的结构,代码库和相关资源,也就必须遵守LLaMA许可协议。不然的话,它们的开源项目就是有问题的。
零一万物很快就回复了贾扬清的指责。回复中表示:GPT 是一个业内公认的成熟架构,Llama 在 GPT 上做了总结。零一万物研发大模型的结构设计基于 GPT 成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。
这个回复,很多人并不买账,觉得零一万物模糊了很多东西,就是不肯承认自己套壳了。
在Hugging Face上,零一万物的团队成员Richar Lin回应承认了更改张量名称一事,表示在实验的时候,对代码进行了多次重命名,但是发表模型前忘记改回来了
原神同人曲 23-11-17
最后编辑于: 23-11-17