李开复旗下“零一万物”回应大模子被指抄袭:做法确实失当 将厘正争议张量名
"李开复旗下“零一万物”回应大模子被指抄袭:做法确实失当 将厘正争议张量名,这篇新闻报道详尽,内容丰富,非常值得一读。
这篇报道的内容很有深度,让人看了之后有很多的感悟。
作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。
"
快科技(Technology)11月15日消息,AI 大模型创业公司 零一万物 正式公开回复了其Yi大模型涉嫌抄袭LLaMA事件,称做法确实不妥,将会按照外界建议修改争议张量(Tensor)名。
零一万物由创新工场董事长兼CEO李开复于今年(This Year)创办,并在本月初宣布推出Yi-34B和Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。
然而在不久前,开发者ehartford在Yi-34B的Hugging Face开源主页上表示,称该模型使用了Meta LLaMA的架构,只对两个张量名称进行(Carry Out)了修改,分别为input_layernorm和post_attention_layernorm。
同时ehartford还表示,其希望(Hope)该公司在模型被大量使用之前考虑重命名张量以符合LLaMA架构,并将这一更改应用到官方模型中。
零一万物开源团队总监Richard Lin昨天(Yesterday)承认,修改Llama张量名的做法不妥,将会按照外界建议把 修改后的张量名称从Yi改回LLaMA 。
Richard Lin表示,出现这一问题主要是由于开发人员疏忽导致,开发人员为了满足测试要求,在代码中进行(Carry Out)了几次重命名,但是后面忘记将张量名称修改回LLaMA了。
不过另一名开发者JosephusCheung则表示,既然官方已经宣布修改Yi大模型张量名称,那么Yi便是LLaMA的衍生作品,因为其推理部分和模型定义都是 LLaMA 的一部分。
目前(Currently)Richard Lin暂未对此进行(Carry Out)回复。
- 赞(62) 踩(70) 阅读数(6310) 最新评论 查看所有评论
-
加载中......
- 发表评论
-