2024年5月29日,斯坦福大学一AI团队发布的Llama3-V多模态大模型被证实抄袭中国清华系大模型“小钢炮”MiniCPM-Llama3-V 2.5。

本页面主要目录有关于斯坦福AI团队抄袭中国大模型事件的:事件背景、事件经过、事件处置、事件回应、相关合集等介绍

发生时间

2024年5月29日

简介

当地时间2024年6月3日,Llama3-V团队的两位作者森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平台上发布文章,向MiniCPM团队正式道歉,表示会将Llama3-V模型从网络上撤下。

截至2024年6月4日,Llama3-V团队的两位作者已删除他们在社交媒体上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。

事件背景

北京面壁智能科技有限责任公司成立于2022年8月,核心产品包括全流程大模型高效加速平台ModelForce和CPM大模型。2024年4月,面壁智能完成新一轮数亿元融资,由华为哈勃领投,春华创投、北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。

2024年5月21日,北京面壁智能科技有限责任公司发布了名为MiniCPM-Llama3-V 2.5的开源端侧多模态模型。

事件经过

2024年5月29日,斯坦福一AI团队发布了一个名为Llama3-V的多模态大模型,声称只要500美元就能训练出一个SOTA多模态模型,效果比肩GPT-4V、Gemini Ultra与Claude Opus。但随后有网友发现,Llama3V与中国北京面壁智能科技有限责任公司在5月中旬发布的8B多模态开源小模型MiniCPM-Llama3-V 2.59(面壁小钢炮)高度重合,前者只是进行了一些重新格式化,并把图像切片、分词器、重采样器等变量重命名。

2024年6月2日深夜,面壁智能团队证实,斯坦福大模型项目Llama3-V与MiniCPM一样,可以识别出“清华简”战国古文字,不仅对得一模一样、错得也一模一样。这一古文字数据为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实。

事件处置

当地时间2024年6月3日,Llama3-V团队的两位作者森德哈斯·沙玛和阿克沙·加格在社交平台上发布文章,向MiniCPM团队正式道歉,表示会将Llama3-V模型从网络上撤下。

截至2024年6月4日,Llama3-V团队的两位作者已删除他们在社交媒体上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。

事件回应

北京面壁智能科技有限责任公司

面壁智能CEO李大海和联合创始人刘知远先后发文回应,表示这是一种受到国际团队认可的方式,但希望大家共建开放、合作、有信任的社区环境。面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应,MiniCPM-Llama3-V 2.5在研发时内置了一个彩蛋,就是对“清华简”的识别能力,而Llama3-V模型居然也有一模一样的能力。


斯坦福AI团队抄袭中国大模型事件

斯坦福人工智能实验室主任

斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁(Christopher David Manning)也发文谴责这一抄袭行为。