代码生成模型 Code Llama-34B 已在 HumanEval 测试中击败 GPT

2023-08-30 09:48:10 来源: 品玩

(资料图)

品玩8月26日讯，据 phind官方消息，研究团队在Phind 内部数据集上对 CodeLlama-34B 和 CodeLlama-34B-Python 进行微调之后发现，这两款模型微调之后在 HumanEval 测试中的通过率均已超过GPT-4在今年3月份的成绩。

Code Llama 是Meta发布的一款代码生成大模型，拥有7B、13B和34B三个尺寸，同时包含基础模型、Python专用版本等多款模型。 HumanEval 测试显示，未经过微调的CodeLlama-34B 和 CodeLlama-34B-Python 的通过率分别为48.8%和53.7%。

phind 研究团队通过在一个包含约 8 万个高质量编程问题和解决方案的专有数据集上对这两个模型进行了微调。这个数据集是 phind 研究团队内部推出的一个数据集，以指令-答案对为特征。这两个模型均经过了两次训练，训练量达到约16万个示例。此次训练并没有使用 LoRA（大语言低秩适应，一种微调方案），但研发团队对这两个模型进行了本地微调，并采用了 DeepSpeed ZeRO 3 和 Flash Attention 2 两种训练方法。训练耗时3小时，使用了32 个 A100-80GB GPU。研究团队表示，他们还对数据集采用了 OpenAI 给出的净化方案，确保结果有效且其中不含受污染的示例。

在经过测试之后发现，训练后的 CodeLlama-34B 通过率达到67.6% ，CodeLlama-34B-Python 的通过率达到69.5% 。而 GPT-4在今年3月份的成绩为67%。

关键词：

上一篇： 一年级孩子粗心怎么办呢一年级孩子粗心怎么办 下一篇： 最后一页

代码生成模型 Code Llama-34B 已在 HumanEval 测试中击败 GPT

精彩推荐

《原神》策划送给玩家的超模角色看得见摸不着吊胃口

《阴阳师》伴生皮玄夜神隐公开邪神开始不守男德

圆明园修复再生水重建鱼鸟天堂

上海定点医院：一边迎接新生，一边抢救重症

280斤胖小伙切胃减肥先调睡眠每天睡12小时仍昏昏沉沉

降低购房者成本住房公积金使用更灵活了

直播带岗，工作触“屏”可及(网上中国)

代码生成模型 Code Llama-34B 已在 HumanEval 测试中击败 GPT

品玩8月26日讯，据phind官方消息，研究团队在Phind内部数据集上对CodeL

一年级孩子粗心怎么办呢一年级孩子粗心怎么办

0471房产来为大家解答以上的问题。一年级孩子粗心怎么办呢，一年级孩子

环保无添加鸥露竹浆抽纸家庭装秒杀价29.9元

鸥露竹浆抽纸家庭装在欧露天猫旗舰店促销，原价59 9元，领券立减，实付

新疆巴音布鲁克草原风光旖旎飞鸟翔集牛羊肥(图)

代码生成模型 Code Llama-34B 已在 HumanEval 测试中击败 GPT

精彩推荐

《原神》策划送给玩家的超模角色 看得见摸不着 吊胃口

《阴阳师》伴生皮玄夜神隐公开 邪神开始不守男德

圆明园修复再生水重建鱼鸟天堂

上海定点医院：一边迎接新生，一边抢救重症

280斤胖小伙切胃减肥先调睡眠 每天睡12小时仍昏昏沉沉

降低购房者成本 住房公积金使用更灵活了

直播带岗，工作触“屏”可及(网上中国)

代码生成模型 Code Llama-34B 已在 HumanEval 测试中击败 GPT

品玩8月26日讯，据phind官方消息，研究团队在Phind内部数据集上对CodeL

一年级孩子粗心怎么办呢 一年级孩子粗心怎么办

0471房产来为大家解答以上的问题。一年级孩子粗心怎么办呢，一年级孩子

环保无添加 鸥露竹浆抽纸家庭装秒杀价29.9元

鸥露竹浆抽纸家庭装在欧露天猫旗舰店促销，原价59 9元，领券立减，实付

新疆巴音布鲁克草原风光旖旎 飞鸟翔集牛羊肥(图)

《原神》策划送给玩家的超模角色看得见摸不着吊胃口

《阴阳师》伴生皮玄夜神隐公开邪神开始不守男德

280斤胖小伙切胃减肥先调睡眠每天睡12小时仍昏昏沉沉

降低购房者成本住房公积金使用更灵活了

一年级孩子粗心怎么办呢一年级孩子粗心怎么办

环保无添加鸥露竹浆抽纸家庭装秒杀价29.9元

新疆巴音布鲁克草原风光旖旎飞鸟翔集牛羊肥(图)