Meta的新CodeLla70B瞄准了Github的Copilot

导读： MetaAI发布了其高级代码生成模型的新版本CodeLla70B。作为最大的代码生成开源人工智能模型之一，新平台比其前身进行了重大升级，使其速度更...

MetaAI发布了其高级代码生成模型的新版本CodeLla70B。作为最大的代码生成开源人工智能模型之一，新平台比其前身进行了重大升级，使其速度更快、更准确。

CodeLla70B已经接受了5000亿个代码标记和代码相关数据的训练，并拥有100,000个标记的大型上下文窗口，使其能够跨多种语言(包括C++、Python、PHP)处理和生成更长、更复杂的代码和爪哇。

CodeLla70B基于Lla2(世界上最大的通用大型语言模型(LLM)之一)，使用一种称为自注意力的技术对代码生成进行了微调，该技术可以更好地理解代码关系和依赖关系。

新模型的另一个亮点是CodeLla-70B-Instruct，这是一种经过微调的变体，用于理解自然语言指令并相应地生成代码。

MetaAI首席执行官马克·扎克伯格表示：“事实证明，编码能力对于人工智能模型更严格、更有逻辑地处理其他领域的信息也很重要。我对这里取得的进步感到自豪，并期待着将这些进步纳入Lla3和未来的模型中。”

CodeLla70B可以在与Lla2和之前的CodeLla模型相同的许可证下免费下载，允许研究人员和商业用户使用和修改它。

尽管取得了这些改进，Meta仍面临着艰巨的挑战，即试图赢得目前使用GitHubCopilot的开发人员的支持，GitHubCopilot是GitHub和OpenAI为开发人员创建的第一大人工智能工具。许多开发人员也对Meta及其数据收集过程持怀疑态度，而且很多人一开始就不喜欢人工智能生成的代码。这通常需要认真调试，并生成非程序员乐于使用但不理解的代码，从而导致出现问题。