导读: MetaAI发布了其高级代码生成模型的新版本CodeLla70B。作为最大的代码生成开源人工智能模型之一,新平台比其前身进行了重大升级,使其速度更...
MetaAI发布了其高级代码生成模型的新版本CodeLla70B。作为最大的代码生成开源人工智能模型之一,新平台比其前身进行了重大升级,使其速度更快、更准确。
CodeLla70B已经接受了5000亿个代码标记和代码相关数据的训练,并拥有100,000个标记的大型上下文窗口,使其能够跨多种语言(包括C++、Python、PHP)处理和生成更长、更复杂的代码和爪哇。
CodeLla70B基于Lla2(世界上最大的通用大型语言模型(LLM)之一),使用一种称为自注意力的技术对代码生成进行了微调,该技术可以更好地理解代码关系和依赖关系。
新模型的另一个亮点是CodeLla-70B-Instruct,这是一种经过微调的变体,用于理解自然语言指令并相应地生成代码。
MetaAI首席执行官马克·扎克伯格表示:“事实证明,编码能力对于人工智能模型更严格、更有逻辑地处理其他领域的信息也很重要。我对这里取得的进步感到自豪,并期待着将这些进步纳入Lla3和未来的模型中。”
CodeLla70B可以在与Lla2和之前的CodeLla模型相同的许可证下免费下载,允许研究人员和商业用户使用和修改它。
尽管取得了这些改进,Meta仍面临着艰巨的挑战,即试图赢得目前使用GitHubCopilot的开发人员的支持,GitHubCopilot是GitHub和OpenAI为开发人员创建的第一大人工智能工具。许多开发人员也对Meta及其数据收集过程持怀疑态度,而且很多人一开始就不喜欢人工智能生成的代码。这通常需要认真调试,并生成非程序员乐于使用但不理解的代码,从而导致出现问题。