Meta 周一宣布发布其免费代码生成人工智能模型和编程工具,名为 Code Llama 70B。与 Meta 之前的产品相比,新版本旨在生成和调试更大的编程字符串。
该公司表示,Code Llama 70B 是“最大、性能最好的模型”,也是目前可用的最大的代码生成开源人工智能模型之一。它接受了 5000 亿个代码标记和与代码相关的数据的训练,并具有 100,000 个标记的上下文窗口。自几个月前推出 GPT 4 以来,Meta 一直在幕后努力缩小 AI 编码竞赛中的差距,并蚕食 GPT-4 在代码生成方面的领先地位。
Code Llama 70B 代表了 Meta 人工智能编码工具的最新版本,建立在 Llama 2 语言模型的基础上。它拥有令人印象深刻的 700 亿个参数,在尺寸和功能方面超越了其前辈。
据 Meta 称,Code Llama 70B 是他们迄今为止最先进的代码生成人工智能模型。 Code Llama 工具于 8 月推出,可免费用于研究和商业用途。正如 Meta 的 AI 博客上的一篇文章所强调的那样,与早期版本相比,Code Llama 70B 可以处理更多数量的查询。这意味着开发人员可以在编程过程中提供更多提示,从而提高代码生成的准确性。
在性能方面,Code Llama 70B 在 HumanEval 基准测试中取得了 53% 的准确率,超过了 GPT-3.5 的 48.1%,接近 OpenAI 论文 (PDF) 中报告的 GPT-4 的 67%。
Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) 在 Facebook 上分享了这一消息,强调了人工智能模型在编码中的重要性,并对 Code Llama 所取得的进步表示自豪。
“我们正在开源一个新的和改进的 Code Llama,包括更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编码能力对于人工智能模型更严格、更有逻辑地处理其他领域的信息也很重要。我对这里的进步感到自豪,并期待着将这些进步纳入 Llama 3 和未来的模型中,”扎克伯格说道。
Code Llama 70B 是 Llama 2 的扩展,可帮助开发人员根据提示创建和调试代码字符串。去年秋天,Meta 同时推出了另外两款 Code Llama 工具,Code Llama – Python 和 Code Llama – Instruct,每个工具都专注于特定的编码语言。
重要的是,Code Llama 70B 可通过三个版本的代码生成器访问,并且对于研究和商业目的仍然免费。它接受了大量 1TB 代码和代码相关数据的训练,并托管在代码存储库 Hugging Face 上,该存储库提供对 GPU 的访问以运行 AI 模型。
Meta 声称其较大的型号 34B 和 70B 可提供卓越的结果,增强编码帮助。值得注意的是,Code Llama 70B 的 53% 准确率比 GPT-3.5 有了显着提高,使其成为 AI 编码领域的强大竞争者。
至关重要的是,Code Llama 70B 引发了有关人工智能民主化及其对软件开发行业潜在影响的讨论。与不公开的 GPT-4 不同,Code Llama 70B 是完全免费和开源的,这使其成为各级开发人员的宝贵工具,并促进 AI 编码领域的协作和开发。
Code Llama 70B 的发布标志着人工智能编程的一个重要里程碑,为软件开发的未来提供了令人兴奋的可能性。然而,它也引发了人们对人工智能在劳动力中的作用的重要考虑,并讨论了人工智能编码中潜在的工作取代和道德影响。
Meta 并不是唯一一家致力于这一努力的公司,亚马逊和微软等其他人工智能开发商在去年也发布了代码生成器。总体而言,Code Llama 70B 的出现标志着一个值得注意的发展,引发了人们对人工智能在编程领域的发展轨迹的疑问和期望。