人工智能研究实验室 OpenAI 将发布具有推理能力的开源语言模型,在 AI 社区中引起轰动。首席执行官 Sam Altman 最近的一份声明透露,该组织计划将一个强大的工具带回开源技术领域,这一计划已经酝酿了很长时间,但由于其他优先事项而被搁置。
OpenAI 的宣布是在 AI 领域竞争加剧的背景下发布的,Meta 及其 Llama 系列开源模型、拥有多模态能力的 Google Gemma 和中国 AI 实验室 DeepSeek 等竞争对手都在争夺霸主地位。DeepSeek 最近发布了一个开源推理模型,据报道该模型的性能优于 OpenAI 的 o1 模型。
从本质上讲,开源模型是开发人员与公众共享工具各个方面的模型,包括代码、训练数据集和架构。这种开放性允许用户根据需要修改和重新分发模型。相比之下,开放权重模型的开放性较低,因为用户可以对其进行微调,但由于无法访问训练数据集或架构等关键元素,因此无法从头开始构建。
OpenAI 还在寻求开发人员的反馈,以确保新模型尽可能有用,并计划在未来几周内在旧金山、欧洲和亚太地区举办开发人员活动。该公司在其网站上放置了一个反馈表,以收集来自开发人员社区的意见。
除了预期之外,OpenAI API 团队的 Steven Heidel 分享说,该模型将能够在单个硬件上本地运行。但是,参数数量、令牌上下文窗口、数据集、训练技术或发布许可证等更精细的详细信息仍未披露。
这一公告标志着 OpenAI 战略的重大转变,到目前为止,OpenAI 将其最先进的模型保持在 API 后面。这种方向的转变与 Altman 最近在 Reddit 问答中表达的观点一致,他在问答中暗示要重新考虑公司的开源战略。
根据 Altman 的帖子,新模型将具有与 OpenAI 的 o3-mini 相当的推理能力,可能使其成为迄今为止功能最强大的开放推理模型,甚至超越了 DeepSeek 的 R1。
这一消息可能会受到 AI 爱好者和开发人员的欢迎,他们热切期待一款功能强大、可微调且可在单个硬件上运行的工具。OpenAI 即将推出的 open-weight 模型证明了该组织致力于推进 AI 领域和促进协作创新。