OpenAI收购Promptfoo，强化AI代理安全防护体系

OpenAI收购AI安全公司Promptfoo，强化自主AI代理的防护能力，应对提示注入与越狱攻击等新型威胁，推动企业级AI系统向高可靠、可审计方向发展。

2026年3月9日，OpenAI正式宣布收购网络安全初创公司Promptfoo，此举旨在应对日益严峻的自主人工智能安全挑战。总部位于加州旧金山的Promptfoo，专注于大型语言模型（LLM）与独立AI代理的安全漏洞检测，其技术将被深度整合至OpenAI的企业级平台OpenAI Frontier，标志着AI系统从实验阶段向高可靠生产环境的关键转型。

随着AI代理在自动化决策、流程管理与客户服务等领域的广泛应用，其潜在攻击面也随之扩大。恶意行为者可通过“提示注入”“越狱攻击”等手段，诱导AI系统泄露敏感数据、篡改操作逻辑，甚至破坏关键业务流程。传统网络安全机制难以应对这类针对模型推理过程的新型威胁，亟需专门针对AI行为的主动防御体系。

Promptfoo由安全专家Ian Webster与Michael D’Angelo于2024年创立，开发了一套开放源码的AI安全测试工具集，涵盖数百种标准化攻击场景与检测模块。据公司披露，已有超四分之一的《财富》500强企业采用其方案对内部AI系统进行压力测试。尽管市场认可度高，Promptfoo始终保持精简团队，累计融资仅2300万美元，并在2025年7月完成最新一轮融资后估值达8600万美元。目前，OpenAI尚未公开此次收购的具体财务细节。

这一收购反映出前沿AI机构正加速构建“安全先行”的研发范式。未来，AI系统的可信度不仅取决于性能，更取决于其在复杂环境中的抗干扰能力。Promptfoo的技术将助力OpenAI在企业级市场建立更强的安全壁垒，推动整个行业向更稳健、可审计、可信赖的AI部署标准演进。

{{userData.name}}已认证