
2026年3月9日,OpenAI正式宣布收购网络安全初创公司Promptfoo,此举旨在应对日益严峻的自主人工智能安全挑战。总部位于加州旧金山的Promptfoo,专注于大型语言模型(LLM)与独立AI代理的安全漏洞检测,其技术将被深度整合至OpenAI的企业级平台OpenAI Frontier,标志着AI系统从实验阶段向高可靠生产环境的关键转型。
随着AI代理在自动化决策、流程管理与客户服务等领域的广泛应用,其潜在攻击面也随之扩大。恶意行为者可通过“提示注入”“越狱攻击”等手段,诱导AI系统泄露敏感数据、篡改操作逻辑,甚至破坏关键业务流程。传统网络安全机制难以应对这类针对模型推理过程的新型威胁,亟需专门针对AI行为的主动防御体系。
Promptfoo由安全专家Ian Webster与Michael D’Angelo于2024年创立,开发了一套开放源码的AI安全测试工具集,涵盖数百种标准化攻击场景与检测模块。据公司披露,已有超四分之一的《财富》500强企业采用其方案对内部AI系统进行压力测试。尽管市场认可度高,Promptfoo始终保持精简团队,累计融资仅2300万美元,并在2025年7月完成最新一轮融资后估值达8600万美元。目前,OpenAI尚未公开此次收购的具体财务细节。
这一收购反映出前沿AI机构正加速构建“安全先行”的研发范式。未来,AI系统的可信度不仅取决于性能,更取决于其在复杂环境中的抗干扰能力。Promptfoo的技术将助力OpenAI在企业级市场建立更强的安全壁垒,推动整个行业向更稳健、可审计、可信赖的AI部署标准演进。

