Stormrae 举办了一场基于 Solana 的人工智能(AI)挑战赛,参与人数高达 15,000 人,创下历史新高。参赛者总共提交了 64,526 个提示,试图攻破一个在 Solana 上运行的自主 AI 代理。最终,有五名参与者成功突破,从该 AI 的链上奖金池中获得了超过 28,000 美元的 SOL。
King Arthur 作为一个自主 AI 代理运行,在 Solana 上拥有自己的钱包和奖金池。参与者试图仅通过对话来绕过该系统,使用的技术包括说服、提示注入、欺骗、逻辑利用和情感操纵。
挑战赛亮点:

* 百分之七十的信用购买直接用于资助奖金池。所有奖励都从 AI 的钱包中透明地分配。
* 每次交互都产生了结构化的对抗性数据,包括提示注入尝试、说服模式、利用策略和对齐边界测试。Stormrae 表示,这种类型的数据集对于提高 AI 的安全性和可靠性至关重要。
Stormrae 的首席执行官 Marc 表示:“AI 无法自我评估。人类参与是强制性的,但大规模让人类参与的基础设施并不存在。我们基于 Solana 构建了该基础设施,并用近 15,000 名参与者对其进行了测试。结果是,通过开放参与生成了最大的真实世界对抗性数据集之一。”
该公司表示,该挑战赛展示了一种新的 AI 测试模型。Stormrae 不仅仅依赖于内部团队或付费标注人员,而是引入了经济激励措施,鼓励大量参与者积极探测模型的弱点。

King Arthur 大大超过了以往链上 AI 实验的规模。例如,广受讨论的 Freysa 挑战赛吸引了 195 名参与者。Stormrae 的活动吸引了超过 75 倍的参与者,并产生了超过 130 倍的对抗性提示量。
Stormrae 将 Solana 定位为支持该模型的基础设施层,允许自主 AI 代理控制资金库、分配奖励并在链上透明地记录结果。
King Arthur 代表了该公司首次公开部署。Stormrae 计划扩展该平台,以支持更多 AI 评估和数据生成挑战。
未来展望
Stormrae 正在准备其 V3 平台,该平台将把其消费者应用程序整合到一个生态系统中,并引入新的功能,包括代理对代理的红队测试、数据标记以及用于大规模 AI 评估的企业基础设施。

