这家总部位于巴黎的初创公司由一位曾通过单一提示词攻破主流 AI 模型的研究员创立,现已筹集 1100 万美元,旨在帮助企业控制其 AI 系统。
这家总部位于巴黎的初创公司由一位曾通过单一提示词攻破主流 AI 模型的研究员创立,现已筹集 1100 万美元,旨在帮助企业控制其 AI 系统。

(P1) 法国网络安全初创公司 White Circle 已在种子轮融资中筹集 1100 万美元,用于扩展其 AI 控制平台。这是为部署大语言模型的企业提供的一个新的安全层。此次融资背景是,企业正面临着模型供应商内置通用安全过滤之外的风险,如数据泄露、幻觉和提示词注入攻击。
(P2) “越狱只是问题的一部分,”White Circle 创始人兼首席执行官 Denis Shilov 告诉《财富》杂志。“就像人们会有不当行为一样,模型也会产生不当行为。我们实际上是在强制执行行为规范。”
(P3) 本轮投资获得了多位 AI 行业领袖的参与,显示出对公司方法的强烈信心。支持者包括 OpenAI 开发者体验主管 Romain Huet、Anthropic 的 Durk Kingma、Mistral 联合创始人 Guillaume Lample 以及 Hugging Face 联合创始人 Thomas Wolf。该公司将利用这笔资金招聘人才、加速产品开发,并扩大在美国、英国和欧洲的客户群。
(P4) 随着公司从简单的聊天机器人转向能够访问文件或发放退款的自主 AI 代理,对专用控制层的需求变得更加紧迫。White Circle 的平台位于公司用户和 AI 模型之间,实时监控所有输入和输出,以执行自定义策略——而模型供应商本身在完善这一功能方面动机各异。
这家总部位于巴黎的初创公司诞生于 Shilov 在 2024 年底的研究。当时他开发了一个通用的越狱提示词,可以绕过所有领先 AI 模型的安全护栏。在他的发现在 X 平台上走红后,包括 Anthropic 在内的主要 AI 实验室邀请他测试他们的模型,这使他确信,企业不仅需要更好的模型,更需要更好的控制机制。
White Circle 的软件旨在捕捉各种模型失当行为。它可以阻止用户生成恶意软件的企图,在模型产生幻觉并向客户承诺未经授权的退款时发出警报,或者阻止 AI 代理泄露敏感财务数据。该平台已经处理了超过 10 亿次 API 请求,并已被初创公司 Lovable 以及几家金融科技和法律公司使用,不过具体的收入数据尚未披露。
为了增强其作为独立仲裁者的信誉,White Circle 的研究部门发布了“KillBench”。这项研究对来自 OpenAI、Google 和 xAI 等供应商的 15 个 AI 模型进行了超过 100 万次实验。研究揭示了在高风险场景中出现的潜在偏见,凸显了在普通使用中并不明显的风险。
这笔投资是对围绕 AI 行业增长的“铲子和镐”经济的有力押注。来自 OpenAI、Anthropic 和 Mistral 等竞争性 AI 实验室的高管参与其中,表明行业已达成广泛共识:第三方执行层是企业 AI 技术栈的必要组成部分。这预示着一个专注于 AI 基础设施和安全的新型关键细分市场正在投资者的关注下兴起。
本文仅供参考,不构成投资建议。