AI 安全初创公司 White Circle 获行业领袖 1100 万美元融资

(P1) 法国网络安全初创公司 White Circle 已在种子轮融资中筹集 1100 万美元，用于扩展其 AI 控制平台。这是为部署大语言模型的企业提供的一个新的安全层。此次融资背景是，企业正面临着模型供应商内置通用安全过滤之外的风险，如数据泄露、幻觉和提示词注入攻击。

(P2) “越狱只是问题的一部分，”White Circle 创始人兼首席执行官 Denis Shilov 告诉《财富》杂志。“就像人们会有不当行为一样，模型也会产生不当行为。我们实际上是在强制执行行为规范。”

(P3) 本轮投资获得了多位 AI 行业领袖的参与，显示出对公司方法的强烈信心。支持者包括 OpenAI 开发者体验主管 Romain Huet、Anthropic 的 Durk Kingma、Mistral 联合创始人 Guillaume Lample 以及 Hugging Face 联合创始人 Thomas Wolf。该公司将利用这笔资金招聘人才、加速产品开发，并扩大在美国、英国和欧洲的客户群。

(P4) 随着公司从简单的聊天机器人转向能够访问文件或发放退款的自主 AI 代理，对专用控制层的需求变得更加紧迫。White Circle 的平台位于公司用户和 AI 模型之间，实时监控所有输入和输出，以执行自定义策略——而模型供应商本身在完善这一功能方面动机各异。

这家总部位于巴黎的初创公司诞生于 Shilov 在 2024 年底的研究。当时他开发了一个通用的越狱提示词，可以绕过所有领先 AI 模型的安全护栏。在他的发现在 X 平台上走红后，包括 Anthropic 在内的主要 AI 实验室邀请他测试他们的模型，这使他确信，企业不仅需要更好的模型，更需要更好的控制机制。

White Circle 的软件旨在捕捉各种模型失当行为。它可以阻止用户生成恶意软件的企图，在模型产生幻觉并向客户承诺未经授权的退款时发出警报，或者阻止 AI 代理泄露敏感财务数据。该平台已经处理了超过 10 亿次 API 请求，并已被初创公司 Lovable 以及几家金融科技和法律公司使用，不过具体的收入数据尚未披露。

为了增强其作为独立仲裁者的信誉，White Circle 的研究部门发布了“KillBench”。这项研究对来自 OpenAI、Google 和 xAI 等供应商的 15 个 AI 模型进行了超过 100 万次实验。研究揭示了在高风险场景中出现的潜在偏见，凸显了在普通使用中并不明显的风险。

这笔投资是对围绕 AI 行业增长的“铲子和镐”经济的有力押注。来自 OpenAI、Anthropic 和 Mistral 等竞争性 AI 实验室的高管参与其中，表明行业已达成广泛共识：第三方执行层是企业 AI 技术栈的必要组成部分。这预示着一个专注于 AI 基础设施和安全的新型关键细分市场正在投资者的关注下兴起。

本文仅供参考，不构成投资建议。