Runloop 获得 700 万美元种子轮融资,助力 AI 编程代理云端开发环境建设
总部位于旧金山的基础设施初创公司 Runloop 近日获得了 700 万美元的种子轮融资,旨在解决其创始人所说的 “生产差距” 问题 —— 即将 AI 编程代理从实验原型部署到实际的企业环境中这一关键挑战。
此次融资由 The General Partnership 领投,Blank Ventures 参投。预计到 2032 年,AI 编程工具市场将增长至 301 亿美元,年复合增长率为 27.1%。此次投资表明投资者对能够使 AI 代理在企业规模上运行的基础设施的信心日益增强。
Runloop 的平台解决了随着 AI 编程工具不断涌现而出现的一个基本问题:当 AI 代理需要执行复杂的、多步骤的编程任务时,它们实际在哪里运行?
“从长远来看,梦想是每个大公司的每个员工可能有 5 到 10 个不同的数字员工,或者说是 AI 代理来帮助他们完成工作,”Runloop 的联合创始人兼首席执行官乔纳森・沃尔在与 VentureBeat 的独家采访中解释道。沃尔曾联合创立了谷歌钱包和金融科技初创公司 Index,后者被 Stripe 收购。
沃尔所用的类比很有说服力:“如果你在一家普通的科技公司招聘新员工,他们在上班的第一天,公司会给他们笔记本电脑、电子邮件地址、凭证。然后告诉他们如何登录 GitHub。他们可能会花第一天时间来设置这个环境。”
沃尔认为,同样的原则也适用于 AI 代理。“如果你期望这些 AI 代理能够完成人们正在做的工作,那么它们需要拥有所有相同的工具。它们需要自己的工作环境。”
Runloop 最初专注于编程领域,是基于对编程语言与自然语言本质的战略洞察。“编程语言比英语等自然语言狭窄且严格得多,” 沃尔解释道。“它们有非常严格的语法,非常模式化。这些是大型语言模型(LLMs)非常擅长的方面。”
更重要的是,编程提供了沃尔所说的 “内置验证功能”。AI 代理编写代码时可以通过运行测试、编译代码或使用代码格式化工具来持续验证其进度。“在其他环境中,这种工具并不真正可用。如果你在写一篇文章,我想你可以进行拼写检查,但要评估一篇文章在写作过程中的相对质量,就无法使用编译器了。”
这种技术优势被证明是非常有先见之明的。AI 编程工具市场确实已成为企业 AI 中增长最快的部分之一,这得益于像 GitHub Copilot 这样的工具,微软报告称其有数百万开发者在使用,以及 OpenAI 最近宣布的 Codex 改进。
Runloop 的云端开发环境(devboxes):企业 AI 代理基础设施
Runloop 的核心产品,称为 “开发环境(devboxes)”,提供了隔离的云端开发环境,AI 代理可以在其中安全地执行代码,拥有完整的文件系统和构建工具访问权限。这些环境是短暂的 —— 基于需求可以动态地创建和销毁。
“你可以创建 1000 个开发环境,使用 1000 个开发环境一小时,然后可能某个特定任务就完成了,” 沃尔说。然后,“你不需要 1000 个开发环境了,就可以销毁它们。”
一个例子展示了该平台的实用性。当一个构建 AI 代理的客户检测到生产环境中的问题时,他们会同时部署数千个开发环境来分析代码库并生成全面的测试套件,这些 AI 代理可以自动编写单元测试以提高代码覆盖率。
“他们会新入职一家公司并说,‘嘿,我们首先要做的是查看你所有地方的代码覆盖率,注意到哪里不足,然后去编写一大堆测试,再挑选最有价值的测试发送给你的工程师进行代码审查,’” 沃尔解释道。
Runloop 客户成功案例:节省六个月时间并实现 200% 的客户增长
尽管 Runloop 直到三月才开始计费,五月才开启自助注册,但公司已取得显著进展。公司报告称有 “几十个客户”,包括 A 轮公司和主要模型实验室,自三月以来客户增长超过 200%,收入增长超过 100%。
“我们的客户倾向于那些在 AI 曲线上非常早期的人群,并且在使用 AI 方面相当成熟,” 沃尔指出。“至少目前,这往往是那些试图将 AI 作为核心能力来构建的 A 轮公司,或者是一些显然在 AI 方面最为成熟的模型实验室。”
这种影响似乎相当大。Runloop 的客户 Detail.dev 的首席执行官丹・罗宾逊称该平台 “对我们的业务来说是杀手锏。没有它,我们不可能如此迅速地进入市场。我们没有花数月时间构建基础设施,而是能够专注于我们所热衷的事情:创建能够消灭技术债务的代理…… Runloop 基本上将我们的上市时间缩短了六个月。”
AI 代码测试和评估:超越简单的聊天机器人交互
Runloop 的第二个主要产品,公共基准测试,解决了另一个关键需求:AI 编程代理的标准化测试。传统的 AI 评估侧重于用户与语言模型之间的单次交互。Runloop 的方法则完全不同。
“我们正在评估的可能是数百次工具使用,数百次大型语言模型调用,并判断一个代理运行的综合或纵向结果,” 沃尔解释道。“这更注重长期性,并且非常重要的是,它富含上下文。”
例如,在评估 AI 代理修补代码的能力时,“你不能仅评估差异或从大型语言模型中得到的回应。你必须将其置于整个代码库的上下文中,并使用像编译器和测试这样的工具。”
这种能力吸引了模型实验室作为客户,他们使用 Runloop 的评估基础设施来验证模型行为并支持训练过程。
AI 编程工具市场已经吸引了大量技术巨头的投资和关注。微软的 GitHub Copilot 在市场份额方面处于领先地位,而谷歌最近宣布了新的 AI 开发者工具,OpenAI 则继续推进其 Codex 平台。
然而,沃尔认为这种竞争是一种认可而非威胁。“我希望有很多人构建 AI 编程代理,” 他说,并举了 Databricks 在机器学习(ML)领域的例子。“Spark 是开源的,任何人都可以使用…… 为什么人们使用 Databricks?嗯,因为实际上部署和运行它是相当困难的。”
沃尔预计市场将朝着特定领域的 AI 编程代理发展,而不是通用工具。这些代理将在特定任务上表现出色,例如安全测试、数据库性能优化或特定编程框架。
Runloop 的收入模式和企业 AI 基础设施增长战略
Runloop 采用基于使用的定价模式,每月收取少量费用,外加根据实际计算消耗收费。对于大型企业客户,公司正在开发具有最低使用承诺的年度合同。
这 700 万美元的资金将主要用于工程和产品开发。“基础设施平台的孵化需要更长时间,” 沃尔指出。“我们现在才刚刚开始广泛地进入市场。”
公司 12 人的团队包括来自 Vercel、Scale AI、谷歌和 Stripe 的资深人士 —— 沃尔认为这些经验对于构建企业级基础设施至关重要。“这些是经验丰富的高级基础设施人员。要让每个公司都能组建一个像这样的团队来解决这个问题,这将是相当困难的。”
AI 编程代理和企业部署平台的未来发展
随着企业越来越多地采用 AI 编程工具,支持它们的基础设施变得至关重要。行业分析师预测持续快速增长,全球 AI 编程工具市场将从 2023 年的 48.6 亿美元增长到 2030 年的超过 250 亿美元。
沃尔的愿景超越了编程,扩展到其他领域,AI 代理在那里需要复杂的工作环境。“随着时间的推移,我们认为我们可能会接管其他垂直领域,” 他说,尽管由于 AI 部署的技术优势,编程仍然是目前的重点。
沃尔提出一个根本性的问题:“如果你是一家公司的首席战略官或首席信息官,并且你的团队想要使用每个代理,你怎么可能让他们顺利入职并将 25 个代理带入你的环境呢?”
对于 Runloop 来说,答案在于提供一个基础设施层,使 AI 代理的部署和管理变得与传统软件应用一样容易 —— 将数字员工的愿景从原型变为生产的现实。
“每个人都相信你会拥有这个数字员工基础:你如何让他们顺利入职?如果你有一个平台,这些代理可以在上面运行,并且你验证了这个平台,这将成为人们开始广泛使用代理的可扩展方式。” 沃尔说道。
评论