今天,代理使用软件。 明天,它们将使用一切。

我们正在构建一个世界,在这个世界中 AI 不仅仅是在屏幕上点击按钮——它操控机器、导航物理空间,并在现实世界中与人类并肩工作。

现在

Computer-use

代理能够看到屏幕、点击按钮并像人类一样操作任何软件。无需 API。这就是 Deck 今天所处的位置——它已经在改变企业的工作方式。

下一步

在当前限制内最大化 LLM

当前模型功能强大但受限——上下文窗口、幻觉、成本。我们正在研究如何更进一步:多代理编排、长期任务记忆、自修复工作流和跨 100+ 步骤工作流的结构化推理。

未来

Robotic-use

让代理导航网站的同一原理可以让它导航仓库。我们正在探索 Computer Use 如何超越屏幕——延伸到摄像头、传感器、机械臂和物理环境。

我们正在研究的开放问题

01

API 覆盖了全球 1% 的软件。其余 99% 只有用户界面。如何构建一个能够操作所有这些的代理——无需一行集成代码?

02

如果导航网站的认知循环与导航仓库相同——感知、决策、行动——什么基础设施能弥合数字与物理环境之间的差距?

03

在一个 200 步的工作流中,每步可靠性为 98%,端到端成功率降至约 2%。如何设计纠错机制,在不产生二次成本的情况下保持 95% 以上的可靠性?

04

每个企业有数千个凭据,每个代理都需要访问权限。如何构建一个凭据架构,使单个 VM 的泄露不会暴露整个关系图?

05

软件界面的变化速度快于任何模型的重新训练速度。如何构建将每个界面视为全新的代理——并在首次尝试时正确操作它?

06

你试图回答的重大问题是什么?