Deck 实验室
今天,智能体使用软件。 明天,它们将使用一切。
我们正在构建一个未来——AI 不仅仅是在屏幕上点击按钮,而是操作机器、导航物理空间,并在现实世界中与人类协同工作。
现在
Computer Use
智能体可以看到屏幕、点击按钮,像人类一样操作任何软件。无需 API。这就是 Deck 今天所做的——它已经在改变公司的运作方式。
下一步
在当今局限内最大化 LLM 能力
当前的模型功能强大但受到限制——上下文窗口、幻觉、成本。我们正在研究如何进一步突破:多智能体协作、长时间任务记忆、无需人工干预即可从错误中恢复的自愈工作流,以及在 100 步以上工作流中保持智能体方向正确的结构化推理。
未来
Robotic Use
让智能体导航网站的同样原理,也可以让它导航仓库。读取仪表盘的同样视觉模型,也可以读取工厂车间。我们正在探索 Computer Use 如何超越屏幕——延伸到摄像头、传感器、机械臂和物理环境。
我们正在探索的开放问题
01
API 覆盖了全球 1% 的软件。其余 99% 只有用户界面。如何构建一个能够操作所有这些软件的智能体——而无需编写任何集成代码?
02
如果导航网站的认知循环与导航仓库相同——感知、决策、行动——那么什么样的基础设施可以桥接数字与物理环境之间的鸿沟?
03
在一个 200 步的工作流中,每步可靠性为 98%,端到端成功率降至约 2%。如何设计纠错机制,在不产生二次方成本的情况下将可靠性保持在 95% 以上?
04
每个企业都有数千个凭证,每个智能体都需要访问权限。如何构建一个凭证架构,使得任何单个虚拟机的泄露都不会暴露整个凭证图谱?
05
软件更新界面的速度比任何模型重新训练的速度都快。如何构建将每个界面都视为全新的智能体——并且仍然在首次尝试时正确操作?
06
您正在尝试回答的重大问题是什么?
如果这些问题激发了您的兴趣