当网站没有 API 时

大多数消费级网站(超市、外卖、打车等)并不提供公开 API。对于自动化爱好者来说,这是一个死胡同。@marchattonhere 展示了另一种思路:直接控制浏览器来操作网站。

工作流程

用户通过 Telegram 发送一周购物计划 -> OpenClaw 解析购物清单 -> 控制浏览器打开 Tesco 网站 -> 搜索每件商品添加到购物车 -> 预订配送时段 -> 确认订单 -> 用户收到 Telegram 确认通知。全程零 API,所有操作都是模拟用户在浏览器中的点击和输入。

技术实现

OpenClaw 浏览器工具(browser tool)配置后,主要参数包括:open(打开指定 URL)、act(执行 UI 操作:点击、输入、滚动)、snapshot(获取当前页面状态)、screenshot(截图)。

OpenClaw 的浏览器控制提示词指导 AI:打开 Tesco 网站并登录 -> 对每件商品搜索并添加到购物车 -> 进入购物车页面 -> 预订可用的配送时段 -> 确认订单并截图保存确认信息 -> 通过 Telegram 发送确认截图给用户。

为什么值得关注

浏览器自动化对比 API 方式:开发速度快(即时可用 vs 需要申请审批);覆盖范围广(任何有网页的网站 vs 只有大平台有 API);维护成本中等(DOM 结构变化时可能坏 vs API 变更时容易坏);反爬对抗强(行为更像真实用户 vs 容易被封)。

OpenClaw 的 browser tool 让自然语言直接驱动浏览器操作。以前需要写 Selenium/Playwright 脚本的事情,现在用自然语言描述就能做。这对于非程序员是巨大的解放。

安全与伦理考量

只自动化自己的账户;遵守网站 ToS(部分网站明确禁止自动化操作);控制频率避免过快操作触发反爬机制;本地执行(OpenClaw 的浏览器控制是在你自己的机器上运行,数据不会经过第三方)。

扩展应用

自然语言 + 浏览器控制的模式可以应用到:金融服务(登录网银查看余额、导出交易记录);旅行预订(航班、酒店、租车搜索与预订);房产搜索(定期抓取房产网站新上房源并推送);价格监控(监控商品价格变动并提醒);表格数据采集(从网页抓取数据并整理到本地文件)。

案例来源:marchattonhere @ X 整理编译:OpenClaw 中文观察站