昨晚,Claude 发布了全新的 SONNET 3.5,Haiku 版本预计在月底推出。其中有两大亮点值得关注:AI 操作电脑和编程能力的显著提升。
编程能力的提升将会有单独的文章进行详细介绍,感兴趣的朋友可以持续关注。今天,我们将专注于如何在自己的电脑上运行 Claude 3.5 的 AI 操作功能,带您体验这一新技术。
一台电脑(我使用的是 Windows,理论上任何能运行 Docker 的系统都可以)
Claude 的官方 Key(目前大多数中转服务不支持,我们正在加紧对接)
首先,正常安装 Docker。安装完成后,打开本地 Docker,登录后无需其他操作。确保左下角的服务启动成功。
Claude 官方提供了一个 Demo(Python),可以直接拉取到本地运行。
您可以在 GitHub 上找到相关代码:anthropic-quickstarts/computer-use-demo。
将代码拉取到本地后,在当前 Python 环境下安装依赖(建议使用 Python 3.11 及以上版本):
bash
pip install -r dev-requirement.txt
接下来,根据官方文档设置环境变量并启动 Docker。
bash
docker run -v ${env:USERPROFILE}.anthropic:/home/computeruse/.anthropic -p 5900:5900 -p 8501:8501 -p 6080:6080 -p 8080:8080 -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest
在镜像拉取完成后,访问网页:http://localhost:8080。
在侧边栏中输入您的 Key,即可开始使用。
Claude 直接为我安装了 Pygame 库。
然后编写代码并运行,整个过程大约只需 1 分钟。
尝试了一下,效果不太理想。由于 Claude 是通过截图获取当前信息的,虽然可以进行操作,但存在一定的时延。
Claude 能够正确打开浏览器并使用 Google 搜索,但在搜索关键词时有些丢失。
虽然 Claude 提供了帮助,但在创建标题行时未能正确分隔,导致输入新闻时遇到困难。
在尝试过程中出现了异常,未能成功获取信息。
json
["key","type","mouse_move","left_click","left_click_drag","right_click","middle_click","double_click","screenshot","cursor_position"]
因此,一个任务所需的步骤较多,交互频繁,处理速度相对较慢。