随着 AI 工具的迅猛发展,新一代编程工具不断涌现。今天为大家全流程展示如何用 Windsurf 零代码快速开发一款 网页对话和图像理解插件,并顺利提交至 Chrome 应用商店。
在 Cursor 爆火之后,Windsurf 成为另一款备受瞩目的 AI 编程工具,由估值达到 12.5 亿美元的美国初创公司 Codeium 打造。一经发布便掀起热潮,其结合 协作型 Copilot 和 独立 Agent 功能,开启了全新的人机协作模式。
通过使用 Windsurf,我们将打造一个支持 网页对话 和 图像理解 的 Chrome 浏览器插件。最终成品具备以下核心功能:
网页对话:基于文本多轮对话的浏览器工具。
图像理解:支持图片识别、描述生成及更多高级图像处理任务。
本次插件开发中,我们使用智谱 AI 提供的免费多模态模型 API:
GLM-4-Flash:以高速度和经济性为特点,适合简单响应式任务。
GLM-4V-Flash:专注于高级图像处理,包括图像描述生成、视觉问答等。
对话能力:能够实现多轮对话、Function Call 等,支持包括中文、英文、日语等 26 种语言。
数据提取:应用于生物信息解析、健康预测等场景。
数据生成:用于生成训练大模型的高质量数据。
实际案例应用:学术助教、翻译工具、文案辅助等。
视觉处理:支持图像描述生成、分类、情感分析等高级功能。
场景应用包括:
配图生成营销文案,优化社交媒体传播效果。
图像辅助学习:深入解读高难度学术图片内容。
美容分析:识别皮肤问题并提供具体护理建议。
OCR 数据提取:优化保险单据或票据的关键信息提取。
以下为完整开发步骤,适合零基础用户快速入门:
下载 Windsurf:前往官方渠道下载安装。
创建代码文件夹:注意文件夹命名需避免中文和特殊字符。
启动 Windsurf:打开文件夹后,Windsurf 将引导您一步步完成初始框架搭建。
借助 Windsurf 填写需求点,工具将快速搭建代码框架。
接入智谱 AI 提供的 GLM-4-Flash 和 GLM-4V-Flash API。
功能测试:逐步验证对话处理和图像识别模块的运行情况。
在 Chrome 浏览器的扩展程序页面,通过开发者模式手动加载本地插件文件。
利用 GLM-4-Flash 测试对话功能,确保插件能够快速响应。
利用 GLM-4V-Flash 验证图片识别功能,检查图像生成描述的效果及准确度。
随着 AI 技术的不断进化,人人都能无需专业编程知识,从零到一完成插件开发。本次演示过程中,我们清晰地看到 Windsurf 结合智谱 AI 工具的高效与易用性。
如果你也对 AI 编程感兴趣,不妨亲自动手,体验 AI 助力下的开发乐趣!