AI 浏览器 Tabbit 实测:Agent 模式如何操作网页,以及多模型接入方案
背景最近 AI 浏览器这个赛道比较热闹豆包、夸克都出了自己的产品。但多数实现思路还是传统浏览器 侧边栏对话框AI 和浏览过程是割裂的。我比较感兴趣的是另一条技术路线把 Agent 能力直接嵌入浏览器操作流程让 AI 能真正操作网页。带着这个目的我用了几个月美团旗下 GN06 团队原光年之外团队做的 AI 原生浏览器Tabbit这篇文章记录一下它的 Agent 机制和多模型架构供做技术选型的同学参考。Tabbit 1.0 正式版已上线基础功能免费。下载地址抽奖活动邀请Tabbit Browser, Your Life Co-Pilothttps://web.tabbit.com/activity/lottery/invite/D93C4899一、整体架构Tabbit 把网页浏览、全网搜索、AI 对话、任务执行四件事统一到了一个输入框里。它的核心差异不在对话能力而在Agent 代理模式用户用自然语言下达指令后Agent 会模拟真人操作浏览器自动完成页面跳转、搜索、填表、多页信息采集等动作并输出结构化结果。从交互逻辑上看它不是对话式 AI而是执行式 AI。二、Agent 代理模式实测1. 任务执行流程我测了一个比较典型的场景让 Agent 帮我生成一个禁止 Windows 自动锁屏的小工具。正常实现路径是要么自己写代码编译要么找现成方案。我直接在输入框下指令Agent 的执行过程大致是自动检索相关技术资料和实现方案组织代码逻辑生成一个 exe 可执行文件整个过程我没有手动参与编码最终产出的文件可以直接运行。这个指令 → 自动执行 → 产出可用文件的链路是它和普通对话式 AI 浏览器的主要区别。除了 exeAgent 还支持生成 PPT、Word、Excel、PDF 等格式适合做调研报告、数据整理这类多步骤任务。2. 上下文管理一个值得提的点是上下文引用。Tabbit 支持把当前打开的网页、浏览器收藏、本地文件、文件夹内容直接作为任务上下文不用手动复制粘贴。收藏夹还会对网页全文做索引方便后续检索调用。这一点比独立的 AI 对话框更有优势因为浏览器天然掌握着用户最完整的上下文信息。三、多模型接入方案这是 Tabbit 架构上比较开放的一个设计。它接入了多款国产主流大模型包括 DeepSeek、Kimi、智谱 GLM、豆包、千问、LongCat 等可以随时切换也支持多模型结果对比。各家产品的模型策略不同做个简单对比对比项Tabbit豆包浏览器夸克浏览器模型接入多模型聚合可切换绑定豆包绑定夸克自研Agent 网页操作支持侧边栏对话为主侧边栏对话为主文件生成能力支持 PPT/Word/Excel/PDF/exe以对话为主以对话为主多模型聚合的好处是模型迭代很快单一绑定存在模型不是当前最优的风险。官方数据显示超过 60% 的活跃用户会主动切换模型平均每人使用 2 个以上说明用户在不同场景下确实有不同的模型偏好。国际版还接入了 ChatGPT 和 Claude每周有指定免费额度适合偶尔需要国外模型的场景。四、使用流程记录1. 安装与数据迁移安装后Tabbit 会自动识别电脑上已有的浏览器询问要导入的书签、标签页、扩展、账户信息确认后几分钟内完成迁移包括当时打开的网页。迁移成本比较低。2. 开启 Agent 模式首页默认是一个全能输入框默认搜索模式。在设置里开启「智能代理」开关后输入任务指令Agent 会接管执行。3. 妙招功能可以把高频提示词保存为「妙招」下次输入/一键调用。我固定了竞品信息搜集 对比表格和网页评论抓取 分析报告两个模板重复任务效率提升明显。五、几点使用体会用下来几个直观感受Agent 模式比较适合调研、对比、数据收集这类多步骤、多网页的任务重复性劳动交给它比较划算。模型选择上DeepSeek 偏代码和逻辑类任务Kimi 适合长文本处理智谱 GLM 综合表现稳定建议按任务类型选。国际版额度有限重要任务建议留在国产模型侧国际版作为补充。整体来看Tabbit 的技术路线和多数浏览器 对话框的产品不太一样把 Agent 执行能力做进了浏览器主流程里对于每天在浏览器里处理大量信息的开发者、运营和内容创作者是一个值得关注的方案。想体验的同学点击下方链接下载抽奖活动邀请Tabbit Browser, Your Life Co-Pilothttps://web.tabbit.com/activity/lottery/invite/D93C4899。

相关新闻