[字节又出大招啦]可以运行任何桌面应用程序、打开文件、浏览网站,并自动执行任务,而无需连接互联网[100% 开源]

3 条回复
75 次浏览

image

UI-TARS-desktop:开源多模态人工智能代理
UI-TARS-desktop 是一款由 #ByteDance(#TikTok 背后的公司)开发的开源多模态人工智能代理。
它允许用户使用自然语言命令自动执行桌面任务,设置完成后即可在本地运行,无需网络连接。

关键细节

核心功能:该智能体能够捕获屏幕截图,利用视觉语言模型进行解读,并执行精确的鼠标/键盘操作。它可以通过类似聊天的指令打开应用程序、浏览菜单、填写表单、浏览网站并处理复杂的工作流程。
隐私和本地执行:所有程序都在您的计算机上运行,以增强隐私和离线使用。
支持的机型:主要为字节跳动的 UI-TARS-1.5-7B(可在 Hugging Face 上使用),并支持相关的 Seed-VL 机型。
平台:注重跨平台,在 macOS 和 Windows 上都有强大的演示。
项目状态:于 2025 年初启动,积极维护,GitHub 星标数约为 25.5k。

复制
https://github.com/bytedance/UI-TARS-desktop
前排打手

牛逼,这个内网神器了,应该可以用来做自动化测试good

发表一个评论

R保持