一个相当牛的开源项目 Windows-Use,让任何大语言模型直接控制操作 Windows 系统。

支持打开应用、按钮点击、文字输入等基础交互,可自动化执行命令,实现系统级别的自动化操作。
GitHub:https://github.com/CursorTouch/Windows-Use
同时可实时捕获和理解界面状态,智能判断下一步操作,不依赖传统的计算机视觉模型。
支持 Windows 7 到 Windows 11 全系列系统,可直接语音输入,动动嘴皮就能控制电脑。