MobileGym (不是移动健身房) 最近更新了网站内容,现在支持在线体验能够自动操作手机的 gui agent ,大家可以输入自己的 key 来尝试一下,看看 agent 是怎么一步一步完成任务的。我们已经做 sim2real 实验证明了,如果能在网页上完成某个任务,那么大概率在大家手机上也是可以完成的。欢迎大家前来体验,我们会不断的优化网站和代码的问题。我们的最终目标是具有现实世界的生产力和用途,而不是只能在手机或者网页上划几下就不知道该干什么,欢迎大家给我们提建议。(我们其实提供了免费的 key ,大家可以直接在网站使用 agent ,但是用的人多就很可能报错) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP——微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面兼容小米主题包、支持自定义小组件,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的(法律允许范围内)。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持成百上千个环境实例并行 🧪 416 个任务模板,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短三行代码搞定 🛡️ 纯沙盒,无后果,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP—— 微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 👉 mobilegym.dev 。 特性 ⚡ 超轻量,高并发 ,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持 成百上千个 环境实例并行 🧪 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 🛡️ 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 MobileGym (不是移动健身房) 有点标题党了,但是真烧了几百亿 Token,纯前端 TypeScript + React ,实现了28 个仿真 APP—— 微信、支付宝、小红书、bilibili、X、Reddit、微信读书、12306、腾讯会议、Spotify、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面 兼容小米主题包、支持自定义小组件 ,Activity 栈、Intent、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。 虽然本来是为了研究 GUI Agent 打造的,但是佬友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的( 法律允许范围内 )。在线试玩 mobilegym.dev 。 特性 超轻量,高并发 ,单实例仅占400M 内存(对比安卓模拟器4-10G),单台服务器支持 成百上千个 环境实例并行 416 个任务模板 ,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱LLM as a Judge 的不可靠 Sim-to-Real 实测有效 ,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 扩展友好 ,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest;新写一个任务只需要一个 Python 类,最短 三行代码 搞定 纯沙盒,无后果 ,不连真服务、不转真钱、不发真消息,放心瞎点 链接 github.com GitHub - Purewhiter/mobilegym: MobileGym: A Verifiable and Highly Parallel... MobileGym: A Verifiable and Highly Parallel Simulation Environment for Mobile GUI Agent Research 35 个帖子 - 22 位参与者 阅读完整话题
礼品卡可薅不了买一送一的 TEAM 啊,错失几百亿,心痛到不能呼吸 9 个帖子 - 5 位参与者 阅读完整话题
2025年年报原来是几百亿,直接缩水变成90亿。太刺激了,也学会川普调非农那一套了 。 不知道有没有进坑的佬,默哀。 1 个帖子 - 1 位参与者 阅读完整话题