Mobile Agent
一:Mobile Agent 背景
AI 的发展已经逐渐蔓延到各行各业,其中手机行业也是在逐渐变革,其中 Mobile RPA 的技术方向如火如荼,也有很多厂家都在逐渐实现这项技术。
1.1 那什么是 RPA 呢?
全称:Robotic Process Automation,旨在模拟人工操作以实现自动化工作流,比如说在模拟手机上的点击、滑动、输入文字等不同操作内容,进而实现手机上常见的操作,比如:点一个螺蛳粉外卖、给妈妈打一个电话、导航到公司等不同的简单操作。
提示
如果以上功能实现了,手机将成为人们强有力的助手。
1.2 Mobile Agent 如何实现呢?
- Automation 工具:用以获得手机屏幕信息、模拟手机操作。
- 视觉模型:用来理解当前画面中的各种元素,并寻找目标元素位置。
- 语言模型:根据用户的 query 并根据上下文信息做任务规划。
这相当于:手机有了手、大脑和眼睛的辅助,就可以完成手机的自动化操作流程了。