白皮书下载
实在智能Agent产品白皮书(7.2.0).pdf
图像OCR识别(含坐标)
发刊日期:
2025/10/23
编辑团队:
实在学院
一、视频示例
二、功能说明
调用本地服务对屏幕中的指定区域或本地图片进行OCR识别,将识别出的图像信息(包含坐标)输出到指定变量。
注:若屏幕分辨率或缩放比例发生变化,坐标值也会随之发生变化。
三、属性说明
基础属性

● 图像源:需要识别的目标图像的来源,可选择“屏幕指定区域”或“本地图片”。
● 目标:选择待识别的屏幕元素或本地图片。
● 输出到变量:输出识别结果(包括坐标信息),赋值到变量,以便在后续步骤中动态获取和使用这些信息。
高级属性

● 执行前延时(秒):流程开始执行预设任务前,特意设置的一段等待时间,目的是预留缓冲(如等待前置条件就绪、避免操作冲突)。
● 执行后延时(秒):指流程完成指令动作后,出现预期外的时间延迟,比如机器人完成抓取后延时。
● 超时时间(秒):执行某个流程时,等待响应所能容忍的最大时间限制。
异常处理

● 异常处理:处理方式分为终止流程和继续流程。
- 终止流程:彻底停止当前正在进行的步骤或任务,后续相关操作不再执行。
- 继续流程:暂停或中断后,恢复当前步骤或任务,按原有逻辑或调整后继续进行。
四、使用示例
执行逻辑
添加【图像OCR识别(含坐标)】组件到可视化编辑区,并配置其基础属性。
![]()
输出结果
将OCR识别图像的结果,即图像的基本信息和坐标信息,输出并打印出来。





