1. 首页
  2. 文档
  3. 图像OCR识别(含坐标)

白皮书下载

实在智能Agent产品白皮书(7.2.0).pdf

图像OCR识别(含坐标)

发刊日期:
2025/10/23

编辑团队:
实在学院

一、视频示例

二、功能说明

调用本地服务对屏幕中的指定区域或本地图片进行OCR识别,将识别出的图像信息(包含坐标)输出到指定变量。

注:若屏幕分辨率或缩放比例发生变化,坐标值也会随之发生变化。

三、属性说明

基础属性

● 图像源:需要识别的目标图像的来源,可选择“屏幕指定区域”或“本地图片”。

● 目标:选择待识别的屏幕元素或本地图片。

● 输出到变量:输出识别结果(包括坐标信息),赋值到变量,以便在后续步骤中动态获取和使用这些信息。

高级属性

执行前延时(秒):流程开始执行预设任务前,特意设置的一段等待时间,目的是预留缓冲(如等待前置条件就绪、避免操作冲突)。

执行后延时(秒):指流程完成指令动作后,出现预期外的时间延迟,比如机器人完成抓取后延时。

超时时间(秒):执行某个流程时,等待响应所能容忍的最大时间限制。

异常处理

异常处理:处理方式分为终止流程和继续流程。

  • 终止流程:彻底停止当前正在进行的步骤或任务,后续相关操作不再执行。
  • 继续流程:暂停或中断后,恢复当前步骤或任务,按原有逻辑或调整后继续进行。

四、使用示例

执行逻辑

添加【图像OCR识别(含坐标)】组件到可视化编辑区,并配置其基础属性。

输出结果

将OCR识别图像的结果,即图像的基本信息和坐标信息,输出并打印出来。

企业培训
技术支持
加入社群
公众号
实在智能Agent学习群
扫码关注微信公众号