白皮书下载
实在智能Agent产品白皮书(7.2.0).pdf
键值对结构识别
发刊日期:
2025/11/26
编辑团队:
实在学院
一、视频示例
待上线
二、功能说明
通过OCR识别图片中的键值对文本,并将结果以结构化字典的形式,保存到指定变量。
三、属性说明
基础属性

● 图像源:待识别图片的来源,可选“本地图片”、“屏幕指定区域”或“网络图片”。
● 本地图片路径:图片的路径。可以点击右侧“小文件夹按钮”手动选择文件夹或者点击”fx“选择已保存的文件夹变量。
- 本地图片路径:图片存储在本地的路径。建议使用常见的 jpg、jpeg 和 png 等图片格式。
- 屏幕目标区域:图像源选择“屏幕指定区域”时,需选择待识别图片元素的指定屏幕区域,可使用变量。
- 图片URL:图像源选择“网络图片”时,需输入待识别网络图片的地址。
● 输出到变量:将识别后的键值对结果,输出并保存到变量,以便在后续步骤中动态获取和使用这些信息。
● 键值对图片示例(上下或左右结构):


高级属性

● 执行前延时(秒):流程开始执行预设任务前,特意设置的一段等待时间,目的是预留缓冲(如等待前置条件就绪、避免操作冲突)。
● 执行后延时(秒):指流程完成指令动作后,出现预期外的时间延迟,比如机器人完成抓取后延时。
● 超时时间(秒):执行某个流程时,等待响应所能容忍的最大时间限制。
异常处理

● 异常重试:当流程运行过程中发生异常时,可根据实际需求配置是否启用重试逻辑。
● 异常处理:处理方式分为终止流程和继续流程。
- 终止流程:彻底停止当前正在进行的步骤或任务,后续相关操作不再执行。
- 继续流程:暂停或中断后,恢复当前步骤或任务,按原有逻辑或调整后继续进行。
四、使用示例
执行逻辑
添加组件到可视化编辑区,选择图像源类型,并输入对应参数;运行组件,并打印查看结果。
![]()
输出结果

五、输出结果说明
key:键的文本内容
-box:键的坐标
-content:值
--text:值的文本内容
--box:值的坐标
--score:值的得分
-matchscore:键值匹配得分
-score:键的得分




