1. 首页
  2. 文档
  3. 键值对结构识别

白皮书下载

实在智能Agent产品白皮书(7.2.0).pdf

键值对结构识别

发刊日期:
2025/11/26

编辑团队:
实在学院

一、视频示例

待上线

二、功能说明

通过OCR识别图片中的键值对文本,并将结果以结构化字典的形式,保存到指定变量。

三、属性说明

基础属性

● 图像源:待识别图片的来源,可选“本地图片”、“屏幕指定区域”或“网络图片”。

● 本地图片路径:图片的路径。可以点击右侧“小文件夹按钮”手动选择文件夹或者点击”fx“选择已保存的文件夹变量。

  • 本地图片路径:图片存储在本地的路径。建议使用常见的 jpg、jpeg 和 png 等图片格式。
  • 屏幕目标区域:图像源选择“屏幕指定区域”时,需选择待识别图片元素的指定屏幕区域,可使用变量。
  • 图片URL:图像源选择“网络图片”时,需输入待识别网络图片的地址。

输出到变量:将识别后的键值对结果,输出并保存到变量,以便在后续步骤中动态获取和使用这些信息。

● 键值对图片示例(上下或左右结构):

高级属性

执行前延时(秒):流程开始执行预设任务前,特意设置的一段等待时间,目的是预留缓冲(如等待前置条件就绪、避免操作冲突)。

执行后延时(秒):指流程完成指令动作后,出现预期外的时间延迟,比如机器人完成抓取后延时。

超时时间(秒):执行某个流程时,等待响应所能容忍的最大时间限制。

异常处理

 

异常重试:当流程运行过程中发生异常时,可根据实际需求配置是否启用重试逻辑。

异常处理:处理方式分为终止流程和继续流程。

  • 终止流程:彻底停止当前正在进行的步骤或任务,后续相关操作不再执行。
  • 继续流程:暂停或中断后,恢复当前步骤或任务,按原有逻辑或调整后继续进行。

四、使用示例

执行逻辑

添加组件到可视化编辑区,选择图像源类型,并输入对应参数;运行组件,并打印查看结果。

输出结果

五、输出结果说明

key:键的文本内容

-box:键的坐标

-content:值

--text:值的文本内容

--box:值的坐标

--score:值的得分

-matchscore:键值匹配得分

-score:键的得分

企业培训
技术支持
加入社群
公众号
实在智能Agent学习群
扫码关注微信公众号