一, 通用表格识别

通用表格识别可以帮助开发者识别各类标准报表、表格中的核心字段,将表格上的字段以及字段对应的信息,输出为标准的Json格式,完成信息的结构化。此模块目前支持高级版引擎。该AI模块可用于财务报表的电子化、保险单信息的快速提取结构化等多种场景。

比如,财务报表的录入采用和数据分析基于人工阅读审核的方式,效率低、出错率较高、成本高,无法实现审批自动化,严重阻碍了信审的效率和业务开展,通用表格识别可以解决报表电子化的问题。

通用表格识别的核心特点如下:

  • 通用表格识别支持按照表格的格式进行识别,并将表格外的部分识别为文字,识别的结果分为文字和表格两部分。
  • 支持处理的文件类型为jpg、jpeg、png、bmp四种格式的图片。
  • 支持一张图片中多个表格同时识别,分别按照文字和表格进行识别,返回每个表格的内容。

二, 功能介绍

支持表格文字的检测与识别,并按照表格的原始位置信息返回结构化的数据,支持英语、日语、韩语、法语、德语、葡萄牙语、意大利语、西班牙语、荷兰语、繁体字等多种语言的识别。

三, 学习小贴士

       本章内容主要讲解通用表格识别,包含屏幕表格识别,图像表格识别,PDF表格识别等内容。

四, 学习目标

  • 1, 掌握[通用文字识别]命令使用
  • 2, 掌握[屏幕文字识别]命令使用
  • 3, 掌握[图像文字识别]命令使用
  • 4, 掌握[PDF文字识别]命令使用
  • 5, 掌握[获取全部文本]命令使用
  • 6, 掌握[获取段落文本]命令使用
  • 7, 掌握[获取每行文本]命令使用
  • 8, 掌握[获取所有文本元素]命令使用

results matching ""

    No results matching ""