一, 通用表格识别

通用表格识别可以帮助开发者识别各类标准报表、表格中的核心字段，将表格上的字段以及字段对应的信息，输出为标准的Json格式，完成信息的结构化。此模块目前支持高级版引擎。该AI模块可用于财务报表的电子化、保险单信息的快速提取结构化等多种场景。

比如，财务报表的录入采用和数据分析基于人工阅读审核的方式，效率低、出错率较高、成本高，无法实现审批自动化，严重阻碍了信审的效率和业务开展，通用表格识别可以解决报表电子化的问题。

通用表格识别的核心特点如下：

通用表格识别支持按照表格的格式进行识别，并将表格外的部分识别为文字，识别的结果分为文字和表格两部分。
支持处理的文件类型为jpg、jpeg、png、bmp四种格式的图片。
支持一张图片中多个表格同时识别，分别按照文字和表格进行识别，返回每个表格的内容。

二, 功能介绍

支持表格文字的检测与识别，并按照表格的原始位置信息返回结构化的数据，支持英语、日语、韩语、法语、德语、葡萄牙语、意大利语、西班牙语、荷兰语、繁体字等多种语言的识别。

三, 学习小贴士

本章内容主要讲解通用表格识别,包含屏幕表格识别,图像表格识别,PDF表格识别等内容。

四, 学习目标

1, 掌握[通用文字识别]命令使用
2, 掌握[屏幕文字识别]命令使用
3, 掌握[图像文字识别]命令使用
4, 掌握[PDF文字识别]命令使用
5, 掌握[获取全部文本]命令使用
6, 掌握[获取段落文本]命令使用
7, 掌握[获取每行文本]命令使用
8, 掌握[获取所有文本元素]命令使用

results matching ""

No results matching ""