jingze_cheng 5edc62fa81 docs: 更新README | há 8 meses atrás | |
---|---|---|
cores | há 8 meses atrás | |
deploy | há 11 meses atrás | |
images | há 2 anos atrás | |
models | há 1 ano atrás | |
sx_utils | há 10 meses atrás | |
testing | há 1 ano atrás | |
.gitignore | há 2 anos atrás | |
Dockerfile | há 8 meses atrás | |
Makefile | há 1 ano atrás | |
README.md | há 8 meses atrás | |
cpu.Dockerfile | há 2 anos atrás | |
docker-compose.yml | há 8 meses atrás | |
environment.yml | há 1 ano atrás | |
kubeconfig-sxkj | há 1 ano atrás | |
kubeconfig-sxkjprod | há 1 ano atrás | |
run.py | há 2 anos atrás | |
server.py | há 8 meses atrás |
基于 paddleocr v2, 用于识别表格。
conda env create -f environment.yml
# port 8080
python server.py --port 8080
python -m unittest discover testing '*_test.py' -v
make all
表格识别服务的简化流程如下:
表格区域图片
|
| (图像方向预测 + 旋转)
v
0度方向的图片 -----------------------+
| |
| (表格结构预测) | (文本检测)
v v
表格Cell检测框集 文本检测框集
| |
| | (图片裁剪 + 文本识别)
| v
| 文本识别结果集
| |
| |
+------------------------------+
|
| (根据Cell检测框和文本检测框坐标,聚合文本)
v
表格识别结果
流程说明:
图像方向预测和旋转。我们使用 PaddleClas 内建的图像分类器预测文本区域图片的方向,并将图片旋转为 0 度。
这是因为我们训练文本检测模型所用的文本图片方向均为 0 度(即水平方向的文字为从左向右排列,竖直方向的文本为从上向下排列)。
表格结构预测。将0度方向图片输入表格结构预测模型,得到表格 Cell 检测框列表。
文本检测和识别。将0度方向的图片输入文本检测模型,得到文本检测框并裁剪出图像,将文本图像输入文本识别模型,得到文本识别结果。
文本聚合。根据表格 Cell 检测框和文本检测框的坐标,聚合文本,得到包含表格结构和内容的识别结果。
重新识别(流程图上未表示)。我们会对表格的识别结果评分,若表格识别结果评分较低,则对表格区域图片进行一些预处理后重复上述流程识别表格图片。
参考: