Sen descrición

jingze_cheng e32ef91d9a docs: 更新README		hai 8 meses
cores	ef2cfba8ba 效果差重新识别逻辑修改	hai 8 meses
deploy	de826a378f 更新 'deploy/Jenkinsfile'	hai 11 meses
images	4c4c33444e 增加模型，修改测试	%!s(int64=2) %!d(string=hai) anos
models	a60e590093 feat: 915 model	hai 1 ano
sx_utils	aeb0dca2fb 添加注释	hai 9 meses
testing	0e62fb7a79 fix: 回退829	hai 1 ano
.gitignore	3658b1af2b init	%!s(int64=2) %!d(string=hai) anos
Dockerfile	be92760c62 chore: 更新表格结构预测模型版本	hai 8 meses
Makefile	cddea5c0f0 rollback	hai 1 ano
README.md	e32ef91d9a docs: 更新README	hai 8 meses
cpu.Dockerfile	3658b1af2b init	%!s(int64=2) %!d(string=hai) anos
docker-compose.yml	e0ee86f2ac update docker-compose	hai 8 meses
environment.yml	3cf46d5612 fix: 加入方向判断	hai 1 ano
kubeconfig-sxkj	70a7d30c6c fix: Dockerfile	hai 1 ano
kubeconfig-sxkjprod	70a7d30c6c fix: Dockerfile	hai 1 ano
run.py	d046d2d764 fix model_dir, add en_ppocr_table_model	%!s(int64=2) %!d(string=hai) anos
server.py	ef2cfba8ba 效果差重新识别逻辑修改	hai 8 meses

表格识别

基于 PaddleOCR PP-StructureV2, 用于识别表格。

环境

conda env create -f environment.yml

服务端

python run.py --port 8080

单元测试

python -m unittest discover testing '*_test.py' -v

镜像打包

make all

模型配置

模型类别	模型名称	模型配置
表格结构检测	ch_ppstructure_mobile_v2.0_SLANet	./server.py

如果更新了模型权重，请同时修改创建镜像时的下载地址：

$ cat Dockerfile
...
# 模型下载地址
RUN mkdir -p models/table && cd models/table && wget ftp://192.168.199.31/SLANet_ch/20240222/SLANet_ch.zip
...

表格流程中的文本检测、文本识别我们使用了 PP-StructureV2 内建的模型。

模型训练

请参考：表格模型训练与评估

服务实现

表格识别服务的简化流程如下：

表格区域图片
    |
    | (图像方向预测 + 旋转)
    v
0度方向的图片 -----------------------+
    |                              |
    | (表格结构预测)                 | (文本检测)
    v                              v
表格Cell检测框集                 文本检测框集
    |                              |
    |                              | (图片裁剪 + 文本识别)
    |                              v
    |                         文本识别结果集
    |                              |
    |                              |
    +------------------------------+
                   |
                   | (根据Cell检测框和文本检测框坐标，聚合文本)
                   v
               表格识别结果

流程说明：