jingze_cheng e32ef91d9a docs: 更新README | hai 7 meses | |
---|---|---|
cores | hai 8 meses | |
deploy | hai 10 meses | |
images | %!s(int64=2) %!d(string=hai) anos | |
models | hai 1 ano | |
sx_utils | hai 9 meses | |
testing | hai 1 ano | |
.gitignore | %!s(int64=2) %!d(string=hai) anos | |
Dockerfile | hai 8 meses | |
Makefile | hai 1 ano | |
README.md | hai 7 meses | |
cpu.Dockerfile | %!s(int64=2) %!d(string=hai) anos | |
docker-compose.yml | hai 8 meses | |
environment.yml | hai 1 ano | |
kubeconfig-sxkj | hai 1 ano | |
kubeconfig-sxkjprod | hai 1 ano | |
run.py | %!s(int64=2) %!d(string=hai) anos | |
server.py | hai 8 meses |
基于 PaddleOCR PP-StructureV2, 用于识别表格。
conda env create -f environment.yml
python run.py --port 8080
python -m unittest discover testing '*_test.py' -v
make all
模型类别 | 模型名称 | 模型配置 |
---|---|---|
表格结构检测 | ch_ppstructure_mobile_v2.0_SLANet | ./server.py |
如果更新了模型权重,请同时修改创建镜像时的下载地址:
$ cat Dockerfile
...
# 模型下载地址
RUN mkdir -p models/table && cd models/table && wget ftp://192.168.199.31/SLANet_ch/20240222/SLANet_ch.zip
...
表格流程中的文本检测、文本识别我们使用了 PP-StructureV2 内建的模型。
请参考:表格模型训练与评估
表格识别服务的简化流程如下:
表格区域图片
|
| (图像方向预测 + 旋转)
v
0度方向的图片 -----------------------+
| |
| (表格结构预测) | (文本检测)
v v
表格Cell检测框集 文本检测框集
| |
| | (图片裁剪 + 文本识别)
| v
| 文本识别结果集
| |
| |
+------------------------------+
|
| (根据Cell检测框和文本检测框坐标,聚合文本)
v
表格识别结果
流程说明:
源码:PaddleOCR/ppstructure/table/predict_table.py#L108
源码:PaddleOCR/ppstructure/table/predict_table.py#L112
源码:PaddleOCR/ppstructure/table/predict_table.py#L100
参考: