|
@@ -8,20 +8,15 @@
|
|
|
|
|
|
## 准备环境
|
|
|
|
|
|
-克隆 PaddleOCR 仓库,进入仓库目录:
|
|
|
+克隆 PaddleOCR 仓库,进入仓库目录,安装依赖:
|
|
|
|
|
|
```bash
|
|
|
git clone --depth 1 https://github.com/PaddlePaddle/PaddleOCR.git
|
|
|
cd PaddleOCR
|
|
|
-```
|
|
|
-
|
|
|
-安装依赖:
|
|
|
-
|
|
|
-```bash
|
|
|
pip install -r requirements.txt
|
|
|
```
|
|
|
|
|
|
-PaddleOCR 训练数据的默认存储路径是 `PaddleOCR/train_data`。我们将数据集下载到本地后,可以拷贝数据集或创建软链接到对应目录:
|
|
|
+PaddleOCR 训练数据的默认存储目录是 `PaddleOCR/train_data`,我们将数据集下载到本地后,可以拷贝数据集或创建软链接到该目录:
|
|
|
|
|
|
```bash
|
|
|
cp -r /path/to/table-dataset ./train_data/table-dataset
|
|
@@ -29,7 +24,12 @@ cp -r /path/to/table-dataset ./train_data/table-dataset
|
|
|
ln -sf /path/to/table-dataset ./train_data/table-dataset
|
|
|
```
|
|
|
|
|
|
-请将我们的训练脚本 [table_model.sh](./scripts/table_model.sh) 拷贝至 `PaddleOCR/` 路径下。<br>
|
|
|
+请将我们的训练脚本 [table_model.sh](./scripts/table_model.sh) 拷贝至 `PaddleOCR` 仓库根目录:
|
|
|
+
|
|
|
+```bash
|
|
|
+cp /path/to/table_model.sh ./table_model.sh
|
|
|
+```
|
|
|
+
|
|
|
PaddleOCR 对训练过程做了模块化,如果要训练不同的模型,我们只需要在脚本开头更换配置文件。
|
|
|
|
|
|
## 表格结构预测模型训练与评估
|