|
@@ -25,28 +25,7 @@
|
|
|
|
|
|
## 下载数据集
|
|
|
|
|
|
-数据集地址:[table-dataset](http://jupyterlab.sxkj.com/nbs/lab/tree/projects/yili-ocr/final/table-dataset)。文件结构如下:
|
|
|
-
|
|
|
-```text
|
|
|
-table-dataset/
|
|
|
-├── artificial # 人工合成的表格
|
|
|
-│ ├── all # 全部图片
|
|
|
-│ ├── all.txt
|
|
|
-│ ├── test.txt
|
|
|
-│ └── train.txt
|
|
|
-├── conv.v16i # 常规版面中的表格,切图自 https://app.roboflow.com/yili-gxczm/yili_layout/16
|
|
|
-│ ├── all # 全部图片
|
|
|
-│ ├── all.txt
|
|
|
-│ ├── test.txt
|
|
|
-│ └── train.txt
|
|
|
-└── unconv.v7i # 非常规版面中的表格,切图自 https://app.roboflow.com/yili-gxczm/yili_layout_non_rec_for_seg/7
|
|
|
- ├── all # 全部图片
|
|
|
- ├── all.txt
|
|
|
- ├── test.txt
|
|
|
- └── train.txt
|
|
|
-```
|
|
|
-
|
|
|
-上面的目录结构里,`all` 图片文件夹的标注存储在 `all.txt` 中。从 `all.txt` 中分割出的训练标签存储在 `train.txt`,测试标签存储在 `test.txt` 中。
|
|
|
+[伊利冷饮版面-表格结构数据集](https://huggingface.co/datasets/BethanThornton/table-dataset)
|
|
|
|
|
|
## 调整数据
|
|
|
|