Browse Source

docs: 更新文档

jingze_cheng 7 months ago
parent
commit
ea11cdf180
1 changed files with 1 additions and 22 deletions
  1. 1 22
      docs/prepare_data.md

+ 1 - 22
docs/prepare_data.md

@@ -25,28 +25,7 @@
 
 ## 下载数据集
 
-数据集地址:[table-dataset](http://jupyterlab.sxkj.com/nbs/lab/tree/projects/yili-ocr/final/table-dataset)。文件结构如下:
-
-```text
-table-dataset/
-├── artificial      # 人工合成的表格
-│   ├── all         # 全部图片
-│   ├── all.txt
-│   ├── test.txt
-│   └── train.txt
-├── conv.v16i       # 常规版面中的表格,切图自 https://app.roboflow.com/yili-gxczm/yili_layout/16
-│   ├── all         # 全部图片
-│   ├── all.txt
-│   ├── test.txt
-│   └── train.txt
-└── unconv.v7i      # 非常规版面中的表格,切图自 https://app.roboflow.com/yili-gxczm/yili_layout_non_rec_for_seg/7
-    ├── all         # 全部图片
-    ├── all.txt
-    ├── test.txt
-    └── train.txt
-```
-
-上面的目录结构里,`all` 图片文件夹的标注存储在 `all.txt` 中。从 `all.txt` 中分割出的训练标签存储在 `train.txt`,测试标签存储在 `test.txt` 中。
+[伊利冷饮版面-表格结构数据集](https://huggingface.co/datasets/BethanThornton/table-dataset)
 
 ## 调整数据