|
@@ -1,8 +1,6 @@
|
|
import cv2
|
|
import cv2
|
|
import numpy as np
|
|
import numpy as np
|
|
|
|
|
|
-hard_colors = [[[35, 43, 46], [77, 220, 255]]]
|
|
|
|
-
|
|
|
|
class Table:
|
|
class Table:
|
|
def __init__(self, html, img=[]):
|
|
def __init__(self, html, img=[]):
|
|
"""
|
|
"""
|
|
@@ -72,7 +70,7 @@ class Table:
|
|
if cell == '':
|
|
if cell == '':
|
|
self.empty += 1
|
|
self.empty += 1
|
|
|
|
|
|
- def change_hard2white(self):
|
|
|
|
|
|
+ def change_hard2white(self, hard_color):
|
|
"""
|
|
"""
|
|
将图像中绿色区域修改为白色。
|
|
将图像中绿色区域修改为白色。
|
|
|
|
|
|
@@ -81,11 +79,10 @@ class Table:
|
|
"""
|
|
"""
|
|
color = [248, 248, 255]
|
|
color = [248, 248, 255]
|
|
hsv = cv2.cvtColor(self.img, cv2.COLOR_BGR2HSV)
|
|
hsv = cv2.cvtColor(self.img, cv2.COLOR_BGR2HSV)
|
|
- for hard_color in hard_colors:
|
|
|
|
- lower_green = np.array(hard_color[0])
|
|
|
|
- upper_green = np.array(hard_color[1])
|
|
|
|
- mask_green = cv2.inRange(hsv, lower_green, upper_green)
|
|
|
|
- self.img[mask_green != 0] = color
|
|
|
|
|
|
+ lower_green = np.array(hard_color[0])
|
|
|
|
+ upper_green = np.array(hard_color[1])
|
|
|
|
+ mask_green = cv2.inRange(hsv, lower_green, upper_green)
|
|
|
|
+ self.img[mask_green != 0] = color
|
|
|
|
|
|
def get_str(self):
|
|
def get_str(self):
|
|
"""
|
|
"""
|
|
@@ -100,7 +97,7 @@ class Table:
|
|
str += cell
|
|
str += cell
|
|
return str
|
|
return str
|
|
|
|
|
|
- def check_html(self):
|
|
|
|
|
|
+ def check_html(self, hard_color):
|
|
"""
|
|
"""
|
|
检查HTML表格的质量,如果识别效果不佳,则修改图像颜色。
|
|
检查HTML表格的质量,如果识别效果不佳,则修改图像颜色。
|
|
|
|
|
|
@@ -113,6 +110,6 @@ class Table:
|
|
# HTML字符串 html_str 中同时包含 '项目'、'每份' 和 '营养素参考值',并且在每一行的格子数中最大值小于3时。
|
|
# HTML字符串 html_str 中同时包含 '项目'、'每份' 和 '营养素参考值',并且在每一行的格子数中最大值小于3时。
|
|
if (self.empty > 4 and self.empty > self.total // 4) or ('项目' in html_str and '每份' in html_str and '营养素参考值' in html_str and np.max([len(a) for a in self.html_arr]) < 3):
|
|
if (self.empty > 4 and self.empty > self.total // 4) or ('项目' in html_str and '每份' in html_str and '营养素参考值' in html_str and np.max([len(a) for a in self.html_arr]) < 3):
|
|
print('识别效果不佳,改变图片颜色!')
|
|
print('识别效果不佳,改变图片颜色!')
|
|
- self.change_hard2white()
|
|
|
|
|
|
+ self.change_hard2white(hard_color)
|
|
return 1
|
|
return 1
|
|
return 0
|
|
return 0
|