Spaces:

wai572
/

board-recognizer

Sleeping

App Files Files Community

wai572 commited on Jun 26

Commit

0fc56b2

1 Parent(s): 1eaacfa

paddleOCR

Browse files

Files changed (3) hide show

Dockerfile +2 -1
main.py +7 -13
requirements.txt +0 -0

Dockerfile CHANGED Viewed

@@ -1,10 +1,11 @@
 FROM python:3.12.1
 ENV HF_HOME /tmp
 WORKDIR /code
-RUN apt-get update && apt-get install -y libgl1-mesa-glx libboost-thread1.74.0 && rm -rf /var/lib/apt/lists/*

 FROM python:3.12.1
+ENV HOME /tmp
 ENV HF_HOME /tmp
 WORKDIR /code
+RUN apt-get update && apt-get install -y libgl1-mesa-glx libboost-thread1.74.0 libxext6 fonts-freefont-ttf && rm -rf /var/lib/apt/lists/*

main.py CHANGED Viewed

@@ -6,11 +6,11 @@ from datetime import datetime
 from typing import List
 import cv2
-import easyocr
 import numpy as np
 from fastapi import FastAPI, HTTPException, Request, UploadFile
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import JSONResponse
 from PIL import Image
 import dds
@@ -63,18 +63,10 @@ def load_ocr_model():
     グローバル変数readerに格納する。
     """
     global reader
-    model_dir = "/tmp/easyocr_models"
-    network_dir = "/tmp/easyocr_models/network"
     # 使用する言語と、モデルの保存先ディレクトリを指定してReaderを初期化
-    reader = easyocr.Reader(
-        ["en"],
-        model_storage_directory=model_dir,
-        user_network_directory=network_dir,
-    )
-    print(
-        f"EasyOCR model loaded successfully. Models are stored in {model_dir}"
-    )
 # @app.on_event("startup")
@@ -218,7 +210,7 @@ async def analyze_image(image_paths: list[UploadFile]):
                 text_mask = get_not_white_mask(img)
                 masked_img = cv2.bitwise_and(img, img, mask=text_mask)
                 # result = reader.readtext(candidate["img"])
-                result = reader.readtext(masked_img, text_threshold=0.3)
                 print(result)
                 if len(result) > 0:
                     ocr_results.append(result)
@@ -240,7 +232,9 @@ async def analyze_image(image_paths: list[UploadFile]):
         # reds = []
         for i, result in enumerate(ocr_results):
             # text = result[0]["generated_text"].upper().strip()
-            _, text, _ = result[0]
             print(text, is_text_valid(text))
             text = is_text_valid(text)

 from typing import List
 import cv2
 import numpy as np
 from fastapi import FastAPI, HTTPException, Request, UploadFile
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import JSONResponse
+from paddleocr import PaddleOCR
 from PIL import Image
 import dds
     グローバル変数readerに格納する。
     """
     global reader
     # 使用する言語と、モデルの保存先ディレクトリを指定してReaderを初期化
+    reader = PaddleOCR(lang="en")
+    print(f"PaddleOCR model loaded successfully.")
 # @app.on_event("startup")
                 text_mask = get_not_white_mask(img)
                 masked_img = cv2.bitwise_and(img, img, mask=text_mask)
                 # result = reader.readtext(candidate["img"])
+                result = reader.ocr(masked_img)
                 print(result)
                 if len(result) > 0:
                     ocr_results.append(result)
         # reds = []
         for i, result in enumerate(ocr_results):
             # text = result[0]["generated_text"].upper().strip()
+            text = result[0].get("rec_texts", [])
+            if text:
+                text = text[0]
             print(text, is_text_valid(text))
             text = is_text_valid(text)

requirements.txt CHANGED Viewed

Binary files a/requirements.txt and b/requirements.txt differ