Hallo atzensepp,
danke für Deine detaillierten Tipps. Die Installation von pytesseract hat damit geklappt. Für meinen Anwendungsfall bin ich allerdings ein wenig enttäuscht. Ich habe es mit folgendem Code versucht, roi ist bereits der genau um die Ziffer ausgeschnittene, rechteckige Bereich, der auf Schwarz-Weiß geschwellt wurde:
--psm 10 ist der page segmentation mode 10, bei dem eine einzelne Ziffer angenommen wird.
Damit werden die einzelnen Zahlen nur ca. jedes 2. bis 3. mal überhaupt erkannt (bei stehendem FTS) und es gibt auch Fehlerkennungen der '1' als '4'. Das ist mir so zu unzuverlässig und deutlich schlechter, als meine Methode.
Mache ich da noch was falsch? Klappt es mit Grauwerten besser? oder mit Blur?
Danke und Gruß, uffi
danke für Deine detaillierten Tipps. Die Installation von pytesseract hat damit geklappt. Für meinen Anwendungsfall bin ich allerdings ein wenig enttäuscht. Ich habe es mit folgendem Code versucht, roi ist bereits der genau um die Ziffer ausgeschnittene, rechteckige Bereich, der auf Schwarz-Weiß geschwellt wurde:
CODE:
custom_config = r'--oem 3 --psm 10 -c tessedit_char_whitelist=1234' # Apply OCR to extract the numbers from the image number = pytesseract.image_to_string(roi, config=custom_config) # Print the extracted number print('pt OCR', number)
Damit werden die einzelnen Zahlen nur ca. jedes 2. bis 3. mal überhaupt erkannt (bei stehendem FTS) und es gibt auch Fehlerkennungen der '1' als '4'. Das ist mir so zu unzuverlässig und deutlich schlechter, als meine Methode.
Mache ich da noch was falsch? Klappt es mit Grauwerten besser? oder mit Blur?
Danke und Gruß, uffi
Statistik: Verfasst von uffi — 21 Jan 2024, 16:11