TY - THES U1 - Abschlussarbeit (Master) A1 - Höser, Hannes T1 - Zeichenerkennung auf gekrümmten Oberflächen mittels industrieller Kameras – Analyse und Vergleich von Verfahren zur Korrektur von Text auf gekrümmten Oberflächen N2 - Ziel dieser Masterarbeit ist die Entwicklung und Evaluation eines Verfahrens zur Verbesserung der Zeichenerkennung des IDC-Multicode-Readers der Baumer Optronic GmbH bei Texten auf gekrümmten oder verformten Oberflächen. Während die bestehenden OCR-Tools des IDCs auf planaren Oberflächen bereits zuverlässige Ergebnisse liefern, nimmt die Erkennungsleistung bei verzerrten Texten deutlich ab. Um den Funktionsumfang des Systems zu erweitern, ohne das bestehende OCR-System grundlegend zu verändern, wurde ein zusätzlicher KI-basierter Vorverarbeitungsschritt zur Textkorrektur integriert. Als Grundlage diente ein neuronales Netz nach Xie et al. [2022], das aufgrund seines günstigen Laufzeitverhaltens als Ausgangsarchitektur gewählt wurde. Um von einem dedizierten Hardwarebeschleuniger (NPU) zu profitieren, wurde das Modell gezielt angepasst. Hierzu waren architektonische Modifikationen sowie eine Quantisierung mittels Quantization-Aware-Training erforderlich. Die Quantisierung bildete die Modellparameter vom Datentyp float32 auf int8 ab, da die eingesetzte NPU ausschließlich Integer-Operationen unterstützt. Der dabei auftretende Genauigkeitsverlust durch die Quantisierung fiel gering aus. Die Laufzeitanalyse zeigte jedoch, dass mit dem optimierten Modell lediglich eine maximale Verarbeitungsrate von 2,41 Bildern pro Sekunde erreicht wurde. Das Ziel von 30 FPS wurde somit verfehlt. Dennoch belegen die Ergebnisse eine signifikante Verbesserung der Texterkennungsleistung der IDC-OCR-Tools bei gering bis mittel stark gekrümmten Texten. Das entwickelte Verfahren stellt somit eine praxistaugliche Erweiterung für den IDC dar und bietet zugleich Ansatzpunkte für zukünftige Optimierungen. AB - Ziel dieser Masterarbeit ist die Entwicklung und Evaluation eines Verfahrens zur Verbesserung der Zeichenerkennung des IDC-Multicode-Readers der Baumer Optronic GmbH bei Texten auf gekrümmten oder verformten Oberflächen. Während die bestehenden OCR-Tools des IDCs auf planaren Oberflächen bereits zuverlässige Ergebnisse liefern, nimmt die Erkennungsleistung bei verzerrten Texten deutlich ab. Um den Funktionsumfang des Systems zu erweitern, ohne das bestehende OCR-System grundlegend zu verändern, wurde ein zusätzlicher KI-basierter Vorverarbeitungsschritt zur Textkorrektur integriert. Als Grundlage diente ein neuronales Netz nach Xie et al. [2022], das aufgrund seines günstigen Laufzeitverhaltens als Ausgangsarchitektur gewählt wurde. Um von einem dedizierten Hardwarebeschleuniger (NPU) zu profitieren, wurde das Modell gezielt angepasst. Hierzu waren architektonische Modifikationen sowie eine Quantisierung mittels Quantization-Aware-Training erforderlich. Die Quantisierung bildete die Modellparameter vom Datentyp float32 auf int8 ab, da die eingesetzte NPU ausschließlich Integer-Operationen unterstützt. Der dabei auftretende Genauigkeitsverlust durch die Quantisierung fiel gering aus. Die Laufzeitanalyse zeigte jedoch, dass mit dem optimierten Modell lediglich eine maximale Verarbeitungsrate von 2,41 Bildern pro Sekunde erreicht wurde. Das Ziel von 30 FPS wurde somit verfehlt. Dennoch belegen die Ergebnisse eine signifikante Verbesserung der Texterkennungsleistung der IDC-OCR-Tools bei gering bis mittel stark gekrümmten Texten. Das entwickelte Verfahren stellt somit eine praxistaugliche Erweiterung für den IDC dar und bietet zugleich Ansatzpunkte für zukünftige Optimierungen. Y1 - 2026 N1 - Volltext gesperrt SP - 101 ER -