Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK, 2014
Preview:
Citation preview
- Folie 1
- Zeichenerkennung ALGORITHMISCHE GEOMETRIE LEONID ZAVODNIK,
2014
- Folie 2
- Gliederung Was ist die Zeichenerkennung Anwendungen
Schwierigkeiten Techniken der Erkennung Alternativen LEONID
ZAVODNIK, 2014
- Folie 3
- Was ist Zeichenerkennung LEONID ZAVODNIK, 2014
- Folie 4
- Was ist Zeichenerkennung Klassifizierung des Eingangssymbols
gem einer vorbestimmten Klasse LEONID ZAVODNIK, 2014
- Folie 5
- Anwendungen Digitalisierung von Bchern und Dokumenten
Automatische berprfung von Klausuren Erkennung von Autokennzeichen
Verkehrszeichenerkennung Chipkartenverarbeitungssystemen Adressen
und Postleitzahl Erkennung LEONID ZAVODNIK, 2014
- Folie 6
- Schwierigkeiten hnliche Symbolen knnen in Gre, Form und Stil
variieren Verschiedene Verzerrungen Keine klaren und strengen
Zeichenbildungsregeln LEONID ZAVODNIK, 2014
- Folie 7
- Techniken LEONID ZAVODNIK, 2014 Online Direction Based, k-NN
Classifier Offline ClusteringK-means, Hierarchical, SOM, EM Feature
ExtractionProjection, Zoning, Border Transition, Graph Matching
Pattern MatchingDirectional Artificial Neural NetworkBPNN, RBFNN,
Parallel BPNN
- Folie 8
- Online-Methoden LEONID ZAVODNIK, 2014
- Folie 9
- Direction Based Algorithm Zeichen durch einen regulren Ausdruck
modellieren Bewegungsrichtungen beschreiben 3 LEONID ZAVODNIK,
2014
- Folie 10
- Direction Based Algorithm LEONID ZAVODNIK, 2014
- Folie 11
- K-NN Classifier and DTW-Based Dissimilarity Measure
Unhnlichkeit bewerten Alle Striche vergleichen Abstaende messen
nchste-Nachbarn Regel benutzen Beste Probe auswhlen LEONID
ZAVODNIK, 2014
- Folie 12
- Offline-Erkennung LEONID ZAVODNIK, 2014
- Folie 13
- Clustering Trennung der Daten in Gruppen Homogenitt innerhalb
der Cluster Daten sind sehr hnlich in demselben Cluster
Heterogenitt zwischen den Cluster Daten von unterschiedlichen
Clustern haben maximale Unterschiede LEONID ZAVODNIK, 2014
- Folie 14
- K-Means-Algorithm Am hufigsten verwendeten Techniken zur
Gruppierung von Objekten Optimiert die quadratischen Abweichungen
von einem Mittelwert Nur mit numerischen Attributen verwendet
werden LEONID ZAVODNIK, 2014
- Folie 15
- K-Means-Algorithm Clusterzentren werden zufllig gewhlt LEONID
ZAVODNIK, 2014
- Folie 16
- K-Means-Algorithm Alle andere Punkte werden jeweils dem Cluster
mit dem nchsten Clusterzentrum zugeordnet LEONID ZAVODNIK,
2014
- Folie 17
- K-Means-Algorithm Die Zentren der Cluster werden neu berechnet
LEONID ZAVODNIK, 2014
- Folie 18
- K-Means-Algorithm Wiederholen alle Schritte LEONID ZAVODNIK,
2014
- Folie 19
- K-Means-Algorithm LEONID ZAVODNIK, 2014
- Folie 20
- Hierarchische Algorithmen Divisiven Agglomerativen LEONID
ZAVODNIK, 2014
- Folie 21
- Hierarchische Algorithmen Vorteile Flexibilitt durch Verwendung
komplexer Distanzmae Keine eigenen Parameter Ergebnis als Cluster-
Hierarchie LEONID ZAVODNIK, 2014
- Folie 22
- Hierarchische Algorithmen Eingabe Ergebnis LEONID ZAVODNIK,
2014
- Folie 23
- Self Organizing Map (SOM) Algorithm Flexibel, stark und
parallelisierbar Bilderkennung, Signalverarbeitung, Visualisierung
Struktur 2 Schichten: Input und Mapping, vollstndig verbunden Jeder
Mapping knoten initialisiert mit zuflligen Zahlen Lernen Der
Unterschied zwischen Input-knoten und Mapping-knoten wird in einem
Adaptionsschritt verringert Alle benachbarten Knoten proportional
adaptiert LEONID ZAVODNIK, 2014
- Folie 24
- Self Organizing Map (SOM) Algorithm Ergebnis: rumliche
Anordnung der Eingangsdaten, bei den hnlichen Regionen gruppiert
LEONID ZAVODNIK, 2014
- Folie 25
- Expectation Maximization Algorithm 2 Schritte
Expectation-Schritt die Punkte werden besser zugeordnet
Maximization-Schritt das Modell wird so verndert, dass es besser zu
den Daten passt LEONID ZAVODNIK, 2014
- Folie 26
- Expectation Maximization Algorithm LEONID ZAVODNIK, 2014
- Folie 27
- Feature Extraction Extraktion der wichtige Merkmale
Seitenverhltnis Prozentuale Anzahl der Pixel Anzahl der Striche
Durchschnittliche Entfernung von der Mitte Symmetrie bezglich der
Koordinatenachsen Mehr Kontrolle ber die Merkmale Entwicklungzeit
wchst LEONID ZAVODNIK, 2014
- Folie 28
- Projection Method Schwarzen Pixel auf Achsen projizieren
Feature: die Anzahl der Pixel g LEONID ZAVODNIK, 2014
- Folie 29
- Zoning Symbol in kleine Fragmente teilen Feature: Anzahl
(Durschnitt) der Pixel in jedem Fragment LEONID ZAVODNIK, 2014
g
- Folie 30
- Border Transition Technique (BTT) Symbol in vier Quadranten
teilen Feature: Anzahl der zero to one transitions in jedem
Quadrant LEONID ZAVODNIK, 2014
- Folie 31
- Graph Matching Method End point verbindet nur ein Pixel Curve
point verbindet zwei Pixel Branch point verbindet drei oder mehr
Pixel LEONID ZAVODNIK, 2014 3
- Folie 32
- Pattern Matching Zeichen durch die Analyse von Form und der
Vergleich der Merkmale identifiziert Photometric pattern matching
Arbeitet mit Bild als eine Matrix von Intensittswerten oder
Funktionen Geometric pattern matching Arbeitet mit der Geometrie
des Objekts LEONID ZAVODNIK, 2014
- Folie 33
- Pattern Matching Hohe Bearbeitungsgeschwindigkeit Unwirksam,
wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unntige
Verbindungen oder zerrissene Striche gibt Vorgehensweise Symbol auf
eine normierte Gre bringen In Blcke gruppiert (z.B. 8x8), um die
Anzahl der Merkmale zu reduzieren Die Kanten mit Lowpassfiltering
und Downsampling gltten Die Merkmale vergleichen LEONID ZAVODNIK,
2014
- Folie 34
- Patternerkennung A 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1
1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0
0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0
0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0
0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0
0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 LEONID ZAVODNIK,
2014
- Folie 35
- Patternerkennung Mitte der Matrix finden Radius berechnen Durch
die Anzahl der Spuren teilen Sektoren bestimmen Trek-Sector Matrix
generieren Anzahl von 1 auf jedem Schnittpunkt des Sektors und der
Spur zhlen Die resultierende Matrix mit Vorlagen aus der Datenbank
vergleichen LEONID ZAVODNIK, 2014 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0
0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1
0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1
0 1 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0
0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0
0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1
- Folie 36
- Artificial Neural Network Lernfhig, flexibel Niedrige
Reaktionszeit Hohe Geschwindigkeit Fr Echtzeitsysteme gut geeignet
Verbindungen mit Gewichte Zusammenhnge zwischen Eingngen und
Ausgngen Korrekte Ergebnis bei unvollstndigen (verzerrten) Daten
LEONID ZAVODNIK, 2014
- Folie 37
- Alternative OCR Ungenauigkeit >30% reCAPTCHA fr
Digitalisierung der Bcher 1 000 000 Wrter pro Tag 2 500 000 Bcher
pro Jahr 2009 - Google gekauft Fr Googlemaps benutzt
http://www.ted.com/talks/luis_von_ahn_ma
ssive_scale_online_collaboration LEONID ZAVODNIK, 2014
- Folie 38
- Quellen Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M.
Sapkal: Survey of Methods for Character Recognition, S. 180-189,
ISSN: 2277-3754 http://ijeit.com/vol 1/Issue
5/IJEIT1412201205_36.pdf (17.06.2014)http://ijeit.com/vol 1/Issue
5/IJEIT1412201205_36.pdf Faisal Mohammad, Jyoti Anarase, Milan
Shingote, Pratik Ghanwat: Optical Character Recognition
Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646
http://www.ijcsit.com/docs/Volume
5/vol5issue02/ijcsit20140502254.pdf
(17.06.2014)http://www.ijcsit.com/docs/Volume
5/vol5issue02/ijcsit20140502254.pdf
http://de.wikipedia.org/wiki/K-Means-Algorithmus
(17.06.2014)http://de.wikipedia.org/wiki/K-Means-Algorithmus
http://de.wikipedia.org/wiki/EM-Algorithmus
(17.06.2014)http://de.wikipedia.org/wiki/EM-Algorithmus
http://de.wikipedia.org/wiki/Selbstorganisierende_Karte
(17.06.2014)http://de.wikipedia.org/wiki/Selbstorganisierende_Karte
LEONID ZAVODNIK, 2014