Montag, 19. November 2007

Definition Bilderkennung, Mustererkennung, Bildverarbeitung und Bildbearbeitung

Bilderkennung ist ein Teilgebiet der Mustererkennung und der Bildverarbeitung. In der Bilderkennung versucht man, Objekte in einem Bild zu gliedern. Diesen Objekten werden symbolische Beschreibungen zugewiesen. Nach Zusammenhängen zwischen den Objekten wird nicht gesucht, wie es in der Musteranalyse üblich ist.

Unter dem Begriff Mustererkennung werden alle Verfahren zusammengefasst, die geeignet sind, Muster in Bildern nach bestimmten Kriterien voneinander zu trennen. Mustererkennung ist ein Verfahren der Bildverarbeitung, mit dessen Hilfe in Satellitenbildern oder digitalen Luftbildern Strukturen oder Objekte(Straßen, Häuser etc.) erkannt werden.

Mustererkennung wird in der

  • Spracherkennung
  • Bild-/Objekterkennung
  • Robotik (u.a. in der Industrie)
  • Biometrie (z.B. Sprech- Fingerabdruck- oder Iriserkennung)
  • Schrifterkennung
  • Etc.

eingesetzt.

Bei der Mustererkennung gibt es keine allgemeine Vorgehensweise, sondern es funktioniert je nach Anwendungsgebiet.

Es gibt 2 Phasen, die Arbeitsphase und die Lernphase.

Die Arbeitsphase beschäftigt sich mit dem eigentlichen Mustererkennungsvorgang und ist in 5 Phasen eingeteilt.
  1. Aufnahme
    1. von Signalen, zum Beispiel durch Kamera oder Mikrofon
    2. Diskretisierung
    3. Quantisierung
  2. Vorverarbeitung
    1. Beseitigung von Störungen
    2. Skalierung / Normierung
    3. Sinnvolle Aufteilung der Eingangsdaten, zum Beispiel Segmentierung
  3. Merkmalsextraktion
    1. Herausfiltern von Daten /Merkmalen
    2. Transformation in eine kompakte Form
    3. Ergebnis ist ein Merkmalsvektor in einem Merkmalsraum
  4. Merkmalsreduktion
    1. Weglassen unwichtiger Merkmale
    2. Untersuchung der Trennbarkeit von Merkmalen
    3. Ergebnis ist ein Merkmalsvektor mit niedriger Dimension
  5. Klassifikation
    1. Objekt wird einer Klasse zugeordnet
    2. Entscheidung durch Vergleich der Merkmale
    3. Welcher Klasse gehört das Objekt höchstwahrscheinlich an
    4. Realisierung häufig durch neuronale Netze

Die Lernphase liegt der Arbeitsphase zugrunde. Man gibt hier Testdaten ein, lernt von Klassifikationsvorschriften bzw. trainiert das neuronale Netz und unterscheidet dabei zwischen überwachtes und unüberwachtes Lernen.

Bei der Bilderkennung haben wir ein Bild als Ausgangspunkt. Man muss wichtige Merkmale finden und sie extrahieren und dies mit der Datenbank abgleichen.
Probleme treten auf Änderungen am Objekt vorgenommen werden, Vorwissen fehlt oder sich die Bedingungen ständig wechseln.

Die digitale Bildverarbeitung nutzt die Mittel der Signalverarbeitung zur Aufbereitung und Speicherung von visuellen Informationen.
Die Bildbearbeitung beschäftigt sich mit der Manipulation von Bildern zur anschließenden Darstellung. Die Bildverarbeitung dient als eine Zwischenstufe zu einer weitergehenden maschinellen Bearbeitung (Bildsegmentierung, Bilderkennung, Bildverstehen und Mustererkennung). Bildverarbeitung wird oft im Maschinenbau und der Medizintechnik eingesetzt. Mit Methoden der Bildverarbeitung werden in Maschinen Objekte vermessen, Objekte kontrolliert oder codierte Informationen gelesen. Röntgen- und Ultraschallgeräte liefern mit der Bildverarbeitung Bilder, die der Arzt einfacher darstellen kann. Röntgengeräte in Sicherheitszonen untersuchen Gepäck und Kleidung automatisch nach gefährlichen Objekten wie zum Beispiel Waffen.



Dienstag, 6. November 2007

Einführung Pong Spiel im Rahmen der Vorlesung Bilderkennung



Im Rahmen der Vorlesung „Bilderkennung“ wollen wir den im Jahre 1972 von Atari erschienenen „Pong“- Spiel, dass mit einem Hilfsmittel (Joysting, Paddle) gespielt wurde, so programmieren(weiter entwickeln), dass es auch ohne irgendwelche Techniken wie Fernbedienungen oder Bewegungs- und Infrarotsensoren gespielt werden kann.


Das Spielprinzip von „Pong“ ist einfach und entspricht dem des Tischtennisses.
Der Ball erscheint auf dem Bildschirm als ein Punkt und wird hin und her bewegt. Der Spieler soll den Schläger, der als ein senkrechter Strich dargestellt wird, mit der Hand auf dem Bildschirm hin und her bewegen können. Lässt man den Ball am Schläger vorbei, bekommt der Gegner einen Punkt.


Die Hand soll durch eine Webcam, die mit einem Bildschirm verbunden ist, erkannt werden.

Dabei müssen viele Kriterien beachtet werden, wie zum Beispiel:

  • Wo befindet sich die Hand?

  • Wie schnell wird die Hand bewegt?

  • Wie viele Finger hat der Spieler?

  • Was muss alles im Hinblick auf den Hintergrund berücksichtigt bzw. eliminiert werden, damit nur die Handbewegung registriert wird?

  • In welche Richtung bewegt sich die Hand? (x, y –Koordinaten die sich verändern)

Als nächstes werde ich eine Recherche über vorhandene Bibliotheken, Algorithmen verwendete Programmiersprachen und Tools machen.