Ist Java schneller als C (Realisierung von Sterevision)?

**zefram** · 31.07.2005, 21:19

Zitat von luma

Noch ne elementare Frage zur Sterevision: Wenn ich das richtig verstanden habe kann man aus einem "verschmolzenen" Bild (das mal aus zweien bestand) die Tiefen berechnen?

Ja. Die Tiefeninformation ergibt sich aus der sogenannten Disparity (Disparität). Gemeint ist damit der Unterschied in der horizonalen Koordinate (x-Achse) ein und des selben Weltpunktes in den beiden Bildern.
Beispiel: Eine Tischecke hat im linken Bild die Koordinaten (100,250) und im rechten Bild die Koordinaten (80,250). Die Disparität beträgt also 20 Pixel.
Sind Brennweiten der Kameras und der Abstand der Kameras voneinander bekannt, lässt sich daraus die Entfernung der Tischecke von den Kameras berechnen.
Es gilt die Formel Z=f*B/d. Dabei ist Z die Entfernung des Punktes, f die Brennweite der Kamera, B der Abstand der beiden Kameras voneinander und d die Disparität.

**Johannes** · 31.07.2005, 23:36

Moin!
Mich würde mal interessieren, wie ihr die Sache praktisch verwendet bzw. wofür ihr die Tiefeninformationen verwendet. Erstellt ihr daraus ein 3D Bild? Und: Wie sucht ihr die beiden selben Weltpunkte in den verschiedenen Kamerabildern? Ein Weltpunkt muss wahrscheinlich aus mehreren Pixeln bestehen...

Gruß
Johannes

**zefram** · 01.08.2005, 09:19

Zitat von Johannes

Moin!
Wie sucht ihr die beiden selben Weltpunkte in den verschiedenen Kamerabildern?

Zum Beispiel:

1. Finde markante Punkte in beiden Bildern. Hierfür nutzt man meist den Harris-Operator. Dieser wird (ähnlich wie ein Operator zur Kantenfindung) auf beide Bilder angewendet. Ergebnis sind zwei Mengen von Punkten (linkes Bild und rechtes Bild), die der Operator für "markant" hielt. Je nach Parametern und Bild können das mehrere hundert Punkte pro Bild sein.

2. Zuordnen der markanten Punkte zwischen linkem und rechten Bild. Jetzt muß man herausfinden, welche Punkte vom rechten Bild denen vom linken Bild entsprechen, d.h. welche ein Abbild vom selben Weltpunkt sind. Bedingt durch die Kamerageometrie gibt es hilfreiche Einschränkungen. Zum Beispiel wird sich im idealen Fall zwischen linkem und rechten Bild nur die x-Koordinate ändern, die y-Koordinate bleibt gleich (oder schwankt max. um +-1 Pixel).
Man muß also für einen gegebenen Punkt aus dem linken Bild nur die Punkte aus dem rechten betrachten, die etwa auf der selben Höhe liegen. Die endgültige Identifizierung des passenden Punktes geschieht meist mit einem auf Korrelation basierten Verfahren (Korrelation zwischen den 11x11 Nachbarschaften der in Frage kommenden Punkt-Paare).
Man wird nicht jedem Punkt einen Partner aus dem anderen Bild zuordnen können. Meist klappt das nur für etwa 50-75% der Punkte.

3. Ausrechnen der Entfernungen. Man hat jetzt also für viele der vom Harris Operator gefundenen markanten Punkte die Koordinaten im linken und rechten Bild. Damit kann mal wie im Posting oben beschrieben, die Entfernung ausrechnen.

4. Anwendung: Gelingt es, die markanten Punkte nicht nur zwischen dem linken und rechtem Bild zuzuordnen, sondern auch zwischen zwei Bildernpaaren zwischen denen sich die Kamera bewegt hat, kann man die Bewegung der Kamera errechnen. Man kennt ja die 3D-Koordinaten einiger Punkte vor und nach der Bewegung.

5. Weitere Anwendung: Erstellen einer 3D-Karte, Identifizieren von Objekten, ...

6. Das hier beschriebene Verfahren nennt sich "sparse stereo", da nur für einige Pixel die Tiefeninformationen zur Verfügung gestellt werden. Bei "dense stereo" Algorithmen sind für (im Idealfall) jeden Pixel die Tiefeninformationen verfügbar. Vielleicht kann Fisch-Ei ja was zu den dense stereo Algorithmen sagen.

Siehe auch http://www-user.tu-chemnitz.de/~niko...eit/node5.html

**luma** · 15.08.2005, 18:08

Hast wohl nichts mehr gefunden... Gibt's da nicht irgendwelche Bücher? Und dann noch ne Frage: Würden 2 GB-Cams ausreichen, Stereovision einfach zu realisieren?

**zefram** · 15.08.2005, 20:02

Nichts mehr gefunden? Sollte ich was suchen?

Was meinst du mit 2 GB Cams? Gigabyte? 2 Megapixel?
Also die Kamera die ich habe, hat eine Auflösung von 640x480. Mehr braucht man nicht, mehr kann man auch garnicht ausreichend schnell verarbeiten. 320x240 reicht auch.

Bücher gibts auch, aber meist englisch und teuer.
Zum Beispiel: http://www.amazon.de/exec/obidos/ASI...634357-8407753