Die virtuellen Kicker (links) wurden aus einer 3-D-Karte (rechts) generiert, die auf einem Stereobildpaar beruht.

Foto: TU Wien
Auf dem Fußballplatz ist die Stimmung Weltklasse. Aber auch ein Match auf der Couch hat seinen Reiz, wenn der Ball fast aus dem Fernseher fliegt und einem der Schiedsrichter die rote Karte vor die Nase hält. Für solche dreidimensionalen Eindrücke im Film musste man bisher stets ulkige Brillen aufsetzen, um das Gehirn zu überlisten.

Unser Denkorgan verarbeitet dafür ständig beide – durch den Abstand zwischen den Augen leicht versetzten – Bilder, die getrennt, aber gleichzeitig ankommen. 3-D-Brillen sorgen dafür, „dass jedes Auge nur das entsprechende rechte oder linke stereoskopische Teilbild wahrnimmt“, erklärt Projektleiterin Margrit Gelautz vom Arbeitsbereich für Interaktive und Multimediale Systeme (IMS) der Technischen Universität Wien.

Vor autostereoskopischen Bildschirmen haben Brillen ausgedient. Dafür kommen in der Arbeitsgruppe für Stereobildverarbeitung entwickelte und mehrfach ausgezeichnete Algorithmen ins Spiel. Diese berechnen aus zwei Videobildern, aufgenommen aus verschiedenen Winkeln, ein 3-D- Modell. Denn die neuen TV-Geräte müssen, um 3-D zu leisten, neben optischem Material auch mit Tiefeninformationen gefüttert werden.

In der Tiefenkarte einer Fußballszene sind die Abstände zwischen identischen Punkten aus zwei stereo aufgenommenen Bildern verarbeitet, anschließend mit Grautönen codiert und somit wieder sichtbar gemacht: „Der Fußball wird immer heller, je weiter er nach vorn rollt, ebenso wie die Spieler, die ihm nachrennen. Weiter entfernte Spieler sind dunkler dargestellt“, erklärt Forscher Michael Bleyer. „Mit automatisch erzeugten Tiefenkarten können Szenen dreidimensional rekonstruiert werden. Angereichert mit den Bildinfos, erlaubt das dem Betrachter etwa vertikale und horizontale Schwenks, die so nie gefilmt wurden“, ergänzt Gelautz.

Kommerzielle Möglichkeiten

Das „Anreichern“ von Filmen, wie es die an der TU-Graz und der Stanford-Universität ausgebildete Telematikerin ausdrückt, eröffne kommerzielle Möglichkeiten. Sie denkt dabei an Hollywood oder die Werbeindustrie, die automatisch Figuren von Godzilla bis zur Colaflasche in das mit zwei Kameras aufgenommene Material einspeisen will. Das geht mit fertigen 3-D-Tiefenkarten schneller, einfacher und kostengünstiger und soll geschulten Zusehern nicht sofort als montiert auffallen. Verhandlungen mit der Unterhaltungsindustrie über eine Softwarekomponente des IMS sind im Laufen.

Weitere Anwendungen tun sich in der Navigation von Robotern mit Kameraaugen auf. Leider hat Sportsfreundin Margrit Gelautz keinen Zugang zu Stereovideos der EURO 2008, „dafür hätten wir wohl schon verhandeln müssen, als wir uns noch mit den wissenschaftlichen Schwierigkeiten beschäftigt haben“, sagt sie. Für die Rekonstruktion eines Spiels bräuchte man außerdem mehrere Kameras.

Die mathematischen Herausforderungen der Stereoverarbeitung sind aber ähnlich jenen bei zwei Kameras. „In unserem FWF-Projekt wollen wir die Algorithmen möglichst effizient machen, also Rechenzeit nicht in Bildteile stecken, die für die Qualität nicht relevant sind“, so die Forscherin.

Besonders schwierig zu rekonstruieren sind Objektgrenzen, etwa die Silhouette von Personen. Einfärbige, unstrukturierte Regionen – wie wolkenloser Himmel – sind schwer zu erfassen, weil es keine markanten Punkte gibt, an welchen die Tiefenkarte anknüpfen kann. Kein Fußball ist spiegelglatt, und die TU-Forscher können ihn anhand seiner Bewegung verfolgen.

Am schwierigsten bleibt es für das Team qualitativ hochwertige Stereoaufnahmen für Tests zu beschaffen. Die Mitarbeiter werden also über den Sommer wieder „Feldarbeit“ leisten und Sportamateure selbst drehen. Neben Fußball werden dabei auch andere Sportarten, wie Breakdance oder Volleyball, Gelautz’ liebste Disziplin, vor die Kameras kommen. (Astrid Kuffner/DER STANDARD, Printausgabe, 4.6.2008)