| |
|
|
Weekly IMS Seminars
This page carries talk announcements for the weekly IMS seminars. —
Talks usually take place on Thursdays, 13:15 in the Seminar Room 188/2
(4th floor, HD0407, ext. 18869).
If you would like to give a talk or presentation, please send name of the speaker, title, abstract, and suggested date/time to
seminar@ims.tuwien.ac.at.
Q2/2012 Talks
| Date |
Time |
By |
Topic |
| Thu, Jun 14 |
13:15 |
Michael Leichtfried, Christoph Kaltenriner |
Autonomous Localization of An UAV Using a Mobile Device as on-Board Processing Unit
—
1. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann
—
The aim of our project is to plan and construct an unmanned areal
vehicle (UAV) for autonomous indoor flights. The so called quadrocopter
is equipped with an embedded computing auto pilot unit, responsible for
all flight operations. Therefore motion- and position sensors (IMU) are
evaluated and attitude is adjusted by a microcontroller unit in real time.
The UAV is equipped with an state of the art android mobile device, on
which computer vision based localization is processed and steering
commands are sent to the microcontroller unit. This approach allows data
processing to be done entirely on the UAV whithout the need of any
ground control station.
|
| Wed, Apr 25 |
11:00 |
Karyn Laudisi |
RED Scarlet
|
Q1/2012 Talks
| Date |
Time |
By |
Topic |
| Thu, Mar 29 |
13:15 |
Johannes Weber |
Suchmaschinenoptimierung
—
Bachelorarbeitspräsentation;
Betreuer: Horst Eidenberger
—
Search engine optimization (SEO) is an important topic of the 21st century due to the rapidly growing information available on the internet. Therefore it is important to know, how to programm your homepage in a way that it can be found by people who you want to find it. To be successfull in SEO there two important things. First you have to understand the principles how a search engine works. This means how it gets its information, the architecture and how it handles a search request. Secondly it is important to know how the search algorithms are working. It is said, that the most used search engine Google uses up to 200 factors to deliver you your search result. How the search algorithms are exactly working is a big secret, but there are some things which are known that they are very important to get your homepage at the very front in the search results.
|
| Thu, Mar 1 |
13:15 |
Elias Hiller |
Zeitlich konsistente Disparitätsbestimmung in einem globalen Stereo Matching Verfahren
—
1. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Florian Seitner
—
In dieser Arbeit wird ein bestehendes Stereo Matching Verfahren erweitert, um zeitlich konsistente Bestimmung von Disparitätskarten zu ermöglichen. Für dieses auf einzelnen Bildern basierende Verfahren sollen zwei unterschiedliche Ansätze untersucht werden, die mittels zeitlicher Kostenfunktion und Miteinbeziehung vorangegangener Bilder und Disparitätskarten versuchen, eine stärkere Einbindung von zeitlicher Information in den Stereo Matching Vorgang zu erzielen.
|
| Thu, Feb 23 |
13:15 |
Robert Sorschag |
Related Work
T.B.A.
|
| Thu, Feb 16 |
14:00 |
Vicky Nake |
Integration von automatischer Shoterkennung und Disparitätsabschätzung in ein Stereomatching-Framework
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Florian Seitner
—
Ziel dieser Arbeit war die vollständige Automatisierung einer Pipeline [Bleyer & Gelautz, 2009] zur Berechnung von Tiefenkarten aus Stereobildern. Zwei bisher manuell durchgeführte Schritte, die Erkennung von Shotgrenzen und das Ermitteln von minimalen/maximalen Disparitätswerten für jeden Shot, wurden hierfür automatisiert. Zuerst wurde eine Literatursuche durchgeführt und darauf aufbauend für die automatische Shoterkennung zwei Verfahren implementiert: Color Histogram Difference und Edge Change Ratio. Diese Verfahren wurden sowohl einzeln als auch in Kombination miteinander evaluiert. Basierend auf den ermittelten Shotgrenzen wurde dann die minimale und maximale Disparität eines jeden Bilderpaares – und in Folge auch jedes Shots – ermittelt. Dafür wurde eine automatische Disparitätsabschätzung implementiert, die auf Blockmatching zwischen den Bildern aufbaut. Aus Aufnahmen mit unterschiedlichen Stereo‐Setups wurden drei Testsequenzen erstellt, um die Ergebnisse der automatischen Shoterkennung und Disparitätsabschätzung mit manuell ermittelten Werten zu überprüfen.
|
| Thu, Feb 2 |
13:15 |
Peter Kan |
Physically-Based Depth of Field in Augmented Reality
—
Test talk (WARM & Eurographics)
—
We present a novel method for rendering and compositing video in augmented reality. We focus on calculating the physically correct result of the depth of field caused by a lens with finite sized aperture. In order to correctly simulate light transport, ray-tracing is used and in a single pass combined with differential rendering to compose the final augmented video. The image is fully rendered on GPUs, therefore an augmented video can be produced at interactive frame rates in high quality. In addition we evaluated the user experiences with our rendering system with the hypothesis that a depth of field effect in augmented reality increases the realistic look of composited video. Our results with 30 users show that 90% perceive videos with a depth of field considerably more realistic.
|
| Thu, Jan 26 |
12:00 |
Robert Sorschag |
Semi-local Features for the Classification of Segmented Objects
—
Test talk (ICPRAM)
—
Image features are usually extracted globally from whole images or locally from regions-of-interest. We
propose different approaches to extract semi-local features from segmented objects in the context of object
detection. The focus lies on the transformation of arbitrarily shaped object segments to image regions that
are suitable for the extraction of features like SIFT, Gabor wavelets, and MPEG-7 color features. In this
region transformation step, decisions arise about the used region boundary size and about modifications of
the object and its background. Amongst others, we compare uniformly colored, blurred and randomly
sampled backgrounds versus simple bounding boxes without object-background modifications. An
extensive evaluation on the Pascal VOC 2010 segmentation dataset indicates that semi-local features are
suitable for this task and that a significant difference exists between different feature extraction methods.
|
| Thu, Jan 26 |
12:00 |
Mathäus Zingerle |
Augmented Video: Implementing Precise Video Augmentations in Panorama-Based Augmented Reality Applications
—
1. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann
—
This work tries to find a way how to provide augmentations for a mobile device, such that the augmentations are made up of dynamic scenes. Additionally those scenes shall be captured with the video camera of a mobile device, such as a smartphone. The capturing device could be the same as the target device in terms of hard- and software specifications, but this shall not neccessarily be the case.
To break down the work in terms of subproblems it shall be arranged into the problem of Segmentation of the dynamic object in the dynamic video scene, the problem of Creating the panorama of the captured scene and keeping tracking information of the dynamic object and finally the
Mapping of the dynamic object into the target context.
|
| Thu, Jan 12 |
14:00 |
Irene Reichl |
Kinematic Analysis of the Human Knee Joint: Functional Determination of the Axis of Rotation
—
Guest talk by Dr. Irene Reichl (University of Vienna, Institute of Sports Science/Biomechanics)
—
Analysis of human movement relies on the identification of body segment parameters and joint axes or centres. However, measurement error and noise challenge the determination of joint rotation axes being crucial for the interpretation of joint kinematics in terms of displacements. A number of clinical applications such as ligament repair, joint replacement or prosthesis’ design may profit from an im- proved understanding of knee kinematics. Presently, concurring definitions of knee joint axes based on anatomic landmarks are in use. Regarding any of these definitions, there is a large variability between observers and different sessions or trials. In order to reduce observer dependence, several alterna- tive mathematical procedures based on movement analysis, so-called functional methods, have been developed. The present contribution compares the applicability and quantifies the accuracy of differ- ent concepts with respect to data obtained employing different measurement techniques. Namely, the size and type of data perturbation depends on the applied measurement technique.
—
This work was supported by the FWF (Austrian Science Fund), contract number T318-N14.
Irene Reichl studied Technical Physics at the Vienna University of Technology. Her diploma thesis was awarded with the ‘Award of the city of Vienna for excellent diploma theses’ at the Vienna University of Technology’. In the framework of the FWF Science College ‘Computational Materials Science’, she got her PhD in theoretical solid state physics.
In parallel she attended courses at the institute of sports science (University of Vienna) and passed the national instructor in swimming and track and field sports. 2006 she successfully applied for an FWF Hertha- Firnberg Projekt (T318-N14): ‘Motion analysis: accuracy of joint centre estimation’.
|
Q4/2011 Talks
| Date |
Time |
By |
Topic |
| Tue, Nov 13 |
11:00 |
Martina Uray |
Machine Vision - Powerful Tools for Medical Applications
—
Guest talk by Dr. Martina Uray (Joanneum Research, Graz)
—
The Institute of Information and Communication Technologies is internationally recognised as a centre of excellence in the fields of machine vision applications, remote sensing and geoinformation, space technologies and acoustics, audiovisual media, and intelligent information systems.
The main research areas of the Machine Vision Applications Group are the industrial inspection, ma- chine vision for mobility applications, and human-centred image analysis (biometrics and medical imaging).
In this talk, an overview of actual work covering several medical application topics (mobile derma- toscope, measurement of ligaments, classification of endoscopic images and wound simulations) will be presented. Finally the focus will be the development of the new product “ReDeform”. Despite the technical solution for the deformable registration between CT datasets up to the required accuracy, additional challenges like the compliance with ISO norms and a suitable presentation of the results have to be handled.
Dr. Martina URAY was awarded a M.Sc. in Technical Mathematics (branch Techno-Mathematics) in 2003 by the Graz University of Technology for her master thesis “A mathematical model for automatic punch-typing in immunhistochemistry (TMA-Analysis)”.
At the Institute for Computer Graphics and Vision (branch Informatics, also TU-Graz) she received a Ph.D. in 2008 for her dissertation “Incremental, Robust, and Efficient Linear Discriminant Analysis Learning”.
Her areas of interest are biometrics, medical imaging, object recognition and learning.
In September 2008 she joined the JOANNEUM RESEARCH where she became head of the field “hu- man-centered image processing”.
|
| Thu, Nov 24 |
14:00 |
Maia Zaharieva |
PhD Defense
Test talk
|
| Fri, Nov 18 |
11:30 |
Matthias Zeppelzauer |
PhD Defense
Test talk
|
| Thu, Nov 17 |
14:00 |
Dalibor Mitrovic |
PhD Defense
Test talk
|
| Thu, Nov 10 |
14:00 |
Asmaa Hosni |
Temporally Consistent Disparity and Optical Flow via Efficient Spatio-temporal Filtering
—
Conference Test Talk
—
This paper presents a new efficient algorithm for computing temporally consistent disparity maps from video footage. Our method is motivated by recent work [1] that achieves high quality stereo results by smoothing disparity costs with a fast edge-preserving filter. This previous approach was designed to work with single static image pairs and does not maintain temporal coherency of disparity maps when applied to video streams.
The main contribution of our work is to transfer this concept to the spatio-temporal domain in order to efficiently achieve temporally consistent
disparity maps, where disparity changes are aligned with spatiotemporal edges of the video sequence. We further show that our method can be used as spatio-temporal regularizer for optical flow estimation. Our approach can be implemented efficiently, achieving real-time results for stereo matching. Quantitative and qualitative results demonstrate that our approach (i) considerably improves over frame-by-frame methods for both stereo and optical flow; and (ii) outperforms the state-of-the- art for local space-time stereo approaches.
|
| Thu, Nov 10 |
14:00 |
Patrizia Eisele |
Visueller Vergleich von Interest-Point-Detektoren
—
2. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger
—
Für eine Vielzahl von Anwendungen im Bereich der Computer Vision, wie beispielsweise Objektverfolgung, Objekterkennung oder 3D-Rekonstruktion, ist es nötig, in einem ersten Schritt Features in Bildern zu identifizieren, welche die Durchführung eines Bildabgleichs ermöglichen. Lokale Features die Eckpunkt- oder blob-ähnlichen Strukturen in Bildern entsprechen, werden auch als Interest-Points bezeichnet. Verfahren zur Identifikation solcher lokalen Features heißen Interest-Point-Detektoren.
Methoden, die auf der Verwendung von Interest-Points basieren, haben sich als besonders geeignet zur Durchführung eines robusten Bildabgleichs erwiesen. Aus diesem Grund werden solche Methoden häufig in modernen Computer-Vision-Systemen eingesetzt.
Im Zuge dieser Präsentation wird ein grober Überblick über Interest-Point-Detektion im Allgemeinen und ausgewählte Detektoren im Speziellen gegeben. Im Rahmen der Diplomarbeit wurde eine Applikation für den visuellen Vergleich der Ergebnisse der gängigsten Interest-Point-Detektoren entwickelt. Diese wird kurz vorgestellt.
|
| Thu, Nov 10 |
14:00 |
Johannes Weissenböck |
Design eines interaktiven taktilen Shape Displays mittels Schrittmotoren und dem Bowdenzug-Konzept
—
2. Diplomarbeitspräsentation;
Betreuer: Michael Mehling, Hannes Kaufmann
—
Die vorliegende Diplomarbeit stellt das sogenannte reactive Shape Display vor, ein taktiles Display zum Darstellen bewegter und unbewegter zweieinhalb- dimensionaler Formen, mit dem der Benutzer interagieren kann. Die Benutzerinteraktion findet durch Drücken der Displaystifte statt. Hierzu wird ein Konzept vorgestellt und implementiert, das den Antrieb vom tactilen Element mechanisch entkoppelt, um eine flexible Bauweise in Bezug auf die Displayauflösung zu ermöglichen. Der Entwurf und die Implementierung zielen generell auf eine technisch einfache und wirtschaftlich kostengünstige Lösung ab. Es wird eine Einführung in die Begrifflichkeit der Haptik gegeben, die theoretischen Grundlagen des Tastsinns und die Ermittlung biophysikalischer Kennwerte werden in diesem Zusammenhang behandelt. Des Weiteren werden Verbesserungs- und Erweiterungsmöglichkeiten, die sich aus dem Implementierungsprozess ergaben, angeführt.
|
| Thu, Nov 3 |
14:00 |
Robert Sorschag |
Conference Test Talk (ICSIPA)
|
| Thu, Nov 3 |
14:00 |
Alexander Hasslacher |
Eine Untersuchung zur Wichtigkeit von Farbe in Stereo-Matching
—
2. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann, Margrit Gelautz
—
Ziel von Stereo-Algorithmen ist es, korrespondierende Punkte in zwei, auf der horizontalen Ebene verschobenen Bildern zu finden. Dabei wird die Verschiebung von korrespondierenden Pixeln als Disparität bezeichnet. Die Disparitäten geben Rückschluss auf die Entfernung der Bildpunkte zum Kamerasensor, wodurch sich Tiefenkarten erstellen lassen.
Obwohl die Verwendung von Farbbildern als Eingabe für Stereo-Algorithmen eine höhere Qualität der Resultate als bei Grauwertbildern erwarten lässt, wurde in vergangenen Arbeiten gezeigt, dass Farbbilder bei Verwendung von helligkeits-invarianten Stereo-Korrespondenzmaßen sogar einen negativen Einfluss auf die Resultate haben können. Jedoch wurden diese Experimente auf Bildern durchgeführt, welche unter ähnlichen Laborbedingungen und mit derselben Kamera aufgenommen wurden.
Das Ziel dieser Diplomarbeit ist es die Einsichten vergangener Arbeiten auf einem neuen Datensatz und mit unterschiedlichen Kameras zu verifizieren. Dazu wurden in dieser Arbeit Stereobildpaare mit unterschiedlichen Kameras aufgenommen und Referenzlösungen in Form von Disparitäts-Karten unter Einsatz von strukturiertem Licht erzeugt.
Anschließend wurden die aufgenommenen Stereobildpaare verwendet um Disparitäts-Karten mit einem etablierten Stereo-Algorithmus zu berechnen. Zur Berechnung der Disparitäts-Karten wurden verschiedene Farbräume sowie Korrespondenzmaße verwendet. Die berechneten Disparitäts-Karten wurden dann mit den Referenzlösungen verglichen und die daraus erhaltenen Fehlerraten ausgewertet.
Die Auswertungen bestätigen die Einsichten vergangener Arbeiten: Zum einen hat Farbe in radiometrisch unverzerrten Bildregionen wenig positiven Einfluss auf die Resultate. Im Gegensatz dazu können radiometrisch insensitive Korrespondenzmaße auch in diesen Regionen das Resultat verbessern. Zum anderen wurde in dieser Arbeit bestätigt das radiometrisch insensitive Korrespondenzmaße auf Grauwertbildern bessere Ergebnisse als auf Farbbildern liefern.
|
| Thu, Oct 20 |
13:15 |
Clemens Czermak |
Echtzeitansätze in der Stereoanalyse
—
2. Diplomarbeitspräsentation;
Betreuer: Michael Bleyer, Margrit Gelautz;
—
Die Arbeit beschäftigt sich mit der Stereoanalyse zur Gewinnung von Tiefeninformation aus Bildern. Es werden Anwendungsgebiete und Grundlagen der Stereoanalyse beschrieben. Dazu gehören häufig gemachte Annahmen, welche die Korrespondenzsuche erleichtern. Bei den Verfahren zur Lösung des Korrespondenzproblems sind lokale Methoden sowie globale Methoden erörtert. Ziel der Arbeit ist neben der theoretischen Erläuterung von Verfahren, die Implementierung eines Stereoalgorithmus auf einer Graphikkarte, um mithilfe der starken Parallelisierungsfähigkeiten der Karte einen Geschwindigkeitsvorteil gegenüber einer CPU-Implementierung zu erreichen.
Bei der theoretischen Aufbereitung werden vor allem jene Stereoverfahren berücksichtigt, welche eine Laufzeit, geeignet für Echtzeitanwendungen besitzen und dennoch Resultate vergleichbar mit aufwendigeren Verfahren vorweisen. Zu diesen Methoden zählen bei den lokalen Ansätzen jene mit adaptiver Anpassung der Fenster bzw. der Gewichte an die Gegebenheiten der Bilder. Bei den globalen Verfahren wird der Ansatz mit dynamischer Programmierung ausführlich geschildert, da sich Verfahren mit dynamischer Programmierung effizient auf einer Graphikkarte implementieren lassen und gute Resultate liefern. Eigens erläutert wird der Stereoalgorithmus, welcher auf einer GPU implementiert wird.
Im praktischen Teil finden sich auch Aufbau und Architektur von programmierbaren Graphikprozessoren beschrieben sowie andere wichtige Details, welche zur Erstellung einer effizienten Implementierung bedeutsam sind. Das Vorgehen bei der realisierten GPU-Implementierung wird ebenfalls dargestellt. Weiters werden die erzielten Ergebnisse der GPU-Implementierung genau diskutiert, wie auch mit den Ergebnissen der CPU-Implementierung verglichen. Das implementierte Stereoverfahren läuft mit 16 Bildern pro Sekunde bei Bildern der Größe 384x288 und 16 Disparitätsstufen.
|
| Thu, Oct 6 |
13:15 |
Doris Antensteiner |
Interaktive Bildsegmentierung in höher verbundenen Graphen
—
2. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann, Margrit Gelautz;
—
Bildsegmentierungsergebisse wurden durch einen Algorithmus mit erweiterter Nachbarschaft verbessert, ohne wesentliche Nachteile in Hinblick auf die Geschwindigkeit mit sich zu bringen. Dies wird erreicht indem ein Bild als Graph betrachtet und für alle Pixel eine höhere Nachbarschaft definiert wird. Eine Zeitminimierung wird durch die Berechnung von Minimum Spanning Trees erreicht, welche für die interaktive Bildsegmentierung optimiert wurde.
Das Ziel einer interaktiven Bildsegmentierung besteht darin, ein Bild in zwei Bereiche zu gliedern, nämlich in das zu segmentierende Objekt und in den Bereich der nicht diesem Objekt zugehörig ist (Hintergrund). Hierzu markiert der Benutzer Teile des Objektes und Teile dieses Hintergrundes. Auf Grund dieser Information werden Rückschlüsse auf die Zugehörigkeit der restlichen Bildbereiche gezogen.
Zum Zwecke der Segmentierung kann ein Bild als Graph betrachtet werden. Die Bildpunkte entsprechen den Knoten im diesem Graphen und Kanten modellieren Abhängigkeiten zwischen den Bildpunkten. Den Kanten zugewiesene Gewichte beschreiben wie stark die jeweils verbundenen Bildpunkte einander zugehörig sind. Die Unterteilung des Bildes in Vordergrund und Hintergrund kann durch einen optimierten Schnitt durch den Graphen erreicht werden. Dabei werden Punkte, welche durch eine Kante mit hohem Gewicht verbunden sind, bevorzugt beide dem Objekt oder dem Hintergrund zugewiesen. Dadurch wird eine räumlich kohärente Lösung forciert. Eine wichtige Frage ist es welche Bildpunkte miteinander verbunden werden sollen. Frühere Algorithmen verbinden die vier oder acht räumlich nächsten Punkte. Allerdings treten hier Schwierigkeiten an Objektkanten mit feinen Strukturen auf, wie sie zum Beispiel bei Bäumen zu finden sind. Größere Nachbarschaften können das Segmentierungsergebnis verbessern. Allerdings steigt der Rechenaufwand für die Berechnung des Graphen-Schnittes mit der Anzahl der verwendeten Kanten.
Daher ist das Ziel dieser Arbeit die Anzahl der Kanten im Graphen auf eine Art und Weise zu reduzieren die es erlaubt bei geringerem Rechenaufwand Ergebnisse gleichwertig zu höher Verbunden Graphen zu erhalten. Die Grundidee ist es nur diejenigen Kanten im Graphen zu erhalten, welche ein hohes Gewicht aufweisen. Dies wird durch die Berechnung eines minimalen Spannbaumes in dem ursprünglich höher verbunden Graphen realisiert.
Die Resultate bestätigen dass höher verbundene Graphen bessere Segmentierungsresultate erzielen als solche die mit einer geringeren Nachbarschaft arbeiten. Unsere Experimente zeigen zudem, dass der Graph ohne signifikante Qualitätseinbußen durch einen minimalen Spannbaum approximiert werden kann. Dadurch ist eine hohe Segmentierungsqualität bei geringeren Rechenzeiten möglich.
|
Q3/2011 Talks
| Date |
Time |
By |
Topic |
| Thu, Sep 29 |
14:00 |
Christian Fischl |
Emotionsbasierte Videoverfremdung
—
2. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger;
—
In dieser Diplomarbeit wird Videound Audiomaterial, basierend auf einer automatischen, emotionalen Bewertung sprachlicher Äußerungen von Personen, verfremdet. Zum einen bewirkt diese Verfremdung eine Anonymisierung der dargestellten Personen und zum anderen eine hervorgehobene Darstellung der Emotionen. Die Emotionen werden durch ein Maschinenlernverfahren abgeschätzt und in einem dimensionalen Ansatz in einem R3-Raum kontinuierlich beschrieben. Die Dimensionen sind Valenz, Arousal und Dominanz. Für Training und Test wird die Vera am Mittag-Datenbank verwendet. Sie beinhaltet Videound Audiomaterial, welches in einer Evaluierung durch 17 Personen bewertet wurde.
In dieser Arbeit werden 69 prosodische und spektrale Merkmale (Pitch1, RMS2, MFCC3 etc.) aus der Tonspur extrahiert und für jede Gefühls-Dimension ein Ranking über deren Relevanz erstellt. Die so aus dem Maschinenlernverfahren ermittelten Emotionen werden für die Manipulation des Materials herangezogen. Für die visuelle Verfremdung werden fünf Verfahren implementiert: Cartooning, Painterly, ASCII, ColoredEdge und Pleasantville. Die Emotionen wirken dabei auf die verschiedenen Parameter des Renderings ein. Die Tonspur wird durch eine Art Vocoder verzerrt und anonymisiert.
|
| Thu, Sep 29 |
14:00 |
Emanuel Vonach, Georg Gerstweiler |
Development of an Active Motion Capture Suit for Teaching Motion Skills
—
2. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann;
—
Current multimedia support for teaching and practicing motion skills is usually limited to video and two-dimensional graphics. Especially in areas like rehabilitation and sports the employment of virtual reality applications for educational purposes could offer considerable benefits, like a detailed real-time feedback about the training progress or the support of motivation and autonomy of the users. However for any virtual reality motion skill training system a means for motion input is essential.
In particular application areas related to sports impose a number of special requirements that have to be considered. Most full body motion capture devices are either specifically designed for a certain application or not suitable for sports due to different reasons. For example in a lot of sporting activities it might be required to lie on the floor, perform rolls or make direct contact with other tracked persons. For that reason motion capture techniques where the user has to be equipped with relatively large devices could cause pain if making physical contact to hard surfaces like the floor. Furthermore matters like possible fast movements, sufficient freedom of motion and hygienic issues have to be considered as well.
The authors show in the course of this work, that a motion capture suit with active infrared optical markers can be constructed to meet the special challenges of motion skill training. For that purpose they compile a wide range of related requirements and devise concepts to fulfill these needs. Subsequently these concepts are applied to construct a fully functional prototype, suitable for a broad range of sporting activities. In order to assess the performance of the active motion suit in an educational context and to demonstrate the potential of the employment of a virtual environment, the constructed input device is used in an actual virtual reality application for teaching motion skills.
The active motion capture suit developed in this project is suitable for sports and rehabilitation, but not limited to these specific application areas. Most importantly the authors successfully accomplished to incorporate all required wiring and electronic components unobtrusive. Due to individually controllable markers the layout can be optimized for different setups and tracking algorithms.
|
| Thu, Sep 22 |
13:15 |
Georg Braun |
Effiziente kantenerhaltende Glättung und ihre Anwendung in der Praxis
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Michael Bleyer, Christoph Rhemann;
—
In diesem Vortrag werden mit dem Bilateral Filter und Guided Image Filter zwei kantenerhaltende Filter präsentiert, welche sowohl Rauschanteile unterdrücken als auch Kanteninformation weitgehend erhalten. Ein Schwerpunkt wird dabei auf die effiziente Implementation gelegt. Für beide Filter wird ein Algorithmus mit konstanter Laufzeit bezüglich der Kernelgröße vorgestellt. Weiters werden ausgewählte Erkenntnisse, die im Rahmen der parallelen Implementation auf CUDA-fähigen Grafikkarten gewonnen werden konnten, präsentiert. Im zweiten Teil des Vortrags werden zwei interessante Applikationsszenarien kantenerhaltender Filterung vorgestellt. Zunächst wird am Beispiel der interaktiven Bildsegmentierung veranschaulicht, dass Segmentierungsalgorithmen mit integrierter kantenerhaltender Filterung im Vergleich zu Sate-Of-The-Art Algorithmen (Grab-Cut) nicht nur qualitativ ähnliche Ergebnisse erzielen können, sondern auch deutlich weniger Rechenleistung beanspruchen. Das zweite Anwendungsszenario beschäftigt sich mit der Nachbearbeitung von Tiefenkarten, die durch Stereo-Matching berechnet wurden. Es wird gezeigt, dass durch die Anwendung kantenerhaltender Filter die Qualität der Karten, vor allem in der Nähe von Tiefenunstätigkeiten, deutlich gesteigert werden kann.
|
| Thu, Sep 22 |
13:15 |
Clemens Czermak |
Echtzeitansätze in der Stereoanalyse
—
1. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Michael Bleyer;
—
Im Vortrag geht es um die Stereoanalyse zur Gewinnung von Tiefeninformation aus Bildern. Zuerst wird das Themengebiet genauer vorgestellt. Es wird darauf eingegangen, welche Ver fahren behandelt werden. Auch das Prinzip der Tiefengewinnung soll erklärt werden. Bei den Verfahren zur Lösung des Korrespondenzproblems werden lokale Methoden sowie eine glo bale Methode kurz erklärt. Ziel ist es, vor allem jene Stereoverfahren zu berücksichtigen, wel che eine Laufzeit, geeignet für Echtzeitanwendungen besitzen und dennoch Resultate ver gleichbar mit aufwendigeren Verfahren vorweisen. Neben der Erläuterung des theoretischen Teils wird auch der praktische Teil der Arbeit kurz präsentiert. Er behandelt die Implementie rung eines Stereoalgorithmus auf einer Graphikkarte. Mithilfe der ausgeprägten Parallelisie rungsfähigkeiten der Karte soll ein Geschwindigkeitsvorteil gegenüber einer CPU-Implemen tierung erreicht werden.
|
| Date |
Time |
By |
Topic |
| Thu, Sep 15 |
13:15 |
Simone Arnberger |
Die Bedeutung von Alpha-Matting für die Darstellung von Bildern auf 3D Bildschirmen: Eine Benutzerstudie
—
2. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann, Margrit Gelautz;
—
Ziel der Arbeit war es zu untersuchen, inwieweit Alpha-Matting-Information die Qualität der Bilddarstellung auf 3D Bildschirmen beeinflusst. Um diese Frage zu beantworten, wurde im Zuge dieser Arbeit eine Benutzerstudie durchgeführt. In der Studie wurden mehrere Stereobildpaare, welche sowohl mit als auch ohne Alpha-Matting erstellt wurden, auf einem 3D-Monitor dargestellt. Die Betrachter wurden befragt, ob sichtbare Unterschiede in der Bildqualität zwischen den 3D-Bildern erkennbar sind. Ein weiteres Ziel der Untersuchung war die Feststellung, ob die wahrgenommenen Unterschiede mit speziellen Hintergründen oder einzelnen Motiven in Verbindung gebracht werden können. Die Analyse der Ergebnisse hat gezeigt, dass die Probanden eine bessere Bildqualität bei den mit Alpha-Matting erstellten Bildpaaren gegenüber den ohne Alpha-Matting erstellten Stereobildpaaren feststellen konnten. Das Ergebnis der Studie spricht somit eindeutig für einen Einsatz von Alpha-Matting bei der Generierung von synthetischen Ansichten, da eine korrekte Darstellung der transparenten Regionen Grundvoraussetzung für qualitativ hochwertige 3D-Bilder ist.
|
| Thu, Sep 15 |
13:15 |
Mattias Eisenbarth |
Evaluierung von Algorithmen zur Novel-View-Generierung aus Stereobildern
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Florian Seitner;
—
Diese Arbeit beschäftigt sich mit dem Vergleich von State-of-the-Art-Algorithmen zur Erzeugung von virtuellen Ansichten (Novel-Views) auf Basis von Stereobildern. Das Ziel der Arbeit ist es, mehrere NV-Methoden bezüglich ihrer visuellen Qualität (z.B. Artefakte, Tiefeneindruck …) zu analysieren und zu vergleichen. Dabei werden im Speziellen die Methoden für das Image Warping (Verschieben von Bildpunkten auf ihre neuen Positionen) und das Image Inpainting (Rekonstruktion fehlender Bildteile) untersucht. Die Resultate der Arbeit geben Aufschluss über die Schwächen von bestehenden NV-Methoden und stellen Lösungen vor, um neue NV-Verfahren zu entwickeln, die einen angenehmen Tiefeneindruck erzielen und visuelle Artefakte soweit reduzieren, dass diese von der menschlichen visuellen Wahrnehmung nicht mehr als störend empfunden werden.
|
| Thu, Sep 1 |
13:15 |
Richard Kloibhofer |
Rauschunterdrückung in einer nicht ausgerichteten Bildfolge
—
2. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann, Margrit Gelautz;
Seminarraum 183/2 (Favoritenstraße, Stiege I, 4. Obergeschoß, gelber Bereich)
—
Die Durchführung einer Bildrauschunterdrückung stellt eine Standardoperation in der digitalen Bildverarbeitung dar. Die meisten Arbeiten beschäftigen sich mit der Rauscheliminierung in Einzelbildern (z.B.: Gaußfilter, Medianfilter oder Bilateraler Filter). Dem gegenüber stehen Strategien, die auf mehreren Eingabebildern basieren. Bei diesen Verfahren liegt eine Sequenz identischer Kopien des gleichen Bildes vor, in dem jeder Pixel unabhängig voneinander durch Rauschstörungen beeinträchtigt wurde. Ein rauschfreies Bild kann dahingehend erzeugt werden, indem über jedes Pixel der Bildsequenz gemittelt wird.
In der Praxis sind diese Bilder jedoch nicht korrekt zueinander ausgerichtet. Geringe Kamerabewegungen verursachen beispielsweise eine Verschiebung der aufgenommenen Bilder, wodurch die Beziehung eines Pixels zu seinen über die Bildfolge verteilten korrespondierenden Pixelpositionen verloren geht. Folglich werden für die Lösung dieses Problems Bildregistrierungsmethoden (Image Alignment) benötigt, die die Korrespondenz der Pixelpositionen wiederherstellen.
Das Ziel meiner Diplomarbeit stellt die Entwicklung einer Methode dar, welche ein rauschfreies Bild aus einer Sequenz von zueinander verschobenen Bildern berechnet ohne die Bilder aufeinander zu registrieren. Um dies zu bewerkstelligen, wird jeder Bildpunkt als gewichtetes Mittel aller innerhalb einer lokalen Nachbarschaftsregion befindlichen Pixel der Bildsequenz definiert. Der Einfluss (Gewicht) eines jeden Bildpunktes auf die Mittelwertbildung wird (ähnlich wie bei der bilateralen Filterung) durch seine räumlichen Nähe (in absoluten Bildkoordinaten) und durch die Helligkeitsähnlichkeit zum jeweils betrachteten Pixel bestimmt.
|
| Tue, Aug 30 |
14:00 |
Thomas Hahn |
Event-Driven 3D Vision for Human Activity Analysis in Context of Dance and Fitness Training of Elderly People
—
2. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann;
Seminarraum 183/2 (Favoritenstraße, Stiege I, 4. Obergeschoß, gelber Bereich)
—
Over the last years many implementations concerning the recognition of human motion have been developed. In doing so different systems for human motion detection reaching from recognition of simple gestures to more dynamic complex motions have been invented.
The application area of these systems is thereby wide spread from input for Human Computer Interaction to human motion analysis in the field of rehabilitation exercises or sports.
Systems that are designed for elderly people are becoming more important, especially in the physical training application area. This is because the population is tending to live to an older age and there will be more and more elderly people in the near future.
In this thesis a system for recognition of human motion in the area of dance and fitness training for elderly people is introduced. This module within the EU project Silvergame [SJSB09] is thereby intended to help elderly people to keep their level of health as well as to gain a higher fitness level so that they can stay healthy to an older age. With the system the users can then be encouraged to move more by performing the dance which they see on their home TV screen. In doing so such a dance consists of different human activities which the system recognizes. Furthermore, it also provides some sort of feedback via the given output device. As the input device, a novel event-driven 3D vision sensor, developed at the AIT Austrian Institute of Technology is used in this approach. What is special in this case is that only data is transferred if an intensity change in the field of view is detected. Therefore, less data then with ordinary video systems is generated. Another difference worth mentioning is that this information is communicated not frame-based but pixel wise. Keeping this constraint in mind and based on the information transferred from this sensor, elementary features that are used as input for classification are obtained.
Through a detailed research of the literature about the up-to-date classification methods, the most promising technique and features for the motion detection system were chosen. This thesis thereby shows the performance of the designed application and points out the opportunity for further employments. Though it was significant how the chosen classification method can be used for the obtained features from the received data. Additionally first performance measurements were done. For this first implementation MATLAB was chosen as the main platform and further applications shall be based on this gained knowledge. For experimentation with the implemented algorithm a database including 580 samples with 8 different activities from 15 individuals, using the 3D sensor, was recorded. To obtain representative experimentation results a cross validation was applied and different settings were used to compare the results. Additionally, test sessions were done on different data sets and for the best results the training and evaluation time was recorded to point out the possibility of real-time usage. The best results thereby reached an average correct recognition rate of around 96 %.
|
| Thu, Aug 25 |
13:15 |
Michael Bleyer |
PatchMatch Stereo: Stereo Matching With Slanted Support Windows
—
Test talk, BMVC 2011;
Seminarraum 183/2 (Favoritenstraße, Stiege I, 4. Obergeschoß, gelber Bereich)
—
Common local stereo methods match support windows at integer-valued disparities. The implicit assumption that pixels within the support region have constant disparity does not hold for slanted surfaces and leads to a bias towards reconstructing fronto-parallel surfaces. This work overcomes this bias by estimating an individual 3D plane at each pixel onto which the support region is projected. The major challenge of this approach is to find a pixel's optimal 3D plane among all possible planes whose number is infinite. We show that an ideal algorithm to solve this problem is PatchMatch [Barnes09] that we extend to find an approximate nearest neighbor according to a plane. In addition to PatchMatch's spatial propagation scheme, we propose (1) view propagation where planes are propagated among left and right views of the stereo pair and (2) temporal propagation where planes are propagated from preceding and consecutive frames of a video when doing temporal stereo. Adaptive support weights are used in matching cost aggregation to improve results at disparity borders. We also show that our slanted support windows can be used to compute a cost volume for global stereo methods, which allows for explicit treatment of occlusions and can handle large untextured regions. In the results we demonstrate that our method reconstructs highly slanted surfaces and achieves impressive disparity details with sub-pixel precision. In the Middlebury table, our method is currently top-performer among local methods and takes rank 2 among approximately 110 competitors if sub-pixel precision is considered.
|
| Thu, Aug 25 |
13:15 |
Manfred Grünling |
Entwicklung eines multitouchfähigen Schaufensters
—
2. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann;
Seminarraum 183/2 (Favoritenstraße, Stiege I, 4. Obergeschoß, gelber Bereich)
—
In der vorliegenden Arbeit wird ein Hard- und Softwaresetup präsentiert, mit dem es möglich ist, beliebige Schaufenster mit Multitouch-Funktionalität auszustatten. Die Arbeit fasst zunächst die theoretischen Grundlagen im Bereich optischer Sensorik und Lichtquellen zusammen. Danach wird ein Überblick über die zur Verfügung stehenden Multitouch-Technologien geschaffen. Kamera-basierte Technologien, die für den Eigenbau und zur Realisierung von großformatigen Multitouch-Displays geeignet sind, liegen dabei im Fokus.
Weiters werden verschiedenste Software-Komponenten beschrieben, die zur Umsetzung von Multitouch-Anwendungen eingesetzt werden können. Daraufhin wird das implementierte Hardwaresetup, sowie die verwendete und entwickelte Software, vorgestellt.
|
| Tue, Aug 23 |
13:00 |
Birgit Gneiss |
Erstellung eines Datensatzes zur Evaluierung von Stereo-Matching-Algorithmen
—
2. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann, Margrit Gelautz;
Seminarraum 183/2 (Favoritenstraße, Stiege I, 4. Obergeschoß, gelber Bereich)
—
Stereo-Matching-Algorithmen verfolgen das Ziel, Tiefeninformationen aus Stereobildpaaren anhand übereinstimmender Merkmale zu gewinnen. Durch die leicht voneinander abweichenden Blickwinkel (Views) der Stereobilder wird derselbe Szenenpunkt in den einzelnen Views an unterschiedlichen Pixelkoordinaten abgebildet. Das Ausmaß dieser Verschiebung wird als Disparität bezeichnet und stellt die Grundlage für die Gewinnung von Tiefeninformationen dar.
Zur quantitativen Evaluierung von Stereo-Matching-Algorithmen, ist die Verfügbarkeit von Referenzlösungen (Ground Truth) unerlässlich. Trotz aktiver Forschungstätigkeit im Bereich Stereo Matching existieren nur relativ wenige frei verfügbare Referenzlösungen, da ihre Erstellung ein sehr aufwändiger Prozess ist. Die Hauptanforderungen an Ground-Truth-Tiefenkarten sind eine hohe Exaktheit sowie eine hohe Dichte. In dieser Arbeit wird ein System zur Erstellung von Referenzdatensätzen für Stereo-Matching-Algorithmen vorgestellt, welches diesen Kriterien gerecht wird. Um die Komplexität der Zuordnung korrespondierender Merkmale zu erleichtern, wird die Methode der strukturierten Beleuchtung eingesetzt. Mit Hilfe einer Beleuchtungsquelle werden dabei für jede View nacheinander verschiedene Streifenmuster auf die Szene projiziert, wodurch eindeutige Pixelkodierungen erzeugt werden und Korrespondenzen zwischen den Views leichter zugeordnet werden können. Um die Verlässlichkeit und Exaktheit des Gesamtergebnisses zu erhöhen, werden zusätzliche Korrespondenzen zwischen der Geometrie der Beleuchtungsquelle und den beiden Views berechnet. Die Evaluierung der auf diese Weise gewonnenen Tiefenkarten anhand von manuell ermittelten Disparitäten zeigt, dass mit dem vorgestellten System subpixelgenaue Tiefenkarten erzielt werden können, die verlässliche Ground-Truth-Informationen darstellen.
|
| Thu, Aug 18 |
13:15 |
Ferdinand Pilz |
MINT: A Framework for the Design and Development of Multimodal Interaction of Multi-touch Surfaces
—
1. Diplomarbeitspräsentation
—
Seminarraum 183/2 (Favoritenstraße, Stiege I, 4. Obergeschoß, gelber Bereich)
|
| Thu, Aug 18 |
13:15 |
Adam Barclay |
Depth Maps: A Mean-Shift Approach Towards Enhanced Image Segmentation
—
1. Diplomarbeitspräsentation
—
Seminarraum 183/2 (Favoritenstraße, Stiege I, 4. Obergeschoß, gelber Bereich)
|
| Thu, Jul 21 |
13:15 |
Matthias Zeppelzauer |
Cross-Modal Analysis of Audio-Visual Film Montage
—
Test talk for the ICCCN 2011 Workshop on Multimedia Computing and Communications
—
A stylistic device frequently employed by filmmakers
is the synchronous montage (composition) of audio and visual elements.
Synchronous montage helps to increase tension and tempo
in a scene and highlights important events in the story. Sequences
with synchronous montage usually contain rich semantics which
is relevant for understanding a movie. This property is currently
not exploited in automated indexing, annotation, and summarization
of movies. We propose a cross-modal approach that
extracts sequences from a movie with synchronous audio-visual
montage. Experiments confirm that the extracted sequences have
high semantic relevance. Consequently, they represent a useful
basis for different high-level movie abstraction tasks such as
automated movie annotation and movie summarization.
|
| Thu, Jul 14 |
13:15 |
Christian Schönauer |
Chronic Pain Rehabilitation with a Serious Game using Multimodal Input
—
Virtual Rehabilitation 2011 Conference Talk
—
Rehabilitation for chronic pain follows a multidisciplinary approach, which despite the effort, often lacks the long term success and patients often fail to translate the skills learned in therapy to every day life. Serious games are hypothesized to support patients to self manage their complaints and keep training their physical functions by themselves, especially, when the game is controlled by the patient’s own body performance. In this paper we present the implementation of a system providing multimodal input, including our own full body motion capture system, a low cost motion capture system (Microsoft Kinect) and biosignal acquisition devices to a game engine. In addition, a workflow has been established, that enables the use of the acquired multimodal data for serious games in a medical environment. Finally, a serious game has been implemented, targeting rehabilitation of patients with chronic pain of the lower back and neck. The focus of this work is on the multimodal input and how it is used in a game to support rehabilitation of chronic pain patients. A brief comparison of a marker-based full body MoCap system and Microsoft’s Kinect is included. Preliminary results of tests currently underway are provided.
|
| Thu, Jul 14 |
13:15 |
Olga Kosyreva |
PTAM & Natural Feature Tracking
—
PhD School
|
| Thu, Jul 7 |
13:15 |
Asmaa Hosni |
Real-Time Local Stereo Matching Using Guided Image Filtering
—
Test talk for the IEEE International Workshop on Hot Topics in 3D (Hot3D)
—
Adaptive support weight algorithms represent the state-of-the-
art in local stereo matching. Their limitation is a high
computational demand, which makes them unattractive for
many (real-time) applications. To our knowledge, the algorithm
proposed in this paper is the first local method which
is both fast (real-time) and produces results comparable to
global algorithms. A key insight is that the aggregation step of
adaptive support weight algorithms is equivalent to smoothing
the stereo cost volume with an edge-preserving filter. From
this perspective, the original adaptive support weight algorithm
applies bilateral filtering on cost volume slices, and
the reason for its poor computational behavior is that bilateral
filtering is a relatively slow process. We suggest to use
the recently proposed guided filter to overcome this limitation.
Analogously to the bilateral filter, this filter has edge-preserving
properties, but can be implemented in a very fast
way, which makes our stereo algorithm independent of the
size of the match window. The GPU implementation of our
stereo algorithm can process stereo images with a resolution
of 640 × 480 pixels and a disparity range of 26 pixels at 25
fps. According to the Middlebury on-line ranking, our algorithm
achieves rank 14 out of over 100 submissions and is not
only the best performing local stereo matching method, but
also the best performing real-time method.
|
Q2/2011 Talks
| Date |
Time |
By |
Topic |
| Thu, Jun 30 |
13:15 |
Manfred Grünling |
Entwicklung eines multitouchfähigen Schaufensters
—
1. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann
—
Die LLP-Methode (Laser Light Plane) ist eine optische Multitouch-Technik,
bei der mit Laserdioden und Streulinsen eine Laserebene knapp über einer
Projektionsfläche erzeugt wird. Berührt man das Display, so werden die
Fingerspitzen vom Laserlicht getroffen und von einer Kamera erfasst. Die
LLP-Technik wird bereits bei Multitouchtischen eingesetzt und soll nun für
den Einsatz an Schaufenstern adaptiert werden. Im Rahmen der Diplomarbeit
soll ein Hard-und Softwaresetup entwickelt werden, das die Funktionalität
des Konzepts zeigt.
|
| Wed, Jun 22 |
13:15 |
David Zeller |
Physics Driven 3D Dynamic Geometry Software for Elementary Education
—
1. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann
—
A software tool shall be created that allows users to dynamically create and manipulate geometry in a 3D space. This work intends to pick up the idea of applications like Construct3D. Moreover these geometric objects shall physically correctly interact with each other. This again is expected to reinforce the software‘s positive effect on spatial abilities.
The desired outcome of this work is a three dimensional dynamic geometry
software intended for educational use. The software is mainly targeted at primary school and lower grade secondary school students. It thus emphasizes a playful approach to the matter. The resulting software however is intended to be easily extendable and thus open to be adapted to more sophisticated needs.
|
| Thu, Jun 16 |
13:15 |
Alexander Fried |
Application Demos for Media Understanding
—
1. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger
—
Ziel dieser Diplomarbeit ist es Anwendungsbereiche des Media Understanding interessierten Personen näher zu bringen, wie beispielsweise (Medien-)Informatik-Studienanfängern, die am Beginners Day der TU Wien teilnehmen. In diesem Rahmen sollen drei Demoanwendungen implementiert werden, die die Verwendung des Media Understanding in der Praxis verdeutlichen sollen. Die Anforderungen an ein solches System ist vor allem eine robuste Klassifizierung der Testdaten, das auch unter nicht-idealen, realen Testumgebungen funktioniert.
Das erste Demo ist ein Beispiel aus der Gesichtserkennung. Aus einem Pool von prominenten Persönlichkeiten soll anhand eines mit einer Webcam aufgezeichneten Fotos der dem User ähnlichsten sehende Prominente ermittelt werden. Zunächst wird der Benutzer dazu aufgefordert ein Bild von sich zu machen. Das Programm ermittelt anschließend das Gesicht, das dem Benutzer am ähnlichsten sieht mittels Template Matching und gibt dieses aus. Beide Fotos werden nebeneinander dargestellt, sodass die festgestellte Ähnlichkeit nachvollziehbar ist.
Bei der zweiten Demoanwendung soll mit dem gesamten Körper Memory gespielt werden. Der Benutzer sieht für einen kurzen Zeitraum einen Körperteil am Monitor und muss diesen vor die Webcam halten. Bei einer Übereinstimmung bekommt der User einen Punkt, ansonsten ist das Spiel vorbei. Die größte Herausforderung bei der Implementierung ist hierbei, ähnliche Körperteile wie z.B. Ellenbogen und Knie auseinander zu halten.
Die dritte Demoanwendung ist ein auf Spracherkennung basierendes Spiel. Der User bekommt vom Computer Tierlaute ausgegeben und muss mit dem entsprechenden Tiernamen antworten. Genauso gut kann aber auch der Tiername vom Computer ausgegeben werden, worauf der User mit dem entsprechenden Tierlaut antworten soll. Diese Interaktion wird in immer schnellerer Abfolge wiederholt, bis der Spieler einen Fehler macht. Der Score des Benutzer ergibt sich anhand der Anzahl der korrekten Antworten.
|
| Thu, Jun 9 |
13:15 |
Christian Fischl |
Emotionsbasierte Videoverfremdung
—
1. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger
—
In dieser Diplomarbeit wird Videomaterial aufgrund emotionaler Bewertung der Äußerungen der Akteure verfremdet. Die Emotionen werden durch ein Maschinenlernverfahren abgeschätzt und durch drei Basis-Emotionen in einem R3-Raum beschrieben. Die Achsen sind Valence, Arousal und Dominance. Für Training und Test wird die Vera am Mittag-Datenbank verwendet. Sie beinhaltet Video- und Audiomaterial, welches in einer Evaluierung durch 17 Personen bewertet wurde. Eine für den Menschen wesentliche Eigenschaft in zwischenmenschlicher Kommunikation ist die Erkennung von Gefühlen und sozialen Signalen. Dabei werden verschiedene Informationskanäle verwendet. Daran angelehnt wird auch in einem Maschinenlernverfahren auf verschiedene Kanäle zurückgegriffen. In dieser Arbeit werden 49 prosodische Merkmale (abgeleitet von Pitch, RMS und MFCC) aus der Tonspur extrahiert und für jede Basis-Emotion ein Ranking über deren Relevanz erstellt. Die so aus dem Maschinenlernverfahren ermittelten Emotionen werden für die Manipulation des Bildmaterials herangezogen. Für die Darstellung werden zwei Verfahren aus dem Bereich des Non-Photo-Realistic-Renderings implementiert: Cartooning und Painterly. In einem dritten Verfahren wird das Bild in ASCII-Code umgewandelt. Die Emotionen wirken dabei auf verschiedene Parameter des Renderings ein.
|
| Mon, May 30 |
11:00 |
Anita Bogner |
Evaluierung und Entwurf von Epipolarrektifizierungsverfahren zur Verwendung in einem Stereovision Framework
—
2. Diplomarbeitspräsentation;
Betreuer: Michael Bleyer, Margrit Gelautz
—
Epipolarrektifizierung ist ein Verfahren, dass häufig im Zuge der Stereo Vision eingesetzt wird. Ziel der Stereo Vision ist es aus zwei Aufnahmen derselben Szene, einem sogenannten Stereobildpaar, mithilfe geeigneter Verfahren Tiefeninformation für die betrachtete Szene zu berechnen. Man nennt diesen Prozess Depth-From-Stereo. Das zentrale Problem der Stereo Vision - das Korrespondenzproblem - ist das Finden zusammengehörender Punktpaare in einem Stereobildpaar. Epipolarrektifizierung ist ein Verfahren, dessen Ziel es ist, Stereobildpaare so zu transformieren, dass zusammengehörende - also demselben Objektpunkt entsprechende - Bildpunkte in den rektifizierten Bildern auf ein und derselben horizontalen Linie liegen. Unter dieser Voraussetzung wird das Korrespondenzproblem wesentlich vereinfacht und nachfolgende Stereo Matching Verfahren beschleunigt. Da die Epipolarrektifizierung im Fall unkalibrierter Bilddaten keine eindeutige Lösung besitzt, liegt die Schwierigkeit darin eine Lösung zu finden, die das Bildpaar nicht nur korrekt rektifiziert, sondern gleichzeitig möglichst keine unnötigen Verzerrungen in den rektifizierten Bildern verursacht.
Ausgangspunkt dieser Diplomarbeit ist ein Stereovisionframework, das in der Interactive Media Systems Group des Instituts für Software Technologie und Interaktive Systeme entwickelt wurde. Dieses Framework umfasst alle Arbeitsschritte, die notwendig sind um Tiefeninformation aus Stereobilddaten zu gewinnen für die keine Kalibrierungsinformation zur Verfügung steht. Inhalt des praktischen Teils der Diplomarbeit ist die Nachimplementierung der "Quasi-Euclidean Uncalibrated Epipolar Rectification” von Fusiello und Irsara [FI08] in C++. Weiters wird die Qualität der Rektifizierungsergebnisse dieses Verfahrens anhand von Ground Truth-Daten evaluiert und mit jenen des weit verbreiteten Rektifizierungsverfahrens von Hartley [Har99] verglichen. Anhand von generierten Testmatches wird in einem ersten Schritt untersucht, wie sich verschiedene Faktoren auf die Qualität der Rektifizierungsergebnisse auswirken. Betrachtet wird hier beispielsweise welchen Einfluss das Ausmaß der Transformationen zwischen den beiden Inputbildern oder Fehler und Ungenauigkeiten in den Punktkorrespondenzen auf die Qualität der Rektifizierung haben. In einem weiteren Schritt werden einige gängige Feature-Detektoren in die Evaluierung einbezogen, um zu untersuchen, welche dieser Verfahren am besten zur Bestimmung der als Input für die Rektifizierung benötigten Punktkorrespondenzen geeignet sind. Konkret werden neben SIFT (Scale Invariant Feature Transform) und dem Harris Corner Detector, zwei der bekanntesten Feature-Detektoren, auch SURF (Speeded Up Robust Features), Hessian Affine Regions und MSER (Maximally Stable Extremal Regions) in die Evaluierung einbezogen werden.
Ziel der Evaluierung ist es herauszufinden, wie die Rezeptur für ein Rektifizierungsverfahren aussehen muss, um möglichst optimale Ergebnisse zu erzielen. Die aus der Evaluierung gewonnenen Erkenntnisse werden soweit als möglich in das Stereovisionframework integriert, um die Qualität der Epipolarrektifizierung und damit die Performanz des in Folge angewendeten Stereo Matching Verfahrens zu verbessern.
|
| Thu, May 26 |
13:30 |
Martin Riederer |
Entfernen von Bildrauschen und Eintrübungen in Bildfolgen
—
1. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann
—
Fotografien von weit entfernten Objekten sind aufgrund atmosphärischer Störungen meist eingetrübt beziehungsweise verrauscht. Diese Störungen können beispielsweise durch Dunst, Rauch oder trockene Partikel entstehen. Vor kurzem wurde ein Verfahren zur Verbesserung solche Aufnahmen vorgestellt [Joshi, Cohen, ICCP‘10]. Dabei wird das Rauschen unterdrückt, indem eine Bildserie zuerst aufeinander registriert und danach mit unterschiedlicher Gewichtung gemittelt wird. Im gemittelten Bild werden daraufhin die Eintrübungen unter Verwendung des Dunkel-Kanals entfernt. Zum Schluss wird der Kontrast durch eine lineare Anpassung der Helligkeit verbessert. Ziel dieser Arbeit ist es, dass vorgestellte Verfahren zu re-implementieren und mit Hilfe von Testsequenzen zu untersuchen. Dabei wird erwartet, dass die resultierenden Bilder eine ähnliche Qualität wie die in [Joshi, Cohen, ICCP‘10] gezeigten Bilder aufweisen.
|
| Thu, May 5 |
13:30 |
Matthias Wallner |
A System for Optical Score Recognition and Audio Synthesis
—
1. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger
—
Das Forschungsfeld der Optical Music Recognition (OMR), welches sich mit der Erkennung musikalischer Symbole, deren Transformation in ein von Computern lesbares Format sowie einer weiterführenden Bearbeitung beschäftigt, hat in den letzten vier Jahrzehnten einige interessante Arbeiten hervorgebracht. Generell hat sich ein Framework heraus gebildet, das in Verbindung mit hochauflösenden Eingabegeräten (vgl. Scanner) eine qualitativ hochwertige Erkennung der musikalischen Symbole und somit eine Lösung des komplexen Problems der OMR ermöglicht.
Jedoch ist es angesichts der aktuellen Entwicklungen im Bereich von Smartphones interessant, wie derartige Systeme für den Einsatz unter weniger optimalen Bedingungen adaptierbar sind. Dies umfasst zum einen die Bereiche der Digitalisierung der Notation sowie deren Verarbeitung, wobei beide Bereiche gewissen Einschränkungen unterliegen. Im Zuge des Capturing ist etwa sicher zu stellen, dass auch unter ungünstigen Beleuchtungsbedingungen ein für den weiteren Erkennungsprozess brauchbares Abbild der Realität entsteht. Ebenso muss auf Qualitätsverluste wie fragmentierte Zeichen, hervorgerufen durch Alterung oder mangelhafte Kopien, eingegangen werden.
In dieser Arbeit soll unter Rückgriff auf bekannte Methoden eine praktische Umsetzung für Smartphones erfolgen, die auf dem Betriebssystem Android basieren. Neben der Zeichenerkennung wird eine Möglichkeit zur akustischen Ausgabe integriert, um einen Einsatz im mobilen Bereich zu rechtfertigen, und den Benutzer- Anforderungen nach einem (im Smartphone-Bereich gewohnt) unkomplizierten und spielerischen Umgang Rechnung zu tragen.
|
| Thu, May 5 |
13:30 |
Philip Presle |
Virtueller Kleiderschrank mit Kinect
—
1. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann
—
|
| Thu, Apr 28 |
13:15 |
Liu He |
Object Removal by Depth-guided Inpainting
—
Test talk, ÖAGM 2011
—
Object removal by image inpainting aims at the visual uniformity of the inpainted blanks among their surroundings. Most inpainting algorithms pursue the structure continuity and texture similarity only in color. In this paper we take the view depth continuity into account and propose a depth-guided inpainting algorithm, in which a single color image and its associated disparity map are inpainted simultaneously. A fast exemplar-based inpainting is applied to fill the blank. Exemplars are randomly selected under depth constraints in initialization and optimized with a nearest neighbor search method in a semi-global way for smooth completion. Experimental results with datasets of different scenes demonstrate the positive impact of depth control in exemplar selection and the efficiency of the proposed algorithm.
|
| Thu, Apr 21 |
13:15 |
Thomas Hahn |
Event-Driven 3D Vision for Human Activity Analysis During Dance and Fitness Training of Elderly People
—
1. Diplomarbeitspräsentation;
Betreuer: Hannes Kaufmann
—
In the course of the SilverGame Project, one of the modules was to detect motion activities of elderly people during their dance and fitness training. Thereby this detection is done with an event-driven 3D Vision sensor invented at the Austrian Institute of Technology (AIT). It is not as usual a frame-based sensor, instead it records so-called address-events for each pixel when a movement takes place. With the usage of these address-events the processing time, i.e. for calculation of the optical flow, is cut down. As the last decades have shown, Hidden Markov Models (HMMs) are very solid for complex gesture detection and thus are also used for our classification. For training and testing, we created a database with about 840 activity sequences, which is extended later. Based on this recorded test data algorithms in Matlab are obtained and evaluated.
|
| Thu, Apr 14 |
13:15 |
Birgit Gneiss |
Erstellung eines Datensatzes zur Evaluierung von Stereo Matching Algorithmen
—
1. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann
—
Stereo Matching Algorithmen beschäftigen sich mit dem Auffinden korrespondierender Punkte in zwei leicht verschobenen Bildern. Diese Verschiebung wird als Disparität bezeichnet und zur Herstellung eines Tiefeneindrucks genutzt. Für eine quantitative Evaluierung von Stereo Matching Algorithmen ist ein Datensatz mit Referenzlösungen notwendig. Die Erstellung solcher Datensätze ist allerdings ein aufwendiger Prozess und daher existiert nur eine sehr geringe Anzahl an frei verfügbaren Referenzlösungen.
Das Ziel dieser Arbeit die Entwicklung eines Systems, das die Erzeugung eines Referenzdatensatzes für Stereo Matching Algorithmen ermöglicht. Dazu soll eine Kamera automatisiert gesteuert werden, um eine Szene aus zwei horizontal verschobenen Blickwinkeln aufzunehmen. Diese Bildpaare dienen als Eingabe für Stereo Matching Algorithmen. Um die zum jeweiligen Bildpaar zugehörigen Referenzlösung (i.e. Disparitäten) zu erhalten, wird ein sukzessiv feiner werdendes Streifenmuster (Structured Light) auf eine Szene projiziert, wobei jede Projektionsebene von der Kamera erfasst wird. Das Streifenmuster codiert jeden Pixel der Szene eindeutig, sodass korrespondierende Punkte in einem Stereobildpaar leicht aufgefunden werden können. Durch die so gefundenen Korrespondenzen können die Disparitäten berechnet werden.
Die Verfügbarkeit von Ground Truth Daten trägt wesentlich zur besseren Evaluierbarkeit von Stereoverfahren bei. Dadurch kann nicht nur die Performance besser untersucht und verstanden werden, sondern auch die Verbesserung bestehender und die Entwicklung neuer Algorithmen forciert werden.
|
| Thu, Apr 14 |
13:15 |
Adam Barclay |
Embedded Systems for Augmented Reality Applications
—
Betreuer: Hannes Kaufmann
—
The affordances of augmented reality applications are hightly dependent on seamless integration in the environment, where portability and size are of prime importance. SoC (system-on-a-chip)-based designs have much to offer in this regard.
In this talk, both hardware and software aspects in embedded systems design will be presented to illustrate the opportunities and challenges that are relevant to augmented reality applications.
|
| Thu, Apr 7 |
13:15 |
Dalibor Mitrovic |
Retrieval of Visual Composition in Film
—
Test talk, WIAMIS 2011
—
The spatial arrangement of visual elements of an image, i.e. the visual composition, is a research subject in the domain of visual arts which include painting, film, etc. Film experts face the problem of retrieval of visual compositions in film on a daily basis. Although, visual composition is a crucial element to consider in content-based video retrieval, little scientific effort has been invested into this problem so far. Actually, it is unclear if content-based retrieval of visual compositions is feasible. We present a user study conducted to investigate the feasibility of content-based retrieval of visual compositions as they are understood by film experts. For that reason, we create a data set derived from real world material and let the film experts evaluate the retrieval performance. The user study investigates the applicability of state-of-the-art visual features and shows differences in evaluations by film experts (test group) and computer scientists (reference group).
|
| Thu, Apr 7 |
13:15 |
Philipp Kastner |
A Survey of Visual Object Detection Technologies on Mobile Devices
The rapidly growing availability and acceptance of mobile devices, combined with their increasing computing power, offer a great opportunity for new applications and even for whole new application areas. Most of the current devices like mobile phones or tablet computers are equipped with built-in cameras, which can be used for visual object recognition. This paper gives an overview on various technologies and approaches ranging from client-server architectures to on-device real-time natural feature tracking including various examples of current uses as well as future ideas.
|
Q1/2011 Talks
| Date |
Time |
By |
Topic |
| Thu, Mar 31 |
13:15 |
Dalibor Mitrovic, Matthias Zeppelzauer |
Syntactic and Semantic Concepts in Audio‐Visual Media
—
Dissertationspräsentation
—
In this thesis we explore the understanding of syntactic and semantic concepts in audio‐visual media. The investigated concepts originate from the domains of (automatic) audio and film analysis. The thesis is a joint effort by Dalibor Mitrović and Matthias Zeppelzauer. — Details
|
| Thu, Mar 31 |
13:15 |
Roman Gerger |
Automatized Classification and Retrieval of Paintings
—
1. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger
—
This thesis examines the classification of images of paintings against different styles and the retrieval of paintings in image databases. The central points of the thesis are the elaboration of a suitable image feature set and the evaluation of different Machine Learning techniques working on it. Different approaches are exploited for Feature extraction, like comparison of color regions, brushstroke detection, edge- and texture analysis. A prototype application is presented to demonstrate that both the classification and the retrieval task can be solved in this particular domain. In the classification task the system will be trained against the following class values: Cubism, Expressionism, Impressionism, Post-Impressionism, Pointillism, Renaissance Painting, and Photography. Photography is considered as a separate style of "painting", which implies the question of how to distinguish between natural and artificial images. Results are evaluated on an independent test set. Results of the retrieval task are evaluated using Mean Average Precision. The extracted image features together with the applied similarity metrics should give a better understanding about how similarity between paintings can be modeled.
|
| Thu, Mar 24 |
13:15 |
Hasslacher |
Eine Untersuchung zur Wichtigkeit von Farbe in Stereo-Matching
—
1. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann
—
Eine Stereo-Tiefenkarte lässt sich durch das Bestimmen von korrespondierenden Pixeln in zwei, auf horizontaler Ebene verschobenen, Farbbildern erstellen. Sie dienen dazu, die Entfernung von Objekten in Bildern zu bestimmen.
Obwohl die Verwendung von Farbbildern oft eine höhere Qualität der Resultate als bei Grauwertbildern erwarten lässt, wurde in vergangenen Arbeiten gezeigt, dass Farbbilder bei Verwendung von helligkeits-invarianten Stereo-Korrespondenzmaßen einen negativen Einfluss auf die Resultate haben können. Jedoch wurden diese Experimente auf Bildern durchgeführt, welche unter ähnlichen Bedingungen und mit derselben Kamera aufgenommen wurden.
Kameras erstellen Farbinformationen auf unterschiedlichste Art und Weise. Über einen Bayer-Sensor werden die Rohdaten mit vollem Dynamikumfang und einer sehr genauen Helligkeitsauflösung aufgenommen. Diese Rohdaten müssen anschließend für das menschliche Auge interpoliert werden, wodurch bereits Beeinflussungen in den Ergebnissen von Korrespondenzalgorithmen entstehen können. Aus diesem Grund können durch die Nutzung verschiedener Kameras unterschiedliche Resultate zustande kommen.
In dieser Arbeit soll nun geprüft werden, ob die Wichtigkeit der Farbinformationen in den Bildern zur Erstellung solcher Tiefenkarten je nach Kamera variieren kann.
|
| Thu, Mar 24 |
13:15 |
TBA |
TBA
—
1. Diplomarbeitspräsentation;
Betreuer: Michael Mehling
|
| Thu, Mar 17 |
13:15 |
Mattias Eisenbarth |
Evaluierung von Algorithmen zur Novel-View-Generierung aus Stereobildern
—
1. Diplomarbeitspräsentation;
—
Das Ziel dieser Arbeit ist es, mehrere NV-Methoden bezüglich ihrer visuellen Qualität (z.B. Artefakte, Tiefeneindruck …) zu analysieren und zu vergleichen. Dabei sollen im Speziellen die Methoden für das Image Warping und das Image Inpainting (Rekonstruktion fehlender Bildteile) untersucht werden. Die Resultate dieser Arbeit sollen es ermöglichen, eine NV-Methode zu entwickeln, die einen angenehmen Tiefeneindruck erzielt und visuelle Artefakte soweit reduziert, dass diese von der menschlichen visuellen Wahrnehmung nicht mehr als störend empfunden werden.
|
| Thu, Mar 10 |
13:15 |
Wolfgang Knecht |
Clustered Deep Shadow Maps for Multiple Volumes and Geometry Using CUDA
—
2. Diplomarbeitspräsentation;
Betreuer: Dieter Schmalstieg
—
In der Computergrafik spielen Schatten eine bedeutende Rolle und
tragen einen wesentlichen Beitrag zur Atmosphäre in einer drei
dimensionalen Szene bei. Das Zusammenspiel von Schatten volumetrischer
Objekte wie etwa Wolken oder Rauch als auch Schatten von polygonaler
Geometrie stellt in der Echtzeitgrafik eine besondere Herausforderung dar.
Ziel dieser Diplomarbeit ist es, qualitativ hochwertige Schatten von
mehreren volumetrischen Objekten auf polygonale Geometrie als auch
umgekehrt von polygonaler Geometrie auf volumetrische Objekte auf eine
effiziente Art und Weise zu berechnen.
Dazu
wird die Implementierung von Deep Shadow Maps auf Basis eines CUDA
Rasterisierer beschrieben. Um qualitativ bessere Ergebnisse zu
erzielen werden Objekte der Szene in Gruppen zusammengefasst und für
jede Gruppe eine separate Deep Shadow Map berechnet.
Die beschriebene Implementierung unterstützt neben Spot-Lichtquellen
auch omnidirektionale Lichtquellen. Des weiteren werden zwei
verschiedene Methoden beschrieben, wie Deep Shadow Maps auf
CUDA-gerechte Weise abgespeichert werden.
Auf aktueller Hardware können Schatten in Szenen, bestehend aus
mehreren volumetrischen Objekten sowie polygonaler Geometrie, mit
interaktiven Frameraten berechnet werden.
|
| Thu, Jan 20 |
13:15 |
Katharina Schiffl |
Bestimmung von Hominoidsegmenten aus 3D-Bodyscannerdaten
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Arnold Baca
—
In verschiedenen Bereichen der Sportwissenschaft, der Forschung aber auch
in Computerspielen werden zur Analyse und Simulation der menschlichen
Bewegung Modelle des menschlichen Körpers eingesetzt. Diese Körpermodelle
variieren je nach Einsatzzweck an Detailliertheit und Genauigkeit. Soll ein
Modell eines realen Menschen erstellt werden, muss eine – meist händische –
Datenaufnahme erfolgen, welche aufwändig ist und eine Reihe von
Fehlerquellen enthalten kann. Eines dieser Modelle, das Hominoid von Hatze,
steht im Mittelpunkt dieser Arbeit. Es ist ein anthropomorphes Körpermodell,
das den menschlichen Körper in 17 Segmente unterteilt. Diese Arbeit
untersucht die Verwendung eines 3D-Bodyscanners zur automatischen
Unterteilung von Scandaten in diese 17 Segmente. Eine Scanvorschrift und
eine Reihe von Algorithmen werden entwickelt, die die Aufnahme von
Körpermaßen und somit die Berechnung der Segmentparameterwerte für
Simulationen von menschlichen Bewegungsabläufen beschleunigen. Diese
Parameterwerte können dann in Bereichen wie Sport, Orthopädie und Medizin
eingesetzt werden. Ein weiterer Teil beschäftigt sich mit der Genauigkeit
des zur Verfügung stehenden Scanners (Vitronic VITUS smart 3D-Bodyscanner).
Dazu werden grundsätzliche Fehlerquellen, wie Scanlinienbreite, Scanlöcher
und Ausreißer diskutiert und deren Einfluss berechnet. Tests mit
verschiedenen Personen und der Vergleich der Resultate mit händischen
Messungen werden schlussendlich die Performance und Wiederholbarkeit zeigen.
|
Q4/2010 Talks
| Date |
Time |
By |
Topic |
| Thu, Oct 14 |
13:15 |
Dalibor Mitrovic |
Scene Segmentation in Artistic Archive Documentaries
—
15 Minuten Talk + 5 Minuten Diskussion
—
Scene segmentation is a crucial task in the structural analysis of film. State-of-the-art scene segmentation algorithms usually target fiction films (e.g. Hollywood films). Documentaries (especially artistic archive documentaries) follow different montage rules than fiction films and consequently require specialized approaches for scene segmentation. We propose a scene segmentation algorithm targeted at artistic archive documentaries. We evaluate the performance of our technique with archive documentaries and contemporary movies and obtain satisfactory results in both domains.
|
| Thu, Oct 14 |
13:15 |
Vicki Nake |
Stereobildmaterial – Aufnahme und Konvertierung
—
1. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Florian Seitner
—
Im Rahmen dieser Magisterarbeit werden mit Hilfe eines Stereo-Setups kurze Video-Sequenzen aufgenommen und diese daraufhin mit einer Stereokonvertierungssoftware bearbeitet. Aus verschiedenen Aufnahmen wird eine Test-Videosequenz zusammengestellt. Dabei wird zunächst ein Vergleich unterschiedlicher Setups angestellt, um danach Vorteile und Mängel an Setup und Software zu evaluieren. Es folgt die Erstellung einer automatischen Scene Cut Detection, wobei unterschiedliche Verfahren implementiert werden, um danach das Verfahren (bzw. eine Kombination) mit der größten Effizienz in die Stereokonvertierungssoftware zu integrieren. Weiters wird ein Programm zur Auffindung der minimalen/maximalen Disparity Range eines Bilderpaares implementiert. Nach einem theoretischen Teil über Rectification und Stereo Matching wird schließlich ausführlich auf die Ergebnisse der Arbeit eingegangen.
|
| Thu, Oct 14 |
13:15 |
Katharina Schiffl |
Bestimmung von Hominoidsegmenten aus 3D- Bodyscannerdaten
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Arnold Baca
—
Das Hominoid von Hatze (1980) ist ein mathematisches Modell des menschlichen Körpers, das aus 17 Segmenten besteht. Üblicherweise werden die mechanischen Parameterwerte dieser Segmente aus 242 Messdaten berechnet, die direkt am Körper des Probanden vermessen werden. Die 17 Segmente werden dazu in weitere geometrische Körper zerlegt, aus denen dann die Daten für das finale Modell ermittelt werden. Im Rahmen dieser Diplomarbeit soll untersucht werden, ob die Unterteilung in die 17 Ausgangssegmente mit Hilfe eines 3D-BodyScanners automatisch durchgeführt werden kann. Dabei stellt sich die Frage, ob die Genauigkeit und Reproduzierbarkeit der Scannerdaten für wissenschaftliche Untersuchungen ausreichend ist. Die Daten für die Berechnung der Segmente des Hominoids, deren Koordinaten, Masse etc., werden derzeit händisch ermittelt bzw. es wird stets manuelle Unterstützung benötigt. Mit Hilfe eines VITUS Vitronic BodyScanners und einer passenden Software zum Verarbeiten des BodyScannerOutputs soll der Zeitaufwand zur Unterteilung des untersuchten Körpers in die 17 Segmente drastisch gesenkt werden.
|
| Thu, Oct 7 |
13:15 |
Wolfgang Morgenbesser |
Spracherkennung mit mobilen Endgeräten
—
2. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger
—
Im Rahmen dieser Diplomarbeit wurde das Ziel gesteckt, mittels einfacher und effizienter Algorithmen ein zuverlässiges, wortisoliertes Spracherkennungssystem für den mobilen Anwendungsgebrauch zu schaffen. Dabei wurden insbesondere die limitierenden Faktoren dieser Betriebsumgebung wie mobiler Einsatz, leistungsschwache Prozessoren, begrenzte Softwarerechte und Softwareschnittstellen berücksichtigt. Zuerst wurden in der Theorie die Grundlagen der Spracherkennung mittels Literaturrecherche erarbeitet und bekannte und optimierte Verfahren beleuchtet. In Folge wurde beginnend bei der Spracherfassung das zu entwickelnde System Schritt für Schritt geplant und implementiert. Durch praktische Tests wurden einzelne Algorithmen miteinander verglichen und die für das Zielsystem geeigneten Prozesse übernommen. Das Spracherkennungssystem wurde als Java ME Applikation für das Nokia N71 Mobiltelefon mit Symbian OS 9.1 als Betriebssystem und Series 60 3rd Edition (Version 3.0) als Benutzeroberfläche entwickelt und getestet.
|
| Thu, Oct 7 |
13:15 |
Simone Arnberger |
Die Bedeutung von Alpha-Matting für die Darstellung von Bildern auf 3D Bildschirmen: eine Benutzerstudie
—
1. Diplomarbeitspräsentation;
Betreuer: Christoph Rhemann
—
Die Popularität von 3D-Videos ist erst kürzlich mit dem Wunsch der Benutzer nach einem erweiterten, visuellen Wahrnehmungserlebnis signifikant angestiegen. Das vermehrte Angebot an 3D-Inhalten, hat nicht nur eine Aufrüstung der Kinos mit sich gebracht, sondern ist auch der Grundstein für den Einzug der 3D-Technologie in die Wohnzimmer der Benutzer. Zurzeit gibt es jedoch viele verschiedene 3D-Video Formate, die meistens mit spezifischen 3D-Bildschirm Systemen zusammenhängen. Problematisch ist außerdem, dass es bei den synthetischen Ansichten eines 3D-Videos auf Grund der gemischten Farben an den Rändern von Objekten zu Artefakten kommt, da sich Vorder- und Hintergrund unterschiedlich stark verschieben. Vor kurzem wurde mit der Erarbeitung eines neuen MPEG-Standards begonnen, der jedoch bei der Generierung von synthetischen Ansichten keine Transparenzinformation in Form einer Alpha-Matte einbezieht. Mit „Stereo-Matching“ – also der Integration Alpha-Matting-Information in den Stereo-Algorithmus – konnte bereits gezeigt werden, dass diese Kombination für die Ergebnisse beider Bereiche vorteilhaft ist. Es wird erwartet, dass sich die Berücksichtigung von Alpha-Matting bei der Generierung von synthetischen Ansichten, in denen es zu einer Vermischung von Vorder- und Hintergrund kommt, positiv auswirkt. Ziel dieser Diplomarbeit ist es mit Hilfe einer Benutzerstudie zu untersuchen, ob und in welchem Ausmaß das Einbeziehen von Alpha-Matting in den Prozess die 3D-Bildqualität verbessern kann.
|
Q2/2010 Talks
| Date |
Time |
By |
Topic |
| Thu, May 27 |
13:15 |
Markus Seidl |
A Unified Approach for the Detection of Gradual Transitions in Historic Material
—
1. Diplomarbeitspräsentation;
Betreuer: Matthias Zeppelzauer
—
This master thesis deals with the problem of the detection of gradual transitions in historic movies. The footage we use is from the soviet film maker Dziga Vertov. The historic material is different from contemporary material in technical quality (degraded contrasts, flickering, scratches, fungus etc.) and in editing (different styles and lengths of transitions, etc.). The knowledge of the temporal location of the shot boundaries in a movie is important for the analysis of the style of filmmaking of a certain director. Furthermore, the first step in automated content based analysis of video or film material is the detection of shot boundaries. This is an active research topic, and is seen as solved for the easiest to detect type of transitions, the cut. The detection of gradual transitions still is a field for many different approaches. These approaches aim at the detection of gradual transitions in contemporary material. To our knowledge no research about the detection of gradual transitions in historic material has been published so far. The steps towards successful shot boundary detection are a) selection and extraction of appropriate features, b) construction of the continuity signal, c) classification of the frames and d) post processing for verification. In the case of detection of gradual transitions the research focuses on two types of approaches: Unified approaches, i.e. one detector for all gradual transition types, and approaches that use specialized detectors for each gradual transition type. In this master thesis we give an extensive literature research and propose a unified approach for the detection of gradual transitions in historic material. In the experimental study we evaluate our approach against annotated Vertov footage as well as annotated contemporary material from the shot boundary detection task of the TRECVid evaluation. Our experiments show, that our approach is valid for historic material as well as contemporary material. We observe that the historic material requires the use of texture features in contrast to the contemporary material that in most of the cases requires the use of colour and luminance features. We verify that the main problem for gradual transition detection is motion which causes a continuity signal change comparable to the signal of a gradual transition.
|
| Thu, May 27 |
13:15 |
Dominik Lepiz |
Visual Information Retrieval: Automatisierte Klassifikation von Snowboardclips
—
2. Diplomarbeitspräsentation;
Betreuer: Dalibor Mitrovic
—
Practical snowboard instructor training is an iterative process divided into two steps. In the first step, the future snowboard instructors are recorded on video performing on the slope. In the second step, these video recordings are analyzed and discussed with the focus on possible improvements of the future instructor’s personal snowboarding style. The future instructors then try to apply the improvements in the next iteration of the first step. This thesis presents a way of adequately supporting the second step by content-based classification and retrieval of snowboard videoclips. The theory of snowboarding defines several turn types which differ in severtity and are practiced step-by-step. Because rhythm and speed are the two main characteristics of different turn types, this thesis explores the feasibility to measure them via motion-detection and investigates how to deal with disturbing factors like camera shaking. The proposed method uses the output of optical flow analysis to compute the duration between two turns and the speed of the turn to classify the types of turns. The audience in theoretical snowboard lessons is ususally bigger than one person, but everyone needs individual feedback during analysis. As a result it is very important for trainers to be able to quickly present appropriate video samples - either from the same or from another person. This personalized feedback motivates the second presented method in this thesis. This method employs an established color analysis technique to distinguish which person is shown in the videoclips. The method enables trainers to select individual videoclips for presentation. In order to evaluate the acquired techniques and developed methods, they are applied on a manually generated test-set of videoclips which were recorded during several days of training by this thesis’ author. Turn type classification yields good results in computing the average number of frames between two shifts in direction (wide driven carving turns versus fast moving short turns) so 85% percent of videoclips are classified correctly (65% even clearly). The distinction of videoclips based on depicted persons is highly dependent on scenery and illumination, which disturbs classification results because color-matching fails (classification error-rate rises linearly with the number of analyzed videoclips).
|
| Mon, May 10 |
11:00 |
Michael Bleyer |
Does Color Really Help in Dense Stereo Matching?
—
Test Talk,
3DPVT 2010
—
This paper investigates the role of color in global stereo matching approaches. In our evaluation study, we build various energy functions by combining nine color spaces with four dissimilarity functions and test their performance on 30 ground truth stereo pairs. Our experiments start by computing the matching scores via the absolute difference of color values. As is consistent with previous studies, we observe that color-based matching clearly outperforms grey-scale matching. However, our key observation is that this improvement largely stems from considerably improved performance in radiometric distorted regions, i.e. regions where corresponding pixels have different intensities/colors in the two input images, which is e.g. caused by illumination variations. Hence, we claim that color basically serves the same purpose as radiometric insensitive measures, namely to reduce matching errors in radiometric distorted image areas. However, the important difference is that radiometric insensitive measures are considerably superior in this respect, which we demonstrate by using Mutual Information, ZNCC and Census as dissimilarity functions in our experiments. Interestingly, we observe that for these dissimilarity functions color even has a negative effect. Therefore, our suggestion is to not use color at all, but radiometric insensitive measures on grey-scale images, also on images where radiometric distortions seem to be very small.
|
| Mon, May 10 |
11:00 |
Asmaa Hosni |
Near Real-Time Stereo With Adaptive Support Weight Approaches
—
Test Talk,
3DPVT 2010
—
Algorithms based on the adaptive support weight strategy currently represent the state-of-the-art in local stereo matching. Unfortunately, their good-quality results come at the price of high computation times: As opposed to standard local algorithms, incremental computation via sliding windows is not applicable for adaptive support weight windows. This paper presents a method for considerably speeding up computation times of these methods. The key idea is to exploit the adaptive support weight windows for generating an explicit over-segmentation of the reference image in a fast way. Having this explicit segmentation, we can take advantage of a modified "segmentation-based" sliding window technique, which makes run time independent of the window size. In particular, we demonstrate our transformation scheme for the geodesic stereo matcher of \cite{Hosni09} that has recently produced excellent results. Our unoptimized GPU-based implementation processes 320x240 pixel images with 26 allowed disparities at 10 frames per second and achieves rank 32 out of 74 methods in the Middlebury online benchmark.
|
| Thu, May 5 |
13:15 |
Markus Hörhan |
Automatische Erkennung von Gewaltszenen in Filmen
—
1. Diplomarbeitspräsentation;
Betreuer: Horst Eidenberger
—
The news very often reports about the bad influence that violence in movies has on children and young persons. Sometimes there are specialists in film industry who are looking for such violent scenes and censoring them. This is a time consuming task and therefore an automatic process would be nice. A computer program which solves this task in a fully automated fashion is imaginable in the moment because there are many different forms of violence and people have different opinions on whether a film scene is violent or not. In this work a method is proposed to classify film scenes as either containing or not containing violent content in a computer assisted manner. For this reason it is necessary to extract features which are characteristic for violent scenes. An adequate classifier splits the film scenes in violent and nonviolent scenes with respect to the chosen features. The program's output should be all the time spans in the observed film containing violence. Matlab is used for the implementation of the prototype because it has many methods to handle complex video- and audio processing. The relatively long time to process some calculation tasks in Matlab is not important because the final program is only a prototype.
|
| Thu, Apr 29 |
13:15 |
Jürgen Kogler |
Silicon Retina-basierte Stereo Algorithmik
Die Silicon Retina ist ein neuer Typ von Sensor und ist in seiner Funktionsweise dem menschlichen Auge nachempfunden. Konventionelle Kameras erfassen ein Bild mit einer definierten Bildwiederholrate und liefern die Pixelinformationen des kompletten Sensors. Bei einer Silicon Retina wird nur dann Information generiert, wenn eine Änderung in der Szene stattfindet, sprich eine Helligkeitsänderung in positiver bzw. negativer Richtung auftritt. Diese sogenannten „Events“ senden Ihre Adresse, Polarität und Zeitpunkt des Auftretens unabhängig voneinander.
State-of-the-Art Flächen- und Feature-basierte Stereo Matching Algorithmen schöpfen die gebotenen Möglichkeiten der Silicon Retina Technologie nur in unzureichendem Maße aus. Kommen diese zum Einsatz, sind entsprechende Vorverarbeitungsschritte unumgänglich, die die Potenziale der Silicon Retina stark verringern. Aus diesem Grund werden neuartige Stereo Matching Ansätze entwickelt und evaluiert, welche die Vorteile dieses Sensors nutzen können.
|
| Thu, Apr 29 |
13:15 |
Rainer Planinc |
Modeling Sources and Sinks in Crowded Scenes by Clustering Trajectory Points Obtained by Video-based Particle Advection
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Norbert Brändle
—
This diploma thesis provides solutions to analyze dense crowded scenes in real-time, a still challenging research topic of visual surveillance. A real-time algorithm traces particles with the help of optical flow calculated between two consecutive frames, thus avoiding using individual people tracking. Analyzing sources and sinks of observed scenes can provide clues to semantic scene analysis. Sources and sinks are modeled by clustering trajectory start and end points. This thesis evaluates different clustering algorithms and their practicability in combination with a real-time particle advection algorithm on benchmark data.
|
| Thu, Apr 22 |
13:15 |
Andreas Regner |
Neue Kameraperspektiven bei TV-Sportübertragungen
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz
—
In dieser Diplomarbeit wurde nach Wegen gesucht, TV-Sportübertragungen für den Zuseher attraktiver zu gestalten. Zu diesem Zweck beschäftigt sich die Arbeit zunächst mit den drei wichtigen Bereichen Film, Fernsehen und Live-Übertragungen, um mit Hilfe der Literatur und eigener Analysen herauszufinden, welche Kameraeinstellungen und zugehörige Hilfsmittel diese auszeichnen. Dadurch sollten wichtige Aspekte der Kameraführung erkannt und daraus abgeleitete Anwendungsmöglichkeiten für TV-Sportübertragungen identifiziert werden. Im praktischen Teil der Arbeit wurden Versuche mit Miniatur-Funkkameras durchgeführt, welche an Sportlern während der Ausübung einer Mannschaftssportart befestigt waren. Das Ziel war, Erkenntnisse bezüglich sinnvoller Aufnahmekonfigurationen bei den untersuchten Sportszenen zu gewinnen, wobei besonderes Augenmerk auf die immersive Wirkung bzw. das interaktive Erleben seitens des Betrachters gelegt wurde.
|
| Thu, Apr 22 |
13:15 |
Markus Autengruber |
A Vision-Based System for the Detection of Fingertips and Evaluation of Multi-Touch Events on a Variable and Dynamic Interactive Surface
—
1. Diplomarbeitspräsentation;
Betreuer: Michael Mehling, Hannes Kaufmann
—
A Vision-Based System for the Detection of Fingertips and Evaluation of Multi-Touch Events on a Variable and Dynamic Interactive Surface Multi-touch interaction on tabletop surfaces has become a major trend in humancomputer interaction (HCI) research over the past years. As currently available systems are usually based on special touch-sensitive hardware, which is relatively expensive to build, limited to a certain size and inconvenient to use when operating large interactive surfaces, a lack of scalability and portability can be observed. Therefore, a vision-based system is presented, which exclusively relies on cheap and easy-to-handle video cameras and which should provide competitive results in comparison to common approaches. The detection of fingertips for further multi-touch event evaluation is performed by a combination of computer vision and image processing algorithms while the interactive surface may be variable in its size and moved around dynamically during its usage.
|
Q1/2010 Talks
| Date |
Time |
By |
Topic |
| Thu, Mar 25 |
13:15 |
Lambert Frey |
Ein relationales Framework zur Verwaltung von videobasierten Trajektorien
—
2. Diplomarbeitspräsentation;
Betreuer: Margrit Gelautz, Norbert Brändle
—
Um Bewegungsmuster in Videoaufzeichnungen analysieren zu können, ist es notwendig viele Einzelbewegungen, die Trajektorien, zu untersuchen. Dabei fallen große Mengen an raum-zeitlichen Daten an, die in einer geeigneten Form gespeichert werden müssen. Ziel dieser Arbeit ist es eine Repräsentation von Trajektorien in einer Datenbank zu entwerfen und Funktionen zu implementieren, die eine Selektion von raum-zeitlichen Bereichen erlauben und Distanzen zwischen Trajektorien berechnen können. Eine Laufzeitevaluierung zeigt den Performancevorteil dieser Datenbank gegenüber der Speicherung in Textdateien.
|
| Thu, Mar 18 |
13:15 |
Wolfgang Knecht |
Anti-aliased Deep Shadow Maps for multiple volumes and geometry using CUDA
—
1. Diplomarbeitspräsentation
—
In der Computer Graphik sind Schatten sehr wichtig um den Realismus von 3D Szenen zu erhöhen. Herkömmliche Schattenalgorithmen sind allerdings nicht in der Lage auch Schatten für sehr feine Geometrie wie Haare oder halbtransparente volumetrische Objekte wie etwa Rauch in gewünschter Qualität zu generieren. In dieser Diplomarbeit werden Deep Shadow Maps mittels CUDA von nVidia implementiert. Weiters werden "Clustered Deep Shadow Maps" eingeführt. Dabei wird für eine Lichtquelle nicht wie gewöhnlich nur eine Deep Shadow Map erzeugt sondern mehrere, jeweils eine für mehrere zusammengefasste Objekte, wodurch diese die gesamte Auflösung der Deep Shadow Maps ausnutzen können. Zum einen soll es dadurch möglich sein hochqualitative Schatten von volumetrischen Objekten auf polygonale Geometrie und umgekehrt zu werfen und zum anderen sollen diese Schatten dank Hardwareunterstützung sehr schnell generiert werden.
|
| Thu, Mar 11 |
13:15 |
Mathis Csisinko |
VITAL - The Virtual Environment Interaction Technique Abstraction Layer
—
Testtalk
—
Traditionally 3D interaction techniques (3DITs) are implemented in VR
applications in a proprietary way on specific target platforms. Mixing
3DIT specific code with application code neither allows for reusability
in other applications nor for exchanging 3DITs in a comfortable and
flexible way. We propose an additional system software layer called
Virtual Environment Interaction Technique Abstraction Layer (VITAL)
targeted on platform and application independent (portable) 3DIT
implementation. We describe the underlying concepts and provide details
on how to integrate VITAL in VR frameworks. Furthermore, development
mechanisms targeted on portability and general-purpose interfacing
techniques with other system components are outlined and demonstrated in
examples.
|
| Thu, Mar 11 |
13:15 |
Andreas Regner |
Neue Kameraperspektiven bei TV Sportübertragungen
—
1. Diplomarbeitspräsentation
—
Diese Diplomarbeit beschäftigt sich mit der Problematik, wie man TV
Sportübertragungen für den Zuseher noch attraktiver gestalten kann und wie
man ihm das Geschehen näher bringen könnte. Film und Fernsehen schaffen es
auf eine eigene Weise dem Beobachter Spannung und Dramatik zu vermitteln.
Diese bedienen sich dazu eigener Kamerapositionierungen und verwenden
bestimmte Kamerawinkel. Diese Arbeit versucht herauszufinden, was die drei
großen Gebiete Film, Fernsehen und Live Übertragung auszeichnet. Mit den
Erkenntnissen sollen neue Ansätze für TV Sportübertragungen gefunden werden.
Im praktischen Teil werden Versuche mit Miniatur Funkkameras durchgeführt.
Diese sind an Sportlern, während der Ausübung einer Mannschaftssportart,
befestigt. Mit ihnen sollen Aufnahmen aus einer neuen Perspektive und einer
zuvor nicht möglichen Position entstehen.
|
| Thu, Feb 25 |
13:15 |
Wolfgang Jungmayer |
Feature Selection in Audio
—
Seminar Work
—
Audio features play an important part in the analysis and classification of signals. In this paper the complete process of a signal classification is explained, with the focus lying on the selection of relevant features for a given problem. Corresponding feature selection methods are presented and assessed. Different uses and problem definitions concerning the application of audio features are mentioned, too. Also presented are state-of-the-art algorithms, each of which has the goal to create an optimal set of features, which ultimately delivers a good performance in the subsequent classification.
|
| Thu, Feb 18 |
13:15 |
Annette Mossel |
Real-time Tunneling Measurement based on an Infrared Optical Tracker (RTMIOT)
—
Test Talk WARM'10
—
In this talk a system to perform tunneling measurement in real time based on optical infrared tracking is presented. This stereo measurement system will be able to track and determine the 3D-coordinates of several static as well as moving optical targets in real time and can be used to measure and monitor the tunnel advance. Our system is the first step towards the future goal of automated positioning and control of construction vehicles.
|
| Thu, Feb 18 |
13:15 |
Ferdinand Pilz |
MINT (Multimodal Interaction on Tabletops)
—
Test Talk WARM'10
|
| Thu, Feb 11 |
13:15 |
Christoph Rhemann |
Interactive Image Matting
—
PhD defense test talk
—
Image matting aims to extract a foreground object from a single natural image by recovering the partial transparency and corresponding color of the foreground object at each pixel in the image. The resulting transparency map is thereby denoted as alpha matte. The matting problem is severely ill posed, and in this thesis we focus on matting approaches that utilize user interaction to make the problem tractable.
There are three fundamental challenges in interactive image matting research that are addressed in this thesis: (i) Providing a fast and intuitive user interface; (ii) finding a good cost function for matting; and (iii) providing a benchmark that allows a quantitative comparison of matting results.
In most previous approaches the user interacts with the algorithm by drawing an accurate trimap, which is a partition of the image into foreground, background and unknown regions. An accurate trimap is very tedious to create manually, hence we follow recent work and aim to automatically generate a trimap from very little user input. The novelty of our approach lies in a new cost function that describes the goodness of a trimap solution. Our cost function considers several image cues and incorporates four different types of priors that are used to regularize the result. We show that our method is fast and produces accurate results.
This thesis also addresses the problem of extracting an alpha matte from a single photograph, given a trimap. We improve on previous image matting approaches by assuming that the majority of partial transparencies are induced by the imaging process. Hence we exploit a model where alpha is the convolution of a binary segmentation with the camera's point spread function. Based on this model, we propose new matting algorithms that generate high-quality results even for images where our assumption is not met completely.
Finally, we introduce a new benchmark-test for image matting that enables a quantitative comparison of matting results. Our contributions are (i) a challenging, high-quality ground truth test set that builds the basis of our evaluation; (ii) a dynamic online benchmark system that allows other researchers to interactively analyze recent matting work and to complement the evaluation with new results; and (iii) perceptually motivated error metrics for image matting. We use this benchmark to confirm that our proposed matting algorithms outperform the current state-of-the-art.
|
| Thu, Jan 28 |
13:15 |
Chris Lendl Mario Habenbacher |
ESEL: Electronic Student Equipment Loaning
—
Praktikumsvorstellung
—
Viele Lehrveranstaltungen bieten den Studenten die Möglichkeit an, für die Absolvierung der gestellten Aufgaben Equipment auszuleihen. Derzeit erfolgt der Verleih dieses Equipments größtenteils über Papier-Listen, per E-Mail oder direkten Kontakt am Institut. Dies stellt einen großen Aufwand an die Betreuer und Tutoren der Lehrveranstaltung dar. Im Zuge eines Praktikums wurde ein elektronisches Verleih-System entwickelt, mit dessen Hilfe der gesamte Ablauf von der Reservierung bis zum Verleih elektronisch abgewickelt werden kann. Die Studenten können mit Hilfe eines Online-Systems ihr gewünschtes Equipment aussuchen und reservieren. Das Handling der Reservierungen erfolgt komplett durch das System, welches eine erhebliche Erleichterung für die Betreuer darstellt und ihnen ermöglicht, sich auf wesentlichere Dinge in der Betreuung der Studenten zu konzentrieren.
|
| Thu, Jan 28 |
13:15 |
Asmaa Hosni |
Geodesic Adaptive Support Weight Approach For Local Stereo Matching
—
Test Talk Computer Vision Winter Workshop
—
Local stereo matching has recently experienced large
progress by the introduction of new support aggregation
schemes. These approaches estimate a pixel’s support region
via color segmentation. Our contribution lies in an improved
method for accomplishing this segmentation. Inside a square
support window, we compute the geodesic distance from all
pixels to the window’s center pixel. Pixels of low geodesic
distance are given high support weights and therefore large
influence in the matching process. In contrast to previous
work, we enforce connectivity by using the geodesic distance
transform. For obtaining a high support weight, a pixel must
have a path to the center point along which the color does not
change significantly. This connectivity property leads to improved
segmentation results and consequently to improved
disparity maps. The success of our geodesic approach is
demonstrated on the Middlebury images. According to the
Middlebury benchmark, the proposed algorithm is the top
performer among local stereo methods at the current state-of-the-art.
|
| Thu, Jan 21 |
13:15 |
Johannes Spreitzer |
Programmierung von Multimediasensoren für mobile Informationsszenarien
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Horst Eidenberger
—
This thesis deals with software development and media processing on mobile
handsets running the Android operating system. It is centered round a
practical project, which aims to develop a program that continually tracks
and saves the device's location. Furthermore the program should implement a
stepcounter and make it possible to create panoramaphotos. Additionally it
should display all the collected data in an appropriate manner.
At the outset the Android system with its basic concepts is introduced and
the additional technologies drawn upon in the project are elaborated. These
technologies include GPS-tracking, accelerometer-sensors, panorama-stitching
and visualization-techniques as they come into operation on the mobile
handset as well as on the web. Finally the practical project is modeled
using graphical UML-diagrams and implemented, with the results achieved
being discussed.
|
| Thu, Jan 14 |
13:15 |
Markus Seidl |
A Unified Approach for the Detection of Gradual Transitions in Historic Material
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Christian Breiteneder, Matthias Zeppelzauer
—
This master thesis deals with the problem of the detection of gradual transitions in historic movies. The footage we use is from the soviet film maker Dziga Vertov. The historic material is different from contemporary material in technical quality (degraded contrasts, flickering, scratches, fungus etc.) and in editing (different styles and lengths of transitions, etc.).
The knowledge of the temporal location of the shot boundaries in a movie is important for the analysis of the style of filmmaking of a certain director. Furthermore, the first step in automated content based analysis of video or film material is the detection of shot boundaries.
This is an active research topic, and is seen as solved for the easiest to detect type of transitions, the cut. The detection of gradual transitions still is a field for many different approaches. These approaches aim at the detection of gradual transitions in contemporary material. To our knowledge no research about the detection of gradual transitions in historic material has been published so far.
The steps towards successful shot boundary detection are a) selection and extraction of appropriate features, b) construction of the continuity signal, c) classification of the frames and d) post processing for verification. In the case of detection of gradual transitions the research focuses on two types of approaches: Unified approaches, i.e. one detector for all gradual transition types, and approaches that use specialized detectors for each gradual transition type.
In this master thesis we give an extensive literature research and propose a unified approach for the detection of gradual transitions in historic material. In the experimental study we evaluate our approach against annotated Vertov footage as well as annotated contemporary material from the shot boundary detection task of the TRECVid evaluation.
Our experiments show, that our approach is valid for historic material as well as contemporary material. We observe that the historic material requires the use of texture features in contrast to the contemporary material that in most of the cases requires the use of colour and luminance features. We verify that the main problem for gradual transition detection is motion which causes a continuity signal change comparable to the signal of a gradual transition.
|
Q4/2009 Talks
| Date |
Time |
By |
Topic |
| Thu, Dec 10 |
13:15 |
Johannes Spreitzer |
Programmierung von Multimediasensoren für mobile Informationsszenarien
—
1. Diplomarbeitspräsentation
—
Diese Arbeit beschäftigt sich mit der Software-Entwicklung und Medienverarbeitung auf mobilen Endgeräten unter dem Betriebssystem Android. Neben der Applikationsentwicklung und der Programmierung von zusätzlich in einem aktuellen Mobiltelefon verbauten Technologien wie Beschleunigungs- oder GPS-Sensoren, soll ein Teil auf die Medienverarbeitung innerhalb von Android fallen. Es sollen Methoden gefunden werden, Panoramafotos durch einfaches "Drüberziehen der Kamera" zu erstellen. Weiters sollen die Fotos und GPS-Daten direkt vom Endgerät aus ins Internet geladen und dort in geeigneter Weise visualisiert werden können.
|
| Thu, Dec 10 |
13:15 |
Lambert Frey |
Effiziente Speicherung von Trajektorien
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Margrit Gelautz, Norbert Brändle
—
Bei der Arbeit mit Trajektorien fallen schnell große Datenmengen, die sowohl zeitliche als auch räumliche Informationen beinhalten, an. Der Mangel an effizienten Speichermethoden für Bewegungsdaten ist vor allem bei Anwendungen, die diese Daten einlesen und verarbeiten, ein Problem. Werden die Trajektorien in simplen Textdateien abgelegt, so gibt es keine Möglichkeit, gezielt auf bestimmte Daten zuzugreifen. Diese Arbeit soll einen Überblick über die Möglichkeiten zur Speicherung in Datenbanken bieten. Wichtig ist hierbei vor allem die Abfragemöglichkeit nach bestimmten Vorgaben, die sowohl die zeitliche als auch die räumliche Dimension betreffen können. Es soll zum Beispiel möglich sein, Trajektorien zu selektieren, die sich innerhalb einer gewissen Distanz zu einem vorgegeben Pfad befinden. Dazu ist es notwendig eine Methode zur Berechnung der Distanz zwischen Trajektorien zu definieren. Verschiedene Ansätze zu dieser Berechnung sollen vorgestellt werden.
|
| Thu, Dec 3 |
13:15 |
Rudolf Melcher |
Beyond Screens - A device-independent interaction paradigm for integrated pos-desktop environments
—
PhD thesis presentation
—
We identify and discuss an often neglected hurdle of individual’s IT infrastructures - the device and application dependence - and show that there is strong evidence for this hurdle viewed from several research perspectives. Our core hypothesis is that today’s infrastructures are no longer comprehensible and manageable by individual users. Thus, the full potential of the technology used by individuals is not leveraged. We argue for the need of a new approach which conceptually and cognitively unifies all types of technically mediated workspaces in terms of digital artifact use. As a consequence, we suggest and specify a conceptual architectural framework aiming to consistently resolve this issue.
In the first place we try to specify persistent and consistent user-centered techniques, which allow individuals to manage their artifact collections regardless of the specific devices and applications they are using. To achieve this, we build an architectural layer called SubFrame challenging the current file handling mechanisms. On this basis we demand persistent user-centered topologies for virtual artifacts to be rendered in all types of mediated work spaces, called ActionSpaces. Given both are realized we may see a lot of new possibilities in artifact handling better fitting cognitive capabilities and needs of the users. To many HCI fellows the idea to design a device-independent interaction paradigm seems infeasible. We will try to explain why and how it might be possible. By the “normative force of our own reasoning”, we consider our approach unavoidable and expect it to "revolutionize" common thinking about computing and interaction. In the long run, it may result in a paradigm shift towards genuine user-centeredness. But of course, there may be other possibilities to keep "pace" with the growing heterogeneity of user infrastructures - a discussion we want to provoke!
|
| Thu, Nov 5 |
13:15 |
Stefan Hartlieb |
Segmentation von Szenen in historischen Dokumentarfilmen
—
Diploma thesis presentation
—
Szenensegmentation beschäftigt sich mit der Unterteilung eines Films in voneinander getrennte Einheiten. Gängige Algorithmen zur Segmentation eines Films in Szenen verwenden Eigenschaften, die in historischen Dokumentarfilmen entweder aus filmkompositions oder aus technischen Gründen nicht vorhanden sind. Die Arbeit stellt eine Implementation vor, der speziell für dieses Filmmaterial entwickelt wurde.
Bei der Szenensegmentation wird als erstes eine Schnitterkennung durchgeführt. Die dabei gefundenen Shots werden anhand eines Keyframes und Bildmerkmalen miteinander verglichen. Zwei Shots, die innerhalb einer gewissen Zeitspanne liegen, und ein Maß an Ähnlichkeit übersteigen, gehören, sowie auch die dazwischen liegenden Shots, zu einer Szene. Die Merkmale, die im Algorithmus für den Vergleich verwendet werden sind SIFT Keypoints, „Edge Change Ratio“ und blockbasierte Histogramme.
Durch das Finden von ähnlichen Shots entstehen Kernszenen mit dazwischen liegenden losen Bereichen (d.h. Shots, die noch keiner Szene zugeordnet wurden). Die losen Bereiche werden durch das rekursive Herabsetzen der Schwellwerte für die einzelnen Ähnlichkeitsmerkmale zugewiesen.
Ein weiterer Teil der Arbeit ist die Überprüfung der Merkmale mit verschiedenen Schwellwerten und so ihre Güte feststellen zu können. Die Güte definiert sich aus dem Verhältnis von fälschlich mit korrekt als Ähnlich klassifizierten Shots. Auch wird überprüft, wie weit die Auswahl des Keyframes Einfluss auf das Ergebnis hat.
Um eine vollständige Verifikation der Implementation durchführen zu können wurde der Algorithmus außer mit historischen Dokumentarfilmen auch mit „modernen“ Filmen getestet. Dies ermöglicht einerseits die Überprüfung der Implementation nach der Aufgabenstellung und anderseits einen Vergleich mit den in der Literatur vorgestellten Methoden.
|
| Thu, Oct 15 |
13:15 |
Rainer Planic |
Modeling Sources and Sinks in Crowded Scenes by Clustering Trajectory Points Obtained by Particle Advection
—
Diploma thesis presentation
—
Individuelles Tracking in Menschenmengen stößt an seine Grenzen, sobald die Menschenmenge zu dicht wird. Ein Lösungsansatz besteht darin, die Menschenmenge mit Hilfe von Partikeln zu modellieren, welche auf Grund des optischen Flusses zwischen zwei aufeinanderfolgenden Videoframes bewegt werden (Partikeladvektion). Auf diese Weise ist es möglich, aus Flusspartikeln Trajektorien zu generieren. Quellen und Senken von Personenflüssen wie zum Beispiel Türen, Stiegenhäuser oder Stellen, an denen der Aufnahmebereich der Kamera betreten oder verlassen wird, werden durch Weiterverarbeitung der Trajektorien modelliert.
Ziel dieser Diplomarbeit ist die Optimierung der Trajektoriengewinnung mittels eines hierarchischen Verfahrens sowie die Modellierung der Quellen und Senken mittels geeigneter Clusterverfahren. Das erhaltene Wissen über Quellen und Senken dient dabei als Feedbackinformation zur zusätzlichen Verbesserung der Qualität der Trajektoriengewinnung.
|
Q3/2009 Talks
| Date |
Time |
By |
Topic |
| Thu, Sep 24 |
13:15 |
Matthias Zeppelzauer |
Feature Selection in Environmental Sound Recognition
—
Test talk,
15 min
—
Given a broad set of content-based audio features, we employ principal component analysis for the composition of an optimal feature set for environmental sounds. We select features based on quantitative data analysis (factor analysis) and conduct retrieval experiments to evaluate the quality of the feature combinations. Retrieval results show that statistical data analysis gives useful hints for feature selection. The experiments show the importance of feature selection in environmental sound recognition.
|
| Mon, Sep 14 |
13:15 |
Harald Jordan |
Runtime-Optimised Intra-4x4 Mode-Decision for H.264/AVC Video Encoding
—
Test talk,
ISPA 2009
—
Meeting room, first floor.
|
| Mon, Sep 14 |
13:15 |
Michael Bleyer |
Temporally Consistent Disparity Maps from Uncalibrated Stereo Videos
—
Test talk,
ISPA 2009
—
Meeting room, first floor.
|
| Thu, Sep 3 |
13:15 |
Nicole Brosch |
Transformation von nicht-photorealistischen Bild- zu Videoeffekten
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Margrit Gelautz
—
Beim Erzeugen von nicht-photorealistischen Animationen aus echten Videosequenzen besteht eine große Herausforderung darin, zeitlich kohärente Ergebnisse zu erzeugen. Diese Arbeit gibt zunächst einen Überblick über verschiedene Ansätze, Kohärenz zu erzwingen, und erweitert danach eine bereits in der Lehre eingesetzte Bibliothek für Bild- und Videoverarbeitungsalgorithmen um einen cartoonartigen Bildeffekt sowie mehrere darauf aufbauende Videoeffekte.
Der implementierte Bildeffekt entwickelt einen an Basiseigenschaften von Cartoons orientierten Stil, den BenutzerInnen zusätzlich variieren können. Zu diesem Zweck führt eine erste Abstraktion eine Farbreduktion aus und entfernt Details. Weitere Schritte (Betonung von Kanten, Modifikation von Helligkeits- und Farbwerten, Variation von Schärfe und Kontrast) schaffen gleichzeitig Parameter, welche die Ausprägung der einzelnen Merkmale im Ergebnis bestimmen.
Die Videoeffekte bauen auf unterschiedliche, in der Literatur präsentierte Strategien für den Erhalt zeitlicher Kohärenz auf. Ein Videoeffekt versucht, angelehnt an global konzipierte Ansätze, mehr als nur ein Frame in die Farbreduktion einzubeziehen. Ein weiterer Effekt stellt eine Beziehung zwischen den Farben benachbarter Frames her. Ein dritter Videoeffekt führt, inspiriert durch Ansätze, die aufgrund von Differenzen zwischen benachbarten Frames Arbeitsschritte definieren, eine Entscheidungsfunktion ein, die darauf abzielt, räumliche Farbsprünge zu verhindern.
Um die Effektivität der implementierten Effekte zu verifizieren und zu vergleichen, werden Differenzen zwischen Frames untersucht. Ein zusätzlicher, bereits existierender Videoeffekt wird adaptiert und in die Vergleiche eingebunden. Schlussendlich wird der Mehrwert des Frameworks und insbesondere der implementierten Effekte für den Lehreinsatz analysiert.
|
| Thu, Sep 3 |
13:15 |
Christian Ammer |
Bewegungsanalyse von Videos unter Berücksichtigung von Verdeckungen
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Margrit Gelautz, Michael Bleyer
—
Die Aufgabe von Motion Estimation ist, Bewegungsbereiche in einem Video zu erkennen und jedem Bildpunkt eine Bewegung zuzuordnen. Es ist eine herausfordernde Aufgabe von Computer Vision, denn viele Anwendungen des Maschinellen Sehens lassen sich erst durch eine qualitativ hochwertige Bewegungsanalyse des Videos lösen. So sind die hohen Kompressionsraten in Videos mitunter auf die Bewegungskompensation zurückzuführen, welche durch Motion Estimation möglich wird. Eine automatische Erfassung und Identifizierung von Gegenständen oder eine dreidimensionale Szenenrekonstruktion sind Anwendungen, welche eine Bewegungsanalyse voraussetzen.
In dieser Arbeit wird ein Algorithmus auf Grundlage der Arbeiten von Jiangjan Xiao und Mubarak Shah entworfen, der eine kurze Videosequenz analysiert. Im Gegensatz zu anderen Arbeiten in diesem Bereich berücksichtigt der Algorithmus Verdeckungen. Das Ergebnis einer Analyse ist eine Ebenenrepräsentation des Videos, bei der jeder Ebene eine affine Bewegung zugrunde liegt.
Um die affinen Bewegungen zu finden, sucht der Algorithmus im ersten Schritt Featurepoints. Jeder Featurepoint wird als Saatpunkt im folgenden Region-Growing-Schritt verwendet. In jeder Region-Growing-Wachstumsphase werden die affinen Bewegungen mit dem Newton Näherungsverfahren bis zu einem bestimmten Punkt verfeinert. Ähnliche affine Bewegungen werden zu einer zusammengefasst. Im nächsten Schritt, dem Layer Assignment Schritt, wird eine Energiefunktion entworfen und durch das Minimale-Schnitt-Verfahren minimiert. Durch die Minimierung wird jedem Bildpunkt eine affine Bewegung zugeordnet, was die Lösung des Zuordnungsproblems darstellt. Die Energiefunktion enthält neben Daten- und Smoothnesskosten auch einen Term für Verdeckungen zwischen Bildern und einen Term für Verdeckungen zwischen Bildpaaren. Das Minimale-Schnitt-Verfahren wird seit einigen Jahren häufig für Computer Vision Aufgaben eingesetzt, da es sich in der Praxis gut bewährt.
|
| Thu, Aug 13 |
13:15 |
Bernhard Holzer |
Modellbasierte Erstellung von Bilddatenbanken
—
Diplomarbeitsvortrag (1. Präsentation);
Betreuer: Florian Seitner
—
Diese Arbeit befasst sich mit der Thematik, welche Informationen gängige
Algorithmen zur menschlichen Analyse aus Bildern, wie zum Beispiel der
Gestenerkennung oder der Objekterkennung, benötigen und wie diese Daten
künstlich anhand von menschlichen 3D Modellen generiert werden können.
Es werden zunächst die erwähnten Algorithmen hinsichtlich der benötigten
Daten der jeweiligen Anwendung zum Trainieren, Evaluieren und Visualisieren
untersucht. Weiters wird ermittelt, welche Datenbank bereits existiert und
in welcher Hinsicht die einzelnen Algorithmen unterstützt werden.
Aufbauend auf dieser Analyse, wird eine Anwendung entwickelt, die anhand
eines menschlichen 3D-Modells automatisch menschliche Posen generiert und
die benötigten Daten für die Algorithmen in Form einer Datenbank erstellt.
Die Funktionalität und Qualität der generierten Datenbank wird anhand einer
konkreten Anwendung, einem Objektdetektor, evaluiert.
|
| Thu, Aug 6 |
13:15 |
Sylvie Chambon Guest researcher |
Overview on her work
|
| Thu, Aug 6 |
13:15 |
Roland Gross |
Evaluation of Competing Data Terms for the Stereo Correspondence Problem
—
2. DA Vortrag (in English);
Betreuer: Michael Bleyer
—
Im Moment verwenden viele Stereo Matching Algorithmen (global sowie lokal) nur Intensitätswerte um Disparitätsbilder zu berechnen. Aktuelle Studien zeigen jedoch, dass die Verwendung von Farbinformation die Robustheit und Ergebnisqualität der Matchingkostenberechnung erhöhen kann. Dies zeigt sich besonders deutlich an radiometrisch verzerrten Basisdaten. Einfache Beispiele für radiometrische Verzerrungen sind unterschiedliche Belichtungszeiten oder Beleuchtungsverhältnisse. Die Diplomarbeit beschäftigt sich mit der Frage, ob die Verwendung von Farbinformation und radiometrischen Transformationen bessere Ergebnisse als herkömmliche intensitätsbasierte Ansätze liefern kann. Dazu werden fünf Farbräume (Graustufen, RGB, AC1C2, I1I2I3, LUV), sechs radiometrische Transformationen (Mittelwert, Marr-Hildreth Operator, Rank, SoftRank, Bilaterale Subtraktion), vier Kostenberechnungsverfahren (Summe absoluter Differenzen, Birchfield Tomasi, Normalisierte Kreuzkorrelation, Hierarchische Transinformation) und zwei Optimierungsverfahren (Lokal, Global) in einer Evaluierung auf zehn Testdatensätzen untersucht. Weiters wird untersucht, ob eine Verwendung von Gewichten in radiometrischen Transformationen, normalisierter Kreuzkorrelation und Aggregation zu besseren Ergebnissen führt. Dabei wird auch ein Vergleich zwischen der Gewichtsberechnung nach Yoon und geodätischen Gewichten angestellt. Die Ergebnisse der Evaluierung zeigen, dass die Verwendung von Farbinformation, radiometrischen Transformationen und Gewichten die Ergebnisqualität signifikant erhöhen.
|
| Thu, Jul 9 |
13:15 |
Richard Kloibhofer, Martin Riederer |
Life Logging im Überblick
—
30min + kurze Diskussion;
Betreuer: Matthias Zeppelzauer
—
Life Logging beschäftigt sich mit der Speicherung und Segmentierung
von Daten, welche von einem Benutzer gesammelt
werden. Meistens werden dabei Video, Audio und weitere
Sensordaten aufgezeichnet. Life Logging wird mittlerweile
von vielen Institutionen erforscht, wobei bisher noch
kein marktreifes Produkt vorhanden ist.
Im Rahmen dieser Bachelorarbeit wollen wir einen Einblick
in verschiedene Life Logging Systeme geben und dabei die
verschiedenen Methoden vergleichen.
Ein Schwerpunkt wird auf die Segmentierung der Daten gelegt.
Dabei werden automatisch die wichtigsten Ereignisse bei der Aufzeichnung
gefiltert und indiziert.
|
| Thu, Jul 2 |
13:15 |
Stefan Hartlieb |
Film Analysis – Scene Segmentation
—
Diplomarbeitsvortrag (1. Präsentation);
Betreuer: Dalibor Mitrovic
—
Ein Shot ist ein Ausschnitt aus einem Film, der mit einer Kamera kontinuierlich aufgenommen wurde. Eine Szene besteht aus mehreren zusammengehörenden Shots bei denen sich die handelten Personen, bzw. die räumliche Umgebung nicht ändert. Ziel der Diplomarbeit ist es einen Algorithmus zu entwickeln, der einen Film in Szenen segmentieren kann. Die dahinterliegende Idee ist es ähnliche Shots wiederzuerkennen. Der Vortrag soll den Workflow zur Wiederfindung von Shots und die dabei zu verwendeten Merkmale beschreiben. Auch wie bei Sequenzen von nicht ähnlichen Shots, sowie bei Einstellungen die keiner Szene zuzuschreiben sind, vorgegangen werden soll wird erörtert
|
Q2/2009 Talks
| Date |
Time |
By |
Topic |
| Thu, Jun 25 |
13:15 |
Matthias Zeintlinger |
Schreiben mit dem Brain Computer Interface
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Christian Breiteneder, Matthias Zeppelzauer, Günter Edlinger;
20 min + 5 min Diskussion
—
Im Zuge der Diplomarbeit wurde ein P300-Speller entwickelt, der es ermöglicht Zeichen, Worte und ganze Sätze allein mit der Kraft der Gedanken zu schreiben ohne Aufwendung von Muskelkraft. In diesem Vortrag wird, nach einer kurzen Darstellung des P300-Prinzips, die Verarbeitungskette für die EEG-Signale des Spellers beschrieben. Weiters wird ein neuer Klassifikationsansatz zur automatischen Erkennung der Benutzeraktivität und zur Bestimmung der notwendigen Trials pro Buchstabe präsentiert.
Der so entwickelte Speller wurde in einer Evaluierungsphase mit freiwilligen gesunden Benutzern getestet. Die Ergebnisse der Evaluierung werden im Vortrag präsentiert.
|
| Thu, Jun 18 |
13:15 |
Stefan Oppl |
Ein Tabletop Interface zur Unterstützung expliziter Articulation Work
—
Dissertationspräsentation;
45 min.
—
In der heutigen Arbeitswelt ist Interaktion zwischen Akteuren eine inhärenter Bestandteil jedes Arbeitsvorgangs. Diese Interaktion muss zwischen den beteiligten Personen abgestimmt werden, um die Zielerreichung zu gewährleisten. Der Vorgang dieser Abstimmung wird als "Articulation Work" bezeichnet und läuft - zumeist unbewusst - immer dann ab, wenn in Interaktionen neue oder unklare Situationen auftreten oder etablierte Vorgehensweisen aufgrund geänderter Rahmenbedingungen nicht mehr anwendbar sind. Werden die Veränderungen zu groß, reicht unbewusste - implizite - Articulation Work nicht mehr aus; der Abstimmungsvorgang muss explizit angestossen und unterstützt werden. Ein wesentlicher Teil eines expliziten Abstimmungsvorgangs ist das Offenlegen der unterschiedlichen Sichten auf den betroffenen Arbeitsvorgang durch alle Beteiligten und die Entwicklung eines gemeinsamen Verständnisses, auf dem aufbauend neuen Formen der Interaktion gefunden werden können. Ziel der hier vorgestellten Arbeit ist es, diesen Abstimmungsvorgang technologisch zu unterstützten. Methodisch basiert der Ansatz auf Strukturlegetechniken, die verwendet werden können um individuelle Wahrnehmungen und Erklärungsmodelle realer Phänomene (wie Arbeitsabläufen) zu externalisieren und kollaborativ abzustimmen. Strukturlegetechniken arbeiten mit physischen, direkt manipulierbaren bedeutungstragenden Knoten und Kanten, aus denen sich im Laufe des Prozesses ein diagrammatisches Modell bildet. Dieses Modell wird jedoch rasch sehr groß und komplex, so dass eine technologische Unterstützung des Modellierungsvorgangs wünschenswert ist. Dazu wurde eine digital augmentierte Modellierungsoberfläche entwickelt, die den Modellbildungsvorgang verfolgt und unterstützen soll. Durch die dadurch digital vorhandene Modellrepräsentation wird außerdem eine Archivierung und Weiterverwendung der Modelle ermöglicht. Im Rahmen der Arbeit wurde das System auf Basis der zugrundeliegenen Ansätze konzipiert, technisch umgesetzt und evaluiert. Im Vortrag werden nach einer konzeptuellen Einführung das System und dessen Unterstütungsfunktionalität vorgestellt. Abschließend wird über die ersten Ergebnisse der durchgeführten empirischen Studien berichtet.
|
| Mon, Jun 15 |
t.b.a. |
Michael Bleyer |
A Stereo Approach that Handles the Matting Problem via Image Warping
—
Test talk CVPR 2009
—
We propose an algorithm that simultaneously extracts disparities and alpha matting information given a stereo image pair. Our method divides the reference image into a set of overlapping, partially transparent color segments. Each segment pixel is assigned an alpha value and color. The disparity inside the segment is modeled via a plane. The goodness of alphas, colors and disparity planes is measured by a new energy function. Its basic idea is to use the three parameters for generating artificial views representing the left and right images. If alphas, colors and disparity planes are correct, these artificial images should be very similar to the real ones. For generating the artificial right view, we warp all pixels of the left into the geometry of the right image using the disparity planes. We introduce the assumption of constant solidity in order to correctly model how pixels' alpha values are affected by the warping operation. Experimental results on the Middlebury set show that our algorithm gives good results in comparison to the state-of-the-art in stereo matching.
|
| Wed, Jun 10 |
14:00 |
Olivia Nemethova |
Patenting Inventions in Europe: Why and How?
In this presentation I would like to provide answers to questions related to patenting, which I was asking myself during my PhD studies at TU Wien:
What is an invention and how to identify a patentable invention? Are computer implemented inventions patentable? Although I will particularly focus on the European patent law, I will also point out some interesting differences to other national laws. In order to decide on whether to file a patent or not, the value and a possible exploitation of the patent has to be considered. I will thus provide hints to deciding in the dilemma of many researchers whether to patent or rather publish in a scientific paper.
Furthermore, I will present the procedure of obtaining a patent including requirements, approximate timing, and possibilities of speeding up the proceedings. Finally, I will briefly summarize the forms of industrial property other than patents.
|
| Thu, Jun 4 |
13:15 |
Branislav Micusik |
Matching and 3D Reconstruction in Urban Environments
—
Dr. Branislav Micusik, http://ai.stanford.edu/~micusik/
(senior research scientist at AIT, Austrian Institute of Technology,
former research scholar at George Mason University and Stanford University, USA);
45 min
—
Indoor and outdoor urban environments possess many regularities which can be efficiently exploited and used for general image parsing tasks, matching, or 3D dense reconstruction from multiple widely separated views. These environments exhibit often shadows, lack textured areas, or contain repetitive textures which multiply the ambiguities in standard computer vision pipelines. During my talk I will consider those specific environments and show the way we tackle the aforementioned problems.
First, I will present an approach for detecting rectilinear structures and demonstrate their use for wide baseline stereo matching, planar 3D reconstruction, and computation of geometric context. Second, I will focus on a dense stereo method utilizing properties of piecewise planarity and restricted number of plane orientations to suppress 3D reconstruction and matching ambiguities. We show how the utilization of the scene priors yields more accurate and visually plausible results in many urban scenes compared to the standard general methods.
|
| Fri, May 29 |
10:00 |
Prof. Elisabeth André Augsburg University |
Towards Emotional Sensitivity in Human-Computer Interaction
—
TU Wien, Hörsaal EI 8, Gußhausstr. 25-29, Stiege 1, EG
—
See http://www.informatik.tuwien.ac.at/events/forschung/174 for details
|
| Mon, May 18 |
11:00 |
Mirza Ciric Johannes Fromm |
Virtualisierungsstrategien für IMS
—
IMS Technical Talks
—
Virtualisierung ist eine Schlüsseltechnologie um Kosten und Administrationsaufwand von IT-Systemen zu reduzieren. Dabei werden die Ressourcen eines Rechnersystems (Host) aufgeteilt und von mehreren unabhängigen virtuellen Betriebssysteminstanzen (Guests) genutzt.
Wir planen eine Umstellungen unserer jetztigen IT-Infrastruktur am IMS und wollen die vielen physischen Rechner in Zukunft als virtuelle Maschinen realisieren.
In diesem Seminar wollen wir unsere Vorhaben vorstellen und mit euch diskutieren.
|
| Thu, Apr 30 |
13:00 |
Neslihan Orta |
Reisemanagement-Schulung
—
Quästur/Lohnverrechnung
|
| Mon, Apr 20 |
11:00 |
Petra Kölndorfer |
Kinetosis / Motion Sickness: A New Approach for Adaptation in Virtual Reality
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Hannes Kaufmann
—
Kinetose ist der medizinische Begriff für Bewegungskrankheit. Er stammt aus dem Griechischen und bedeutet “sich bewegen”. In dieser Diplomarbeit sind die Effekte der Bewegungskrankheit und von Cybersickness beschrieben. Dieses Thema wird auf Basis von bestehenden Arbeiten diskutiert, in denen frühere Ansätze zu diesem Thema aufgezeigt werden.
Kinetose entsteht, wenn die Informationen, die alle Teile des Gleichgewichtsorgans - Ohren, Muskeln und Augen - zum Gehirn senden, inkonsistent sind. Es existieren drei Haupttheorien, die alle versuchen die genauen Mechanismen dieser Krankheit zu ergründen.
Neben diesen Theorien gibt es auch noch andere Faktoren, die Cybersickness hervorrufen. Die Symptome dieser Krankheit sind sehr verschieden, zum Beispiel angestrengte Augen, Kopfschmerzen oder Ubelkeit.
Der praktische Teil dieser Arbeit stellt die Hypothese auf, dass Adaption in kurzer Zeit möglich ist. Um diese These zu uberprüfen, wurde eine virtuelle Umgebung erstellt, in der die Testpersonen vier Tage trainiert wurden. Das Training bestand daraus, dass die Personen ein maximal 25 Minuten langes Replay von einem Autorennspiel anschauen mussten. An jedem der vier Tage war eine Sitzung. Ein Fragebogen wurde erstellt, der die Ergebnisse quantifizieren soll. Die daraus entstandenen Sickness Scores wurden analysiert und aufgrund dieser Daten wurde eine Schlussfolgerung gezogen. Am Ende gibt es einen kleinen Exkurs zu zukünftigen Forschungsfeldern.
|
Q1/2009 Talks
| Date |
Time |
By |
Topic |
| Thu, Mar 26 |
13:15 |
Jürgen Pucher |
Erstellen eines Standard Datensatzes für die Evaluierung von Alpha Matting Algorithmen und Aufbereitung der Resultate für die Lehre
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Margrit Gelautz, Christoph Rhemann
—
Image Matting ist das Problem der Trennung von Vorder- und Hintergründen in digitalen Bildern. Um die Resultate von Matting Algorithmen vergleichen zu können, wurden in vergangenen Arbeiten meist qualitative Vergleiche anhand einiger Matting Resultate verwendet. Um einen quantitativen Vergleich von Matting Algorithmen zu ermöglichen, ist ein Bilddatensatz mit korrespondierenden Referenzlösungen nötig. In kürzlich publizierten Arbeiten wurden mehrere solche Bilddatensätze mit Referenzlösungen vorgestellt. Allerdings hat sich bislang keiner dieser Datensätze als Standard für den Vergleich von Matting Algorithmen etablieren können. Dies ist unter anderem dadurch bedingt, dass keiner dieser Datensätze in ein vollautomatisches Online-Benchmark-Verfahren eingebunden ist. Ein umfangreicher Online-Benchmark sollte idealerweise auf einer großen Anzahl von Testbilder durchgeführt werden. Allerdings ist dies mit einem sehr hohen Rechenaufwand verbunden.
Daher ist das Ziel dieser Arbeit, aus einem kürzlich vorgestellten Datensatz repräsentative Bilder auszuwählen, die für den Vergleich von Matting Algorithmen verwendet werden können. Die Schwierigkeit besteht darin, die Variation des gesamten Datensatzes im kompakten Datensatz abzubilden. Um repräsentative Bilder auszuwählen wurden für alle Bilder Resultate mit mehreren Matting Algorithmen berechnet. Durch den pixelweisen Vergleich der resultierenden Alpha Matte mit der Referenzlösung wurde eine Fehlerrate ermittelt. Die Bilder wurden ihrem Inhalt entsprechend in Kategorien eingeteilt und diejenigen Bilder aus der jeweiligen Kategorie ausgewählt, die einen hohen Schwierigkeitsgrad aufweisen.
Ein weiteres Ziel dieser Arbeit ist es, den Forschungsbereich Matting sowie die Ergebnisse dieser Arbeit für die didaktische Anwendung aufzubereiten. Dies wurde in Form einer E-Learning Plattform realisiert. Durch den gezielten Einsatz verschiedener Hilfsmittel des Systems kann der Lernprozess sinnvoll unterstützt und ein positiver Lernerfolg erreicht werden.
|
| Thu, Mar 19 |
14:00 |
Andreas Rauber (IFS, TU Wien) |
Quick Overview of MIR Activities
—
We'll review the feature vector sets Rhythm Patterns (RP), Rhythm Histograms (RH) and Statistical Spectrum Descriptors (SSD) and provide an outlook on current activities wrt. feature extraction from audio. Then we'll take a look at some of the applications, particularly the PlaySOM and PocketSOM interfaces for exploring music collection, with a brief glance at other areas of activity such as source separation, 3D worlds for music, chord detection, audio segmentation, depending on interest. Details on the various aspects, as well as some demo software, are available from the web at http://www.ifs.tuwien.ac.at/mir.
|
| Thu, Mar 12 |
13:15 |
Tobias Schleser |
Face Detection in Historic Documentaries With a Cascaded Classifier
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Christian Breiteneder, Matthias Zeppelzauer
—
The presentation covers a face detection system that is based on a cascaded classifier. The face detector is trained and evaluated in the context of historic documentaries by the Soviet filmmaker Dziga Vertov. The historic films bear image deficiencies including flicker, scratches, dirt, image vibrations, bad lighting and low contrast. We describe how the detection framework is adapted to the material and provide detailed results for several sample scenes from the documentaries. Additionally, the performance of the training and detection stages are presented.
|
| Thu, Mar 5 |
13:15 |
Pamela Rott |
Evaluierung von Fehlermetriken für Image Matting
—
Diplomarbeitsvortrag (2. Präsentation);
Betreuer: Margrit Gelautz, Christoph Rhemann
—
Image Matting zielt darauf ab, ein Vordergrundobjekt aus einem beliebigen Bild herauszulösen, welches als eine Kombination aus Vorder- und Hintergrund beschrieben wird. Das Resultat eines Mattingverfahrens ist eine Alpha Matte, welche den Einfluss des Vorder- sowie Hintergrundes an jedem Pixel im Bild definiert. Die Vielzahl der Mattingverfahren bringt Resultate von unterschiedlicher Qualität hervor. Um die visuelle Qualität eines Bildes festzustellen, können sowohl subjektive als auch objektive Evaluierungsverfahren eingesetzt werden. Der Mensch spielt hier eine wesentliche Rolle, da das menschliche Auge Kriterien zur Beurteilung heranzieht, die entscheidender sein können als die pixelweise Differenz zum Referenzbild. Subjektive Evaluierungsverfahren in Form von Benutzerstudien sind jedoch sehr aufwändig, weshalb automatisierte Berechnungen notwendig sind. Diese Berechnungen werden aber nur dann erfolgreich sein, wenn die Bewertung des Menschen damit korreliert. Deshalb sollten in die automatisierten Berechnungen Faktoren einfließen, die erheblichen Einfluss auf die visuelle Qualität von Matting Resultaten haben und das menschliche visuelle System berücksichtigen. In dieser Studie werden Faktoren wie die räumliche Verbundenheit (Connectivity), der Gradientenverlauf und die auftretenden Artefakte im Vorder- und Hintergrund herangezogen und durch eine Auswahl an Probanden sowie automatisierte Berechnungen bewertet. Anschließend werden die Resultate der Probanden und der automatisierten Berechnungen verglichen. Die Auswertung der Studie hat gezeigt, dass Objekte mit starker Verbundenheit und niedrigem Gradientenverlauf von den Probanden tendenziell als visuell hochwertig eingestuft werden. Die dafür entwickelten automatisierten Fehlermaße korrelieren mit den Resultaten der Probanden und dementsprechend mit der visuellen Wahrnehmung. Bei der im Vorfeld getroffenen Annahme hingegen, dass Artefakte im Hintergrund störender wirken als im Vordergrund, konnte im Rahmen dieser Studie keine Einigkeit unter den Probanden festgestellt werden.
|
| Thu, Feb 26 |
13:15 |
Martha Kaltenecker |
Vereinheitlichung von Stereo und optischem Fluss in einem Energieminimierungsansatz
—
Diplomarbeit (1. Präsentation);
Betreuer: Michael Bleyer, Margrit Gelautz
—
Um automatisiert Tiefeninformation aus Videos zu gewinnen, muss eine bewegte Szene aus zumindest zwei leicht unterschiedlichen Perspektiven zur selben Zeit mit kalibrierten Videokameras gefilmt werden. Durch eine zeitlich unabhängige Ermittlung von Tiefe für jedes individuelle Stereo-Framepaar, können Artefakte in Form von Flackern (z.B. durch das Auftreten von Bildrauschen) im 3D-Video entstehen.
Ziel dieser Diplomarbeit ist es, Stereo und Optical Flow in einer einzigen Energiefunktion zu formulieren. Auf diese Weise werden die resultierenden Tiefenbilder aufeinanderfolgender Frames in zeitliche Abhängigkeit gebracht. Eine wesentliche Herausforderung ist es, eine derartige Energiefunktion zu optimieren. Durch die Hinzunahme des Optical Flow entsteht eine sehr große Label-Menge (Menge aller möglichen Richtungen und Geschwindigkeiten, mit denen sich ein Bildpunkt bewegen kann, und Menge der Disparitäten). Mit neuartigen Optimierungsalgorithmen, wie Log-Cuts, ist es jedoch möglich, die Energiefunktion zeiteffizient zu optimieren.
|
| Thu, Feb 19 |
13:15 |
Roland Gross |
Evaluierung von farbbasierten Dissimilaritätsmassen in radiometrisch verzerrten stereoskopischen Bildern
—
Diplomarbeit (1. Präsentation);
Betreuer: Michael Bleyer, Margrit Gelautz
—
Im Moment verwenden viele Stereo Matching Algorithmen (global sowie lokal) nur Intensitätswerte um Disparitätsbilder zu berechnen. Aktuelle Studien zeigen jedoch, dass die Verwendung von Farbinformation die Robustheit der Matchingkostenberechnung erhöhen kann. Dies zeigt sich besonders deutlich an radiometrisch verzerrten Basisdaten. Einfache Beispiele für radiometrische Verzerrungen sind zum Beispiel unterschiedliche Belichtungszeiten oder Beleuchtungsverhältnisse. Die Diplomarbeit beschäftigt sich mit der Frage, ob die Verwendung von Farbinformation bei der Berechnung von Dissimilarität in radiometrisch verzerrten Bildern bessere Ergebnisse liefern kann als herkömmlich, intensitätsbasierte Verfahren. Dazu werden sechs Matchingkostenberechnungsverfahren (sampling‐insensitive absolute difference, LoG filter, Rank filter, Mean filter, hierarchical mutual information, normalized cross‐correlation) um die Verwendung von Farbinformation erweitert und anschließend evaluiert. Desweiteren werden sogenannten Support Weights implementiert und ebenfalls mit radiometrisch verzerrten Bildern evaluiert.
|
| Thu, Feb 19 |
13:15 |
Michael Birsak, Michal Domanski, Michael Hanzl |
Cloth Interaction and Visualisation in a VR Environment
—
Praktikumspräsentation;
Betreuer: Mathis Csisinko
—
Das Ziel dieser Arbeit ist es mit Tüchern in einer Echtzeit-Virtual-Reality-Umgebung zu interagieren. Dazu wurde eine Applikation für die Virtual- und Augmented-Reality-Umgebung Studierstube entwickelt. Dabei werden unter Zuhilfenahme der Physik-Engine Nvidia PhysX Tücher und deren Verhalten simuliert. So ist es möglich mit selbst entwickelten Datenhandschuhen, die die Schnittstelle zwischen Mensch und Maschine darstellen, diese simulierten Tücher zu greifen und mit ihnen zu jonglieren, als würden diese tatsächlich in realer Form existieren. Um die Tücher zu sehen, trägt der Benutzer ein Head-Mounted Display (HMD).
|
| Thu, Feb 12 |
13:15 |
Harald Jordan |
Optimized Intra-Mode Decision for Real-Time H.264/AVC Video Coding
—
Diplomarbeit (2. Präsentation);
Betreuer: Margrit Gelautz, Florian Seitner, Michael Bleyer
—
The inherent coding parameters of the high-complexity video-compression standard H.264/AVC are superior to all previously developed video encoding standards. The aims of the video compression standard H.264/AVC are to achieve better compression efficiency and even higher image quality compared to its predecessors (MPEG-2). The most significant improvements described in this standard are mainly due to the variable block size motion estimation & compensation by further using sub-pixel accuracy and the enhanced Intra mode prediction process. This increased encoding performance thus requires complex algorithms and methods implicating modern and powerful micro-computers to facilitate real-time procession of high resolution video streams. Currently the market takes this into account by offering specialised and quite often limited solutions realised in ASICs or functional blocks inside application-processors. Thus the subject H.264 requires fairly long-term efforts in research and development for gaining high sophisticated and creative advances in video compression. The purpose of this thesis is to analyse and furthermore optimise the compression methods defined in H.264 for an efficient application in the automation and in automotive areas whereas the optimisation is with respect to improvements of the runtime-behaviour. Hence the main focus thereby is on increasing the efficiency of the H.264 Intra-Only encoding. To achieve these aims it is necessary to carefully study the behaviour of the encoding techniques, develop new methods for saving computational load and simulate the resulting algorithms. A further task is to proof the practical and scientific relevance of the gained conclusions. In the course of these investigations at least two approaches are implemented and tested to further proof the theoretical fundamentals.
|
| Thu, Feb 5 |
13:15 |
Biljana Jovic |
Untitled talk by Biljana Jovic, guest researcher from Belgrade University
|
| Thu, Jan 15 |
13:15 |
Aksel Filipovic |
Musikgenreklassifikation mit Hilfe von Hidden Markov Modellen
—
Diplomarbeit (2. Präsentation)
—
Bei diesem Vortrag handelt es sich um die Endpräsentation der Magisterarbeit
Musik-Genreklassifikation mit Hilfe von Hidden Markov Modellen. Neben Hidden
Markov Modellen im allgemeinen werden die Modellen mit kontinuierlichen
Beobachtungssequenzen im besonderen erklärt. Zusätzlich werden die Parameter
für die Klassifikation von Musik mit Hilfe von diesen Modellen detailiert
diskutiert und Resultate in dieser Magisterarbeit präsentiert.
|
| Thu, Jan 15 |
13:15 |
Petra Kölndorfer |
Kinetose / Motion Sickness - A new appoach for adaptation in Virtual Reality
—
Diplomarbeit (1. Präsentation)
|
| Thu, Jan 9 |
13:15 |
Markus Seidl |
A Unified Approach for the Detection of Gradual Transitions in Historic Film Material
—
15min + 5min Diskussion
—
The master thesis deals with the problem of shot boundary detection (SBD) in
old B/W footage: The footage of the soviet film maker Dziga Vertov. The
first step in automated content based analysis of video material is the
detection of shot boundaries. This is an active research topic, and is seen
as solved for the easiest to detect type of transitions, the cut. The
detection of gradual transitions (GTs) still is a field for many different
approaches. The steps towards successful SBD are a) selection and extraction
of appropriate features, b) construction of the continuity signal and c)
classification of the frames. In the case of detection of GTs two approaches
are researched: Unified approaches, i.e. one detector for all GT Types, and
approaches that use specialized approaches for each GT Type. In this master
thesis, a unified approach will be developed. For a) special properties of
the Vertoff footage have to be considered: The material is old, not restored
and in contrast to most test footage for GT approaches in B/W. The features
have to be selected to deliver a representation of the frames that is not
sensitive to flickering, fungus, artefacts, etc.. Regarding b), motion of
camera and/or objects as well as illumination changes are the big
challenges. The continuity signal will be constructed using a similarity
matrix and filtering this along the diagonal, as it is used in many
approaches. In c) the question of thresholding vs. classification has to be
answered. In literature, most unified approaches use classification with kNN
or SVMs.
|
Q4/2008 Talks
| Date |
Time |
By |
Topic |
| Thu, Dec 18 |
13:15 |
Harald Jordan |
Optimized Intra-Mode Decision for Real-Time H.264/AVC Video Coding
—
Diplomarbeit, 1. Talk;
Betreuer: Florian Seitner, Michael Bleyer, Margrit Gelautz
—
The achieved coding efficiency of H.264/AVC is superior to all previously
developed video encoding standards. Unfortunately this increased encoding
performance requires complex algorithms and methods implicating modern and
powerful micro-computers to facilitate real-time procession of video
streams. The purpose of this diploma thesis is to propose and develop
methods as well as algorithms concerned with the reduction of
encoding-efforts. The main focus thereby is on the efficiency increase for
H.264 Intra-Only encoding. To achieve these aims it is necessary to
carefully study the behaviour of the encoding techniques, simulate the
operation method of the developed improvements and proof the practical and
scientific relevance of the gained conclusions.
|
| Thu, Dec 18 |
13:15 |
Pamela Rott |
Evaluierung von Fehlermetriken für Image Matting
—
Diplomarbeit (1. Präsentation)
—
Image Matting beschäftigt sich mit dem Herauslösen eines Vordergrundobjektes aus einem beliebigen Originalbild. Als Resultat eines Matting Algorithmuses erhält man eine Alpha Matte, die den Vorder- sowie den Hintergrund des Originalbildes definiert. Um diese Alpha Matte zu erhalten, werden unterschiedlichste Segmentierungs- bzw. Mattingverfahren eingesetzt. Um in weiterer Folge die Qualität der Alpha Matte festzustellen, wird die Abweichung der Resultate von einer Referenzlösung mit Hilfe von Fehlermetriken berechnet. Hauptaugenmerk dieser Arbeit ist es festzustellen inwieweit diese Fehlermetriken der visuellen Wahrnehmung entsprechen.
|
| Thu, Dec 11 |
13:15 |
Anita Bogner |
Evaluierung und Entwurf von Epipolarrektifizierungsverfahren zur Verwendung in einem Stereovisionframework
—
Diplomarbeit (1. Präsentation)
—
Epipolarrektifizierung ist ein Verfahren aus dem Gebiet der Computer Stereo Vision, dessen Ziel es ist Stereobildpaare so zu transformieren, dass zusammengehörende – also demselben Objektpunkt entsprechende – Bildpunkte in den „rektifizierten“ Bildern auf einer horizontalen Linie liegen. Das „Korrespondenzproblem“ (das Finden korrespondierender Bildpunkte), wird unter dieser Voraussetzung wesentlich vereinfacht und nachfolgende Stereo Matching Verfahren beschleunigt. Inhalt der Diplomarbeit ist die (Nach-)Implementierung eines Epipolarrektifizierungsverfahren in C++, sowie Integration dieses Verfahrens in ein bestehendes Stereovisionframework. Anschließen soll auch die Qualität der Rektifizierungsergebnisse anhand von Ground-Trouth Daten evaluiert und mit anderen Verfahren verglichen werden. Ziel ist es zu untersuchen, wie sich verschiedene Faktoren, wie etwa die Qualität der als Input für die Rektifizierung notwenigen Punktkorrespondenzen, auf die Qualität der Rektifizierungsergebnisse auswirken.
|
| Thu, Dec 4 |
13:15 |
Georg Gerstweiler, Emanuel Vonach |
Konstruktion eines aktiven Motion Tracking Suit für den Einsatz in sportpädagogischen VR-Anwendungen
|
| Thu, Dec 4 |
13:15 |
Matthias Zeintlinger |
Schreiben mit dem Brain Computer Interface
—
~20 Minuten + Demo von Firma G-Tec
—
Die Vorstellung, Dinge allein mit Kraft unserer Gedanken steuern/bewegen zu können, übt schon seit jeher eine Faszination auf die Menschen aus. Diese Vision mit Hilfe des Computers in die Realität umzusetzen, damit beschäftigt sich das Forschungsumfeld des Brain Computer Interface (BCI). So ist es zum Beispiel bereits möglich, den Mauscursor am Computer zu bewegen, am Computer zu schreiben, eine Smarthome-Umgebung zu kontrollieren oder eine künstliche Armprothese zu steuern - und das ohne sprichwörtlich auch nur einen Finger zu rühren, allein mit der Kraft unserer Gedanken. Was dafür notwendig ist, wie der Computer es überhaupt schaffen kann, Gedanken zu lesen und in entsprechende Aktionen umzusetzen und welche Vor- und Nachteilen sich daraus ergeben wird in diesem Vortrag erläutert. Nach einem kurzen Überblick über die vier Hauptansätze des BCI und dem derzeitigen State of the Art wird das eigentliche Thema meiner Diplomarbeit, das Schreiben mit dem BCI, fokussiert und dessen Funktionsprinzip detaillierter beschrieben. Um sich ein Bild der Theorie machen zu können hat sich die Firma g.tec medical engineering GmbH, mit deren Zusammenarbeit die Diplomarbeit durchgeführt wird, bereit erklärt, eine kleine Demonstration ihres bisherigen unter MATLAB® lauffähigen Spellers vorzuführen.
|
| Thu, Nov 6 |
13:15 |
Asmaa Hosni |
English Text to Arabic Sign Language Translator
—
Report on previous work
|
| Thu, Oct 16 |
13:15 |
Simone Tschann |
Kinematographie: Ein Vergleich von Rollfilm und High Definition
—
Diplomarbeit, 2. Vortrag
—
Film ist wohl eines der letzten analogen Medien, die noch nicht von der vollkommenen Digitalisierung erfasst wurde. Doch die rasante Entwicklung, besonders in den letzten Jahren macht es schwer, die Videotechnik aus den Kinos fern zu halten.
In diesem Vortrag geht es um einen Vergleich der analogen und digitalen Filmtechnik in der Produktion. Geprägt durch Kornrauschen über ein ganzes Jahrhundert wird das analoge Kinobild durch die Digitaltechnik plötzlich in Frage gestellt. Welche Qualitätsunterschiede gibt es, wo liegen die Vor- und wo die Nachteile? In Diskussionen über analog und digital steht dann Auflösung und Schärfe meist an erster Stelle. Dieser Punkt ist aber nur einer von vielen, der bei einem Vergleich der beiden Technologien berücksichtigt werden soll. Beginnend bei der kleinsten Einheit steht das Korn gegenüber dem Pixel. Das Bild jedoch als Ganzes betrachtet sind der Kontrast, die Farbe, die Schärfentiefe und auch das Licht mögliche Kritikpunkte für eine Technologie. Ursache dieser Unterschiede liegt schon bei der Aufnahmetechnik. Doch die rasante Entwicklung der Digitaltechnik versucht sich immer mehr an die der Analogen anzugleichen, oder diese sogar zu übertreffen.
|
| Thu, Oct 16 |
13:15 |
Jürgen Pucher |
Erstellen eines Standard Datensatzes für die Evaluierung von Alpha Matting Algorithmen und Aufbereitung der Resultate für die Lehre
—
1. Diplomarbeitsvortrag
—
Unter "Matting" versteht man das Trennen von Vorder- und Hintergrund eines Bildes. Um alpha matting Algorithmen quantitativ vergleichen zu können, ist ein Standarddatensatz mit entsprechenden Refernzlösungen wesentlich. Ziel dieser Arbeit ist die Erstellung eines Referenzdatensatzes, der eine möglichst große Variation an natürlichen Bildern in einem kompakten Datensatz abbildet.
|
| Thu, Oct 9 |
13:15 |
Thomas Pintaric |
ISMAR 2008
—
Conference Report
|
Q3/2008 Talks
| Date |
Time |
By |
Topic |
| Thu, Sep 25 |
13:15 |
Marie-Theres Tschurlovits |
Dynamic Differential Geometry in an Educational Augmented Reality Application
—
Diplomarbeits-Endvortrag
—
In this thesis a number of geometry software packages leading both to
static and dynamic constructions and their particular features will be
presented. Afterwards Construct3D a 3D dynamic geometry construction
tool will be introduced. It is based on the Augmented Reality System
Studierstube. Construct3D's greatest advantage compared to other dynamic
geometry software is the possibility for users to see the real
environment augmented with virtual content with the aid of a head
mounted display. That gives the users, mainly high school and university
students, the opportunity to actually construct, explore and interact
with three dimensional content in "real" 3D space.
The practical part of this thesis was the implementation of a number of
new functions for Construct3D. Several tools have been developed to
enhance the understanding of the term curvature of curves and surfaces.
To complement the already available sweep function of Construct3D
helical and general sweeps have been implemented.
|
| Thu, Aug 28 |
11:00 |
Christoph Rhemann |
Improving Color Modeling for Alpha Mattin
—
Test talk BMVC
—
15 min talk + 15 min discussion
—
In this work we addresses the problem of extracting an alpha matte from a single photograph given a user-defined trimap. A crucial part of this task is the color modeling step where for each pixel the optimal alpha value, together with its confidence, is estimated individually. This forms the data term of the objective function. It comprises of three steps: (i) Collecting a candidate set of potential fore- and background colors; (ii) Selecting high confidence samples from the candidate set; (iii) Estimating a sparsity prior to remove blurry artifacts. We introduce novel ideas for each of these steps and show that our approach considerably improves over state-of-the-art techniques by evaluating it on a large database of 54 images with known high-quality ground truth.
|
| Thu, Jul 7 |
13:15 |
Aksel Filipovic |
Musikgenreklassifikation mit Hilfe von Hiden Markov Modelen
—
Dieser Vortrag soll die allgemeine Verwendung von Hidden Markov Modelen in Bereich der Musikgenre-
klassifikation näher erklären, state-of-the-art Genreklassifikation mit Hidden Markov Modelen geben,
den Ansatz und verwendete Features kurz darstellen und
das verwendete MIRFramework und HMM Toolboox kurz
präsentieren.
|
Q2/2008 Talks
| Date |
Time |
By |
Topic |
| Thu, Jun 26 |
13:15 |
Michael Bleyer |
Evaluation of Different Methods for Using Colour Information in Global Stereo Matching Approaches
—
ISPRS 2008 paper by Michael Bleyer, Sylvie Chambon, Uta Poppe, Margrit Gelautz
—
20 min.
—
Global algorithms currently represent the state-of-the-art in dense stereo matching. These methods first set up an energy function. The energy function is then subject to optimization, which is typically achieved via graph-cuts or belief propagation. In this paper, we concentrate on the energy modelling aspect. An experimental study that focuses on the role of colour in stereo energy functions is presented. We evaluate the performance of various forms for using colour and compare it against grey-scale matching. Colour is thereby represented in nine different colour systems. The $L_1$ and $L_2$ distances are evaluated for computing the colour differences in the selected systems. We embed the resulting energy functions into two stereo algorithms and test them on 30 ground truth test image pairs. The results of our benchmark show that colour information, in general, leads to a significant performance gain over using intensity only. According to our evaluation results, the selection of the applied colour space is of specific importance in global stereo matching.
|
| Thu, Jun 26 |
13:15 |
Stephan Petzl |
Billboard Substitution in Soccer Videos
—
15 min.
—
In dem Vortrag geht um das möglichst automatisierte Ersetzen von Bandenwerbung in Fußballübertragungen. Dabei gehe ich auf diverse Ansätze zur Lösung des Problems ein und gebe einen kurzen Einblick in die von mir entwickelte Testumgebung.
|
| Thu, Jun 12 |
13:15 |
Jakob Rieckh |
Scalable Video Coding (SVC) for Peer-to-Peer Streaming
—
Pulsar - developed by the distributed computing group of the ETH Zurich - is a completely decentralized peer-to-peer system for live and on-demand streaming. By now it is only possible to broadcast a video stream at a fixed and unchanging bit rate. To change this shortcoming the propagation of a scalable bit stream would be desirable. The so called Scalable Video Coding (SVC) standard is used to encode the video as a scalable bit stream.
|
| Thu, Jun 5 |
13:15 |
Thomas Wagner |
Automatic Speaker Change Detection
—
Automatic Speaker change detection is an important field, especially for discussions broadcast on TV. It is important, that every discussant has the same time to speak. With automatic speaker change detection it is easy to make a memorandum of the talking-times. This paper gives an overview about different audio/video features and techniques used for speaker change detection. There are different criteria for analyzing the audio and the video stream. The combination of an audio and a video criterion achieves more reliable results, than procedures, that are based either on audio or on video features. These theoretical criteria will be implemented as a full independent application. Different TV discussions will be used for testing the combination of audio and video analysis.
|
| Thu, May 29 |
— |
— |
No seminar…
Room occupied.
|
| Thu, May 15 |
13:15 |
Matthias Zeintlinger |
Query by Humming
—
15 min Vortrag + 5 min Diskussion
—
Query by Humming (QbH) ist ein Begriff aus dem Bereich Music
Information Retrieval (MIR) und beschreibt ein Suchproblem. Ziel ist
es, zu einer vom Benutzer gesummten bzw. gesungenen Melodie die
zugehörige Musikdatei aus einer Menge von im Computer gespeicherten
Liedern zu finden. Wie bei nahezu allen inhaltsbasierten Suchproblemen
ist die richtige Auswahl der Features, der Repräsentation dieser
Features und des Vergleichsalgorithmus' entscheidend für eine effiziente
und erfolgreiche Suche. Für jeden dieser drei Teilbereiche wird die
Kernfunktionalität der derzeit gängigen Methoden im Ansatz beschrieben
um so ein Verständnis für die Funktionsweise (und Probleme) einer QbH-Applikation zu vermitteln.
|
| Thu, May 8 |
13:15 |
Christian Schönauer |
Skeletal Structure Generation for Optical Motion Capture
—
Epilog test talk; takes place in the meeting room on the first floor
—
Motion capture systems today have to deliver high quality motion data, while being flexible and easily adaptable to different actors. Therefore, accurately determining parameters of a subject's skeletal structure is crucial. Inferring these values automatically from optical motion capture data without additional measurements, however, is a challenging task. This thesis describes the steps necessary to calculate the joint positions and limb lengths using data from a passive optical tracking system.
The algorithm is a multi-stage process that includes the tasks of automatic marker labeling, limb-wise clustering of markers and calculation of joint positions. Finally an estimate of the topology and the parameters of the articulated structure are computed. Since the topology is inferred from the data, no model has to exist in advance. This in turn makes the implemented system flexible enough to capture not only human motions, but motions of an arbitrary articulated structure, without any adaptations or additional effort. The core functionality of the system, which is the skeleton fitting task, is done using a distance function, that is applied to marker positions. This function then is minimized by a non-linear minimization algorithm.
Tests of the system have been performed with human motion capture data, artificially generated data sets and a construction of rods linked with articulations. The results show high accuracy for the artificial data. For the tracked data sets also satisfactory outcome is produced.
|
| Mon, Apr 28 |
11:00 |
Tobias Schleser |
Face Detection and Face Recognition in Monochromatic Film
—
The Face Detection and Face Recognition problems receive considerable attention among
researchers. While detection is the basis for recognition and aims for detecting all faces in an
image regardless of their shape or three dimensional position, the latter focuses on
recognizing the same face in different images. In my thesis I will target the difficult material
of monochromatic Vertov films which date back to the 1930s. Unsteady camera motion,
flicker and the missing color information are some of the challenges. For the detection
problem, my first focus, I will implement Jones’ and Viola’s approach, Robust Real-time
Object Detection (2001), as it is reported to work robustly and fast. I will present first efforts
and outcomes in my talk.
|
| Thu, Apr 24 |
13:15 |
Wolfgang Fuchs |
Erkennung von Sprecherwechseln
—
Seminararbeit + Bakk Präsentation; 15 + 5 min
|
| Thu, Apr 24 |
13:15 |
Markus Autengruber |
Image Matting and Composite Image
—
Ersatztermin für Seminararbei; 20min
—
Dieser Vortrag widmet sich dem akkuraten Extrahieren von digitalen Bildinhalten (Image Matting) sowie der darauf folgenden Komposition von verschiedenartigen Bildinhalten (Composite Image). Im Zusammenhang mit der Vorstellung und Beschreibung dieses Forschungsgebiets erfolgt eine Evaluierung vorhandener Methoden bzw. Algorithmen anhand der Diskussion von Bildbeispielen.
|
| Thu, Apr 10 |
13:15 |
Clemens Helm |
Symmetry detection in image
—
15 min
—
Symmetry has become an important feature in robot vision and other active vision systems, as it plays a decisive role in human perception of their environment. Therefore many systems require efficient symmetry detectors to appreciate images the way we would do. Navigation issues and detection of attentional points are only some of the versatile challenges that symmetry detection algorithms have to cope with. This paper focuses on discussing different approaches and thoughts on detecting symmetries and their relevancy to practice.
|
Q1/2008 Talks
| Date |
Time |
By |
Topic |
| Thu, Mar 27 |
13:15 |
Julian Stöttinger, PRIP |
Interest and Boring Points
|
| Thu, Feb 28 |
13:15 |
Markus Autengruber |
Ersatztermin für Seminar aus Medieninformatik
|
| Thu, Feb 21 |
13:15 |
Christian Ammer |
Ableiten von affinen Bewegungen aus Videos
—
2. Diplomarbeitspräsentation; 20 + 10 min
—
Methodisches Extrahieren von Bewegungsinformationen aus Videosequenzen ist eine Grundlage für viele Anwendungen, wie Videokompression, 3D Modellierung und andere. Im Vortrag wird ein Verfahren vorgestellt, das affine Bewegungsparameter aus einer kurzen Videosequenz extrahiert. In einem weiteren Schritt wird jeder Pixel einer Ebene mit bestimmter affiner Bewegung zugeordnet. Für die Extraktion der affinen Parameter wird der KLT Feature Tracker, eine Level Set Methode, Region Growing und Region Merging eingesetzt. Für das Zuweisen der affinen Bewegungsparameter zu allen Pixeln der Videosequenz wird ein Graph Cut Verfahren verwendet. Im Vortrag werden die einzelnen Verfahren vorgestellt.
|
| Thu, Feb 14 |
13:15 |
Michael Bleyer |
Simple but Effective Tree Structures for Dynamic Programming-based Stereo Matching
—
Work Report; 30 + 10 min
—
This work describes a fast method for computing dense stereo correspondences that is capable of generating results close to the state-of-the-art. We propose running a separate disparity computation process in each image pixel. The idea is to root a tree graph on the pixel whose disparity needs to be reconstructed. The tree thereby forms an individual approximation of the standard four-connected grid for this specific pixel. An exact optimum of a predefined energy function on the applied tree structure is determined via dynamic programming (DP), and the root pixel is assigned to the disparity of optimal costs. We present two simple tree structures that allow for the efficient calculation of all trees' optima with only four scanline-based DP passes. These simple trees are designed to capture all pixels of the reference frame and incorporate horizontal and vertical smoothness edges in order to weaken the scanline streaking problem inherent in DP-based approaches. We evaluate our results using the Middlebury test set. Our algorithm currently ranks at the eighth position of approximately 30 algorithms in the Middlebury database. More importantly, it is the currently best-performing method that does not use image segmentation and is significantly faster than most competing algorithms. Our method needs less than a second to determine the disparity map for typical stereo pairs.
|
| Thu, Feb 7 |
13:15 |
Johannes Wallner |
Informationsvisualisierung mit offenen Webstandards
—
Praktikumspräsentation; 20 + 10 min
—
Anhand mehrerer Fallstudien zu ausgewählten Methodiken der
Informationsvisualisierung soll gezeigt werden, dass zu derer Umsetzung
die offenen Webstandards SVG und X3D effektiv eingesetzt werden können.
Die strukturellen Möglichkeiten der beiden Modellierungssprachen sollen
dabei nach Möglichkeit voll ausgeschöpft werden. Die Ergebnisse der
Fallstudien sind zufrieden stellend und bezeugen großes Potenzial für
die Informationsvisualisierung.
|
| Thu, Jan 31 |
13:15 |
Bernhard Fölsner |
Bildsegmentierung: Eine auf Eye-Tracking basierende Evaluierung
—
30 min
—
Wahrnehmungspsychologische Grundsätze und physisch bedingte Einschränkungen des Menschen, beeinträchtigen seine Wahrnehmung (interpretierte Konstanzen schaffen Klarheit und Eindeutigkeit). Eine Begriffsklärung und kurze theoretische Einführung bilden die Grundlage für die Präsentation der Studienauswertung. Vorstellung der gesamten Studie (Herangehensweise mit Aufbau bis zur Analyse) und ihrer zu Grunde liegenden Daten (Auswahl an Eye-Tracking Bildern).
|
| Thu, Jan 24 |
13:15 |
Florian Seitner |
A High-Level Simulator for the H.264/Avc Decoding Process in Multi-Core Systems
—
Test-Talk, SPIE 2008
—
H.264 as a new-generation video coding algorithm is becoming increasingly important for international broadcasting standards such as DVB-H and DMB. In comparison to its predecessors MPEG-2 and MEPG-4 SP/ASP, H.264 achieves improved compression efficiency at the cost of increased computational complexity. Real-time execution of the H.264 decoding process poses a large challenge on mobile devices due to low processing capabilities. Multi-core systems provide an elegant and power-efficient solution to overcome this performance limitation. However, efficiently distributing the video algorithm among multiple processing units is a non-trivial task. It requires detailed knowledge about the algorithmic complexity, dynamic variations and inter-dependencies between functional blocks. The objective of this paper is an investigation on the dynamic behavior of the H.264 decoding process and on the interaction between the main decoding tasks in the context of multi-core environments. We use an H.264 decoder model to investigate the efficiency of a decoding system under various conditions (e.g. different FIFO buffer sizes, bitstreams, coding features and bitrates). The gained insights are finally used to optimize the runtime behavior of a multi-core decoding system and to find a good trade-off between core usage and buffer sizes.
|
| Thu, Jan 24 |
13:15 |
Angelika Preißler |
Implementierung eines historischen 3D-Weltatlanten auf der Basis von X3D
—
2. Diplomarbeitspräsentation; 20 min + Diskussion
—
Ein wichtiges Prinzip von Web 2.0 ist die aktive Beteiligung von Benutzern als
Produzenten von Inhalten. Wikis sind ein Vertreter des Web 2.0 und stellen genau
diese Funktionalität den Benutzern zur Verfügung.
Die vorliegende Arbeit beschäftigt sich mit der Umsetzung eines historischen
3D-Weltatlanten. Die grafische Visualisierung erfolgt mittels X3D. Die Datenbasis wird durch ein Wiki verwaltet und kann durch Benutzer erweitert und bearbeitet werden, wobei die geografischen Daten direkt in den Wikitext als XML eingebettet werden. Anhand von Links, dem Grundelement eines Wikis, werden die geografischen und historischen Strukturierungen vorgenommen. Die Transformation von XML zu X3D erfolgt durch XSL.
Durch die Offenheit des Systems und der Verwendung von bekannten Umgebungen wird die Grundlage für eine umfangreiche Erweiterung der historischen Datenbank geschaffen.
|
| Thu, Jan 17 |
13:15 |
Christian Schönauer |
Test-Talk Diploma Exam
—
10 min
—
Motion capture systems today have to deliver high quality motion data, while
being flexible and easily adaptable to different actors. Therefore,
accurately determining parameters of a subject's skeletal structure is
crucial. Inferring these values automatically from optical motion capture
data without additional measurements, however, is a challenging task. This
thesis describes the steps necessary to calculate the joint positions and
limb lengths using data from a passive optical tracking system.
The algorithm is a multi-stage process that includes the tasks of
automatic marker labeling, limb-wise clustering of markers and calculation
of joint positions. Finally an estimate of the topology and the parameters
of the articulated structure are computed. Since the topology is inferred
from the data, no model has to exist in advance. This in turn makes the
implemented system flexible enough to capture not only human motions, but
motions of an arbitrary articulated structure, without any adaptations or
additional effort. The core functionality of the system, which is the
skeleton fitting task, is done using a distance function, that is applied to
marker positions. This function then is minimized by a non-linear
minimization algorithm.
Tests of the system have been performed with human motion capture data,
artificially generated data sets and a construction of rods linked with
articulations. The results show high accuracy for the artificial data. For
the tracked data sets also satisfactory outcome is produced.
|
| Fri, Jan 11 |
10:30 |
Dalibor Mitrovic |
Content-based Analysis of Early Black and White Films
—
20+10 minutes;
Talk and discussions
—
This talk takes place in the CG-Konversatorium... Seminarroom E186 - Favoritenstraße/ Stiege 1, 5th floor.
|
Q4/2007 Talks
| Date |
Time |
By |
Topic |
| Thu, Dec 20 |
13:00 |
Anton Schöffmann |
Evaluation and Implementation of Improved Edge Detection Methods for an Industrial Robot Sewing Process
—
2. Diplomvortrag;
30 min
—
Details (PDF)
|
| Thu, Dec 13 |
13:15 |
Simone Tschann |
Kinematographie: Ein Vergleich von Rollfilm und High Definition
—
1. Diplomarbeitspräsentation;
20 min (+ 10 min Diskussion)
—
Die Digitalisierung des Films entwickelt sich mit rasanter Geschwindigkeit und versucht sich der
traditionellen Filmtechnik zu stellen. Im Verlauf der Präsentation wird ein Konzept dargestellt, wie
ein Vergleich zwischen Rollfilm und High Definition umgesetzt werden kann, mit dem Ziel heraus
zu finden, inwiefern die digitalen Technologien den Tod des physischen Films, wie wir ihn seit über
hundert Jahren kennen, einleiten, oder ob sie lediglich eine Unterstützung im Produktionsablauf
darstellen. Nach einer Grundlagenforschung der beiden Technologien werden die technischen,
ästhetischen und wirtschaftliche Eigenschaften auf Vergleichbarkeit überprüft und
mit Hilfe von Interviews auf Praxisnähe untersucht.
|
| Thu, Dec 13 |
13:15 |
Nicole Brosch |
Color Reduction Effect
—
1. Diplomarbeitspräsentation
—
Die Video Effect Library ist eine Sammlung von Algorithmen zur Bild- und Videoverarbeitung, die bereits für die LU Videoverarbeitung verwendet worden ist. Im Rahmen dieses Frameworks soll ein neuer Bildeffekt und auf diesem aufbauend ein Videoeffekt implementiert werden.
Der Bildeffekt versucht durch Farbreduktion mittels K-Means Clustering und Kantenerkennung einem Bild ein Cartoon-artiges Aussehen zu verleihen. Parameter wie z.B. Qualität und Anzahl der gewählten Farben im Bild sowie diverse Farbfilter erlauben es, den Bildeffekt zu beeinflussen.
Der Videoeffekt verhindert abrupte Farbänderungen, indem für jeden Frame ähnliche Startzentren gewählt und mehrere Nachbarframes mitgeclustert werden können. Zusammengehörende Cluster werden erkannt und deren Farbwerte gemittelt.
Neben den Eigenschaften des eigentlichen Videoeffekts können via Keyframeanimation auch die Bildeffekt-Parameter über die Zeit hinweg verändert werden.
|
| Mon, Dec 3 |
11:00 |
Dr. Regine Bolter, FH Vorarlberg |
Mehr Frauen in die Informatik!
—
IEEE Gastvortrag
—
Regine Bolter, Studiengangsleiterin der Informatik an der Fachhochschule Vorarlberg, möchte mit Ihnen diskutieren, welches Berufsbild des Informatikers in den Köpfen der Gesellschaft und gerade auch bei jungen Mädchen existiert, was bereits jetzt am Beispiel der FH Vorarlberg getan wird, um dieses Bild auch im Hinblick auf mehr Informatikerinnen zu verbessern und welche Maßnahmen dazu noch notwendig und sinnvoll wären.
|
| Thu, Nov 22 |
13:00 |
Sabine Berger, Florian Scherz, Markus Autengruber |
AnyTracker
—
20 minutes;
Bachelor project presentation
—
Das Projekt "AnyTracker" besteht aus zwei Teilen:
(1) Der erste beschäftigt sich mit der Aufnahme von einzelnen Bildern aus einem Videostream, um diese in einer Datenbank zu speichern und zusätzliche Kommentare dazu ablegen zu können. Anwendungsgebiet: Etwa ein Touristenführer-Programm, mittels dem Bilder von berühmten Locations zusammen mit interessanten Hintergründen zu diesen gespeichert werden können.
(2) Der zweite Teil beschäftigt sich schließlich mit der Echtzeit-Analyse eines Input-Video-Streams und dessen Vergleich mit bereits in der Datenbank abgelegten Bildern, um vorhin gespeicherte Kommentare zu den gerade gefilmten Locations wieder aufrufen zu können. Anwendungsgebiet: Vorhin genanntes Touristenführer-Programm soll jedes Mal, wenn man die Kamera auf eine bereits gespeicherte Location richtet, die dazu abgelegten Hintergrundinformationen automatisch anzeigen.
—
Beide Teile wurden in einem von uns gestalteten UI realisiert und werden mithilfe einer marktgängigen PC-Kamera präsentiert.
|
| Thu, Oct 18 |
13:15 |
Andreas Poppernitsch, Martin Schreiber |
Recognizing and Identifying Commercials in TV Streams
—
30 minutes;
Bachelor thesis presentation
—
Details (PDF)
|
| Thu, Oct 11 |
13:00 |
Anton Schoeffmann |
Evaluation and Implementation of Improved Edge Detection Methods for an Industrial Robot Sewing Process
—
20 min (+ 10 min discussion);
Diploma thesis presentation
—
Details (PDF)
|
| Thu, Oct 4 |
13:00 |
Dieter Mayrhofer |
Pen-based Electronic Medical Record on a Tablet PC in a Medical Practice
—
30 minutes;
Diploma thesis presentation
—
One of the main areas the future of pen operated Tablet PCs is seen in is the medical sector. Some hospitals already use tablets for their work, but one medical facility where Tablet PCs are hardly used so far is in medical practices. There are only a few software developers who create software for this need, but often it is adapted regular PC software which fails to provide some useful pen-based features.
This work aims to create a completely new prototype of pen-based EMR (Electronic Medical Record) software on a Tablet PC using new technologies such as C# and WPF (Windows Presentation Foundation). Some of the special features include using gestures for navigation, providing an image annotation tool where the user can write directly on the picture and modify the ink, using it as a communication device, adding audio comments to a record and recognizing handwritten text.
The first part contains some examples which describe medical software for Tablet PCs already on the market and which institutes already have tablets in use. In the main part the developing of the prototype and its usage is described. The final chapter discusses the work and the results gained from the test persons.
|
Q3/2007 Talks
| Date |
Time |
By |
Topic |
| Mon, Sep 10 |
10:00 |
Bernhard Fölsner |
Bildsegmentierung und eine auf eye-tracking basierende Evaluierung
—
20 minutes;
Diplomarbeit (1. Vortrag)
|
| Thu, Aug 23 |
14:00 |
Alfred Inselberg |
Multidimensional Visualization and its Applications
—
Zemanek HS
Alfred Inselberg - School of Mathematical Sciences, Tel Aviv University, Israel & Senior Fellow in Visualization, San Diego SuperComputing Center, USA
The desire to understand the underlying geometry of multidimensional problems motivated several visualization methodologies to augment our limited 3-dimensional perception. After a short overview, Parallel Coordinates are rigorously developed obtaining a 1-1 mapping between subsets of Euclidean N-space and subsets of 2-space. It leads to representations of lines, flats, curves, intersections, hypersurfaces, proximities and geometrical construction algorithms. Convexity can be visualized in ANY dimension as well as non-orientability (Moebius strip) and other properties of hypersurfaces. This is a VISUAL Multidimensional Coordinate System with applications to Air Traffic Control, Visual and Automatic Data Mining, Interactive Models of Complex Systems.
PS: Do not be intimidated by this formal description. The speaker is also well known for his numerological anecdotes and palindromic digressions.
|
| Mon, Jul 16 |
11:00 |
Ulrich Pöschl |
Referenzimplementierung eines "Server-based Computing" Szenarios
—
30 minutes
—
Diese Arbeit befasst sich mit den Microsoft Terminal Services unter Windows
Server 2003 und beleuchtet Vor- und Nachteile sowie technische Hintergründe und
Einsatzmöglichkeiten dieser Lösung im Wienerberger-Konzern.
Besondere Rücksicht wird bei den Betrachtungen auf die Themen Multi-Language,
Verfügbarkeit der Dienste, Bandbreitenverbrauch und Drucklösungen genommen.
Eines der Kernstücke der Arbeit bildet ein für die Labortests eigens
entwickelter auf Linux basierender Bandbreitenbeschränker zur Simulation eines
künstlichen Netzwerkflaschenhalses. Die speziellen Anforderungen der
Wienerberger AG erfordern ein spezielles Konzept und ergeben besondere
Probleme, die sich nicht aus Standardkonzepten ableiten lassen und daher der
vorliegenden Untersuchung bedurften.
|
Q2/2007 Talks
| Date |
Time |
By |
Topic |
| Thu, Jun 21 |
13:15 |
Robert Neuner |
Geo-spezifische Metadaten in Bildern: Gewinnung, Speicherung und Anwendungsszenarien
—
45 minutes + discussions;
Diploma thesis presentation
—
Details (PDF)
|
| Thu, Jun 14 |
13:15 |
Martin Pichlmair |
Perpetual Prototypes: Interaktive Kunst zwischen Spiel und Versuchsanordnung
—
30 minutes + discussions
|
| Thu, Jun 14 |
13:15 |
Michael Müller |
Intuitive Benutzerschnittstellen für das interaktive Museum im Zeitalter des Web 2.0: Annotationen ohne Tastatur und Maus am Beispiel der Nintendo Wiimote
—
30 minutes + discussions;
Diploma thesis presentation (first talk)
—
Details (PDF)
|
| Thu, May 31 |
13:00 |
Florian Seitner |
A Macroblock-Level Analysis on the Dynamic Behaviour of an H.264 Decoder
—
20 minutes;
Test Talk for IEEE International Symposium on Consumer
Electronics (ISCE 2007)
—
This work targets the optimization of multiprocessor
H.264 decoder implementations. We have extended the
simulator of a multi-core VLIW media processor to enable
cycle-accurate function profiling on a sub-macroblock
level, which allows measuring the effects of coding modes
on the computational complexity with very fine
granularity. This knowledge helps the system designer to
optimize the system performance and memory sizes to
reduce system costs.
|
| Thu, May 31 |
13:00 |
Dominik Lepizh |
Automatische Klassifikation von Snowboard-Schwüngen
—
Diploma thesis presentation (first talk)
|
|
|