Stephan Kopf - Profile on Academia.edu (original) (raw)
Papers by Stephan Kopf
Multi perspective panoramic imaging
Image and Vision Computing, 2009
ABSTRACT Panoramic images have only been feasible if all contributing image patches share a commo... more ABSTRACT Panoramic images have only been feasible if all contributing image patches share a common center of projection. Then, they can be consolidated into a single image using perspective transforms. In contrast to that, we propose a novel non-linear warping scheme which allows the merging of multi-perspective images, thus taking advantage of scattered cameras. Therefore, a polygonal cut is defined in two source images to be merged. Usually, the layout of the cuts does not allow a user to stitch both images together naively. Thus, two convex combinations of a warped and a canonic coordinate system are applied so that both source images fit together at the cutting edge while the inevitable distortion decreases towards the borders of the image to obtain a natural appearance.
Dieser Bericht gibt einen Überblick über bekannte Verfahren und Technologien zur automatischen Ad... more Dieser Bericht gibt einen Überblick über bekannte Verfahren und Technologien zur automatischen Adaption von Darstellungselementen für mobile Endgeräte, wobei der Schwerpunkt bei Verfahren zur Adaption von Bildern, Videos, Webseiten und Audiodateien liegt. Ziel ist es, basierend auf den Eigenschaften des Endgerätes und den Interaktionsmöglichkeiten, geeignete Darstellungsformate automatisch abzuleiten. Als mögliche Endgeräte werden Mobiltelefone, PDAs, Tablet PCs und Notebook PCs betrachtet. Ein guter Adaptionsalgorithmus sollte eine computergestützte Umformatierung von nur einmal bereit gestellten Inhalten für die verschiedenen Formfaktoren, Auflösungen, Bildschirmgrößen, Interaktionstechniken (Maus, Stift, Touch-Screen usw.) und Netzbandbreiten unterstützen.
In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu l... more In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu lokalisieren und die Gesichter dann mit gespeicherten Charakteristika anderer Gesichter zu vergleichen. Der Ansatz, der hierzu verwendet wurde, behandelt die Gesichtserkennung als echtes zweidimensionales Erkennungsproblem, und greift nicht auf dreidimensionale Geometrie zurück. Außerdem wurde ausgenutzt, dass Gesichter in Bildern normalerweise aufrecht auftreten und somit durch eine kleine Anzahl von zweidimensionalen Charakteristika beschrieben werden können. Das System funktioniert, indem Gesichter in einen Eigenschaftenraum projiziert werden, der aus den wichtigsten Bestandteilen bekannter Gesichter aufgespannt wird. Diese aussagekräftigen Bestandteile werden Eigenfaces genannt, weil sie die Eigenvektoren (Hauptbestandteile) der Menge von Gesichtern sind, die als Lernmenge angegeben wurde. Die Eigenvektoren entsprechen jedoch nicht unbedingt den, aus dem menschlichen Blickwinkel, wichtigen Eigenschaften eines Gesichtes, wie Augen, Ohren und Nasen. Eine Projektion des Ursprungsbildes in den Gesichtsraum wird durch die gewichtete Summe der Eigenschaften der Eigenfaces charakterisiert. Eine Erkennung eines bestimmten Gesichtes erfolgt durch einen Vergleich der Gewichtsvektoren mit Gewichtsvektoren bereits bekannter Gesichter.
Proceedings of the 17th Acm International Conference on Multimedia, 2009
The presentation of multimedia data and especially of high resolution videos on small mobile devi... more The presentation of multimedia data and especially of high resolution videos on small mobile devices is still a great challenge today. Both cropping of borders and scaling of frames may result in the removal of essential content of videos or lost details due to the reduced size of the visual content. Another major problem emerges if the aspect ratio of the original video and the display of the mobile device differ. User evaluations indicate that changing the aspect ratio may reduce the visual quality of videos significantly. In this paper, we present the new FSCAV algorithm (Fast Seam Carving for Size Adaptation of Videos) to adapt the size of videos to the limited display resolution and different aspect ratios of handheld mobile devices. The general idea of the seam carving algorithm for still images is to remove seams in images so that the essential content is preserved. We extended this technique which works very well for images to create videos without jitter or visible artifacts. A major feature of our FSCAV algorithm is the low computational complexity which enables an efficient adaptation of videos to small screens. Nevertheless, severe distortions are clearly visible in some shots of the adapted videos. We present a new heuristic to identify shots with such a low visual quality. If the quality drops below a threshold, a different adaptation technique is used for this shot (e.g., scaling or cropping). User evaluations confirm a very high visual quality of our approach.
In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu l... more In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu lokalisieren und die Gesichter dann mit gespeicherten Charakteristika anderer Gesichter zu vergleichen. Der Ansatz, der hierzu verwendet wurde, behandelt die Gesichtserkennung als echtes zweidimensionales Erkennungsproblem, und greift nicht auf dreidimensionale Geometrie zurück. Außerdem wurde ausgenutzt, dass Gesichter in Bildern normalerweise aufrecht auftreten und somit durch eine kleine Anzahl von zweidimensionalen Charakteristika beschrieben werden können. Das System funktioniert, indem Gesichter in einen Eigenschaftenraum projiziert werden, der aus den wichtigsten Bestandteilen bekannter Gesichter aufgespannt wird. Diese aussagekräftigen Bestandteile werden Eigenfaces genannt, weil sie die Eigenvektoren (Hauptbestandteile) der Menge von Gesichtern sind, die als Lernmenge angegeben wurde. Die Eigenvektoren entsprechen jedoch nicht unbedingt den, aus dem menschlichen Blickwinkel, wichtigen Eigenschaften eines Gesichtes, wie Augen, Ohren und Nasen. Eine Projektion des Ursprungsbildes in den Gesichtsraum wird durch die gewichtete Summe der Eigenschaften der Eigenfaces charakterisiert. Eine Erkennung eines bestimmten Gesichtes erfolgt durch einen Vergleich der Gewichtsvektoren mit Gewichtsvektoren bereits bekannter Gesichter.
Modeling Temporal Effects in Re-captured Video
Proceedings of the 23rd ACM international conference on Multimedia - MM '15, 2015
Automatische Kamerasteuerung in Interaktiven Vorlesungen
Gi Jahrestagung, 2006
Eine zuverlässige Erkennung wichtiger Bildregionen ist die Grundlage für viele Verfahren im Berei... more Eine zuverlässige Erkennung wichtiger Bildregionen ist die Grundlage für viele Verfahren im Bereich der Bildverarbeitung wie beispielsweise bei der Bildkompression, bei Verfahren zur Anpassung der Bildauflösung oder beim Einfügen digitaler Wasserzeichen in Bilder. Es wurde ein System entwickelt, das Merkmalspunkte in Bildern identifiziert und diese nutzt, um wichtige Bildbereiche zu identifizieren. Zur Berechnung der Merkmalspunkte wird das SURF-Verfahren (Speeded Up Robust Features) [4] verwendet. Die gefundenen Merkmale werden in einem zweiten Schritt einzelnen Bildregionen zugeordnet. Die Qualität der ermittelten Regionen sowie das Laufzeitverhalten der verschiedenen Verfahren werden anhand der von [24] veröffentlichten Bilddatenbank analysiert.
EDL-Editor: Eine Anwendung zur automatischen Aufbereitung von Vorlesungsvideos
Delfi, 2007
In this paper, we evaluate an approach of a lightweight quiz application for mobile devices. The ... more In this paper, we evaluate an approach of a lightweight quiz application for mobile devices. The idea is to use the students' own smartphones as voting devices and provide a quiz administration module, which is integrated into the existing university's e-learning platform. For establishing the link between the devices and the system we use dynamically generated Quick Response (QR) Codes. We briefly evaluate the approach regarding usability for students and lecturers, limits of the QR code, and the impact on the university's network infrastructure.
The design and development of software projects is usually done in teams today. Collaborative sys... more The design and development of software projects is usually done in teams today. Collaborative systems based on multi-touch walls or large table-top screens could support these highly interactive tasks. We present a novel collaborative design tool which allows several developers to jointly create complex UML (Unified Modeling Language) diagrams. We have developed new algorithms to recognize the gestures drawn by the users, to create the respective elements of the diagram, to adjust the edges between classes, and to improve the layout of the classes automatically. Auxiliary lines provide the user with means to align classes precisely so a more consistent layout is achieved. Export functionality for XML and Java code skeletons completes the application; the UML diagram can thus be used in further steps of the software design process. User evaluations confirm considerable benefits of our proposed system.
Warping-based video retargeting for stereoscopic video
2014 Ieee International Conference on Image Processing, Oct 1, 2014
Automatic FSM-Based Video Directors for Lecture Recording
Beacon-based Short Message eXchange (BSMX) is a system to exchange small-sized messages between u... more Beacon-based Short Message eXchange (BSMX) is a system to exchange small-sized messages between unassociated WLAN devices like smartphones or access points. In this paper, we describe our proof of concept implementation of BSMX for Linux and the Android operating system. Furthermore, we introduce a novel probabilistic data structure that BSMX utilizes to provide application developers methods for distributed data aggregation.
Video composition by the crowd
Proceedings of the 6th ACM Multimedia Systems Conference on - MMSys '15, 2015
Loclib -- A Location Library
ABSTRACT
Computer-based content analysis of digital video archives (in German)
Automatic Camera Control in Interactive Lectures (in German)
Multi perspective panoramic imaging
Image and Vision Computing, 2009
ABSTRACT Panoramic images have only been feasible if all contributing image patches share a commo... more ABSTRACT Panoramic images have only been feasible if all contributing image patches share a common center of projection. Then, they can be consolidated into a single image using perspective transforms. In contrast to that, we propose a novel non-linear warping scheme which allows the merging of multi-perspective images, thus taking advantage of scattered cameras. Therefore, a polygonal cut is defined in two source images to be merged. Usually, the layout of the cuts does not allow a user to stitch both images together naively. Thus, two convex combinations of a warped and a canonic coordinate system are applied so that both source images fit together at the cutting edge while the inevitable distortion decreases towards the borders of the image to obtain a natural appearance.
Dieser Bericht gibt einen Überblick über bekannte Verfahren und Technologien zur automatischen Ad... more Dieser Bericht gibt einen Überblick über bekannte Verfahren und Technologien zur automatischen Adaption von Darstellungselementen für mobile Endgeräte, wobei der Schwerpunkt bei Verfahren zur Adaption von Bildern, Videos, Webseiten und Audiodateien liegt. Ziel ist es, basierend auf den Eigenschaften des Endgerätes und den Interaktionsmöglichkeiten, geeignete Darstellungsformate automatisch abzuleiten. Als mögliche Endgeräte werden Mobiltelefone, PDAs, Tablet PCs und Notebook PCs betrachtet. Ein guter Adaptionsalgorithmus sollte eine computergestützte Umformatierung von nur einmal bereit gestellten Inhalten für die verschiedenen Formfaktoren, Auflösungen, Bildschirmgrößen, Interaktionstechniken (Maus, Stift, Touch-Screen usw.) und Netzbandbreiten unterstützen.
In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu l... more In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu lokalisieren und die Gesichter dann mit gespeicherten Charakteristika anderer Gesichter zu vergleichen. Der Ansatz, der hierzu verwendet wurde, behandelt die Gesichtserkennung als echtes zweidimensionales Erkennungsproblem, und greift nicht auf dreidimensionale Geometrie zurück. Außerdem wurde ausgenutzt, dass Gesichter in Bildern normalerweise aufrecht auftreten und somit durch eine kleine Anzahl von zweidimensionalen Charakteristika beschrieben werden können. Das System funktioniert, indem Gesichter in einen Eigenschaftenraum projiziert werden, der aus den wichtigsten Bestandteilen bekannter Gesichter aufgespannt wird. Diese aussagekräftigen Bestandteile werden Eigenfaces genannt, weil sie die Eigenvektoren (Hauptbestandteile) der Menge von Gesichtern sind, die als Lernmenge angegeben wurde. Die Eigenvektoren entsprechen jedoch nicht unbedingt den, aus dem menschlichen Blickwinkel, wichtigen Eigenschaften eines Gesichtes, wie Augen, Ohren und Nasen. Eine Projektion des Ursprungsbildes in den Gesichtsraum wird durch die gewichtete Summe der Eigenschaften der Eigenfaces charakterisiert. Eine Erkennung eines bestimmten Gesichtes erfolgt durch einen Vergleich der Gewichtsvektoren mit Gewichtsvektoren bereits bekannter Gesichter.
Proceedings of the 17th Acm International Conference on Multimedia, 2009
The presentation of multimedia data and especially of high resolution videos on small mobile devi... more The presentation of multimedia data and especially of high resolution videos on small mobile devices is still a great challenge today. Both cropping of borders and scaling of frames may result in the removal of essential content of videos or lost details due to the reduced size of the visual content. Another major problem emerges if the aspect ratio of the original video and the display of the mobile device differ. User evaluations indicate that changing the aspect ratio may reduce the visual quality of videos significantly. In this paper, we present the new FSCAV algorithm (Fast Seam Carving for Size Adaptation of Videos) to adapt the size of videos to the limited display resolution and different aspect ratios of handheld mobile devices. The general idea of the seam carving algorithm for still images is to remove seams in images so that the essential content is preserved. We extended this technique which works very well for images to create videos without jitter or visible artifacts. A major feature of our FSCAV algorithm is the low computational complexity which enables an efficient adaptation of videos to small screens. Nevertheless, severe distortions are clearly visible in some shots of the adapted videos. We present a new heuristic to identify shots with such a low visual quality. If the quality drops below a threshold, a different adaptation technique is used for this shot (e.g., scaling or cropping). User evaluations confirm a very high visual quality of our approach.
In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu l... more In dieser Arbeit wird ein System vorgestellt, um Gesichter von Personen in Graustufenbildern zu lokalisieren und die Gesichter dann mit gespeicherten Charakteristika anderer Gesichter zu vergleichen. Der Ansatz, der hierzu verwendet wurde, behandelt die Gesichtserkennung als echtes zweidimensionales Erkennungsproblem, und greift nicht auf dreidimensionale Geometrie zurück. Außerdem wurde ausgenutzt, dass Gesichter in Bildern normalerweise aufrecht auftreten und somit durch eine kleine Anzahl von zweidimensionalen Charakteristika beschrieben werden können. Das System funktioniert, indem Gesichter in einen Eigenschaftenraum projiziert werden, der aus den wichtigsten Bestandteilen bekannter Gesichter aufgespannt wird. Diese aussagekräftigen Bestandteile werden Eigenfaces genannt, weil sie die Eigenvektoren (Hauptbestandteile) der Menge von Gesichtern sind, die als Lernmenge angegeben wurde. Die Eigenvektoren entsprechen jedoch nicht unbedingt den, aus dem menschlichen Blickwinkel, wichtigen Eigenschaften eines Gesichtes, wie Augen, Ohren und Nasen. Eine Projektion des Ursprungsbildes in den Gesichtsraum wird durch die gewichtete Summe der Eigenschaften der Eigenfaces charakterisiert. Eine Erkennung eines bestimmten Gesichtes erfolgt durch einen Vergleich der Gewichtsvektoren mit Gewichtsvektoren bereits bekannter Gesichter.
Modeling Temporal Effects in Re-captured Video
Proceedings of the 23rd ACM international conference on Multimedia - MM '15, 2015
Automatische Kamerasteuerung in Interaktiven Vorlesungen
Gi Jahrestagung, 2006
Eine zuverlässige Erkennung wichtiger Bildregionen ist die Grundlage für viele Verfahren im Berei... more Eine zuverlässige Erkennung wichtiger Bildregionen ist die Grundlage für viele Verfahren im Bereich der Bildverarbeitung wie beispielsweise bei der Bildkompression, bei Verfahren zur Anpassung der Bildauflösung oder beim Einfügen digitaler Wasserzeichen in Bilder. Es wurde ein System entwickelt, das Merkmalspunkte in Bildern identifiziert und diese nutzt, um wichtige Bildbereiche zu identifizieren. Zur Berechnung der Merkmalspunkte wird das SURF-Verfahren (Speeded Up Robust Features) [4] verwendet. Die gefundenen Merkmale werden in einem zweiten Schritt einzelnen Bildregionen zugeordnet. Die Qualität der ermittelten Regionen sowie das Laufzeitverhalten der verschiedenen Verfahren werden anhand der von [24] veröffentlichten Bilddatenbank analysiert.
EDL-Editor: Eine Anwendung zur automatischen Aufbereitung von Vorlesungsvideos
Delfi, 2007
In this paper, we evaluate an approach of a lightweight quiz application for mobile devices. The ... more In this paper, we evaluate an approach of a lightweight quiz application for mobile devices. The idea is to use the students' own smartphones as voting devices and provide a quiz administration module, which is integrated into the existing university's e-learning platform. For establishing the link between the devices and the system we use dynamically generated Quick Response (QR) Codes. We briefly evaluate the approach regarding usability for students and lecturers, limits of the QR code, and the impact on the university's network infrastructure.
The design and development of software projects is usually done in teams today. Collaborative sys... more The design and development of software projects is usually done in teams today. Collaborative systems based on multi-touch walls or large table-top screens could support these highly interactive tasks. We present a novel collaborative design tool which allows several developers to jointly create complex UML (Unified Modeling Language) diagrams. We have developed new algorithms to recognize the gestures drawn by the users, to create the respective elements of the diagram, to adjust the edges between classes, and to improve the layout of the classes automatically. Auxiliary lines provide the user with means to align classes precisely so a more consistent layout is achieved. Export functionality for XML and Java code skeletons completes the application; the UML diagram can thus be used in further steps of the software design process. User evaluations confirm considerable benefits of our proposed system.
Warping-based video retargeting for stereoscopic video
2014 Ieee International Conference on Image Processing, Oct 1, 2014
Automatic FSM-Based Video Directors for Lecture Recording
Beacon-based Short Message eXchange (BSMX) is a system to exchange small-sized messages between u... more Beacon-based Short Message eXchange (BSMX) is a system to exchange small-sized messages between unassociated WLAN devices like smartphones or access points. In this paper, we describe our proof of concept implementation of BSMX for Linux and the Android operating system. Furthermore, we introduce a novel probabilistic data structure that BSMX utilizes to provide application developers methods for distributed data aggregation.
Video composition by the crowd
Proceedings of the 6th ACM Multimedia Systems Conference on - MMSys '15, 2015
Loclib -- A Location Library
ABSTRACT
Computer-based content analysis of digital video archives (in German)
Automatic Camera Control in Interactive Lectures (in German)