MPI-INF Logo
Campus Event Calendar

Event Entry

New for: D1, D2, D3, D4

What and Who

Mini-Symposium zum Thema "Phonetik in der Automatischen Spracherkennung"

Britta Wrede, Jacques Koreman, Anton Batliner, Evan Mellander
Phonetisches Kolloquium
AG 1, AG 2, AG 3, AG 4  
AG Audience

Date, Time and Location

Monday, 9 July 2001
14:15
-- Not specified --
Gebäude 17.2 - Institut für Phonetik
5.09
Saarbrücken

Abstract

Im Rahmen des Phonetischen Kolloquiums findet am Montag, den 09.07.01, ab 14 Uhr ein Mini-Symposium zum Thema "Phonetik in der Automatischen Spracherkennung" statt.

Ort: Studio (Raum 5.09) des Instituts fuer Phonetik (Gebaeude 17.2)


Geplantes Programm:

14:15 - 15:15 Britta Wrede (Angewandte Informatik, Universitaet
Bielefeld): Akustische Korrelate von Dauervariation in spontaner Sprache
und ihre Auswirkungen in der Spracherkennung *(Abstract siehe unten)

15:15 - 15:45 Jacques Koreman (Institut fuer Phonetik, Universitaet
Saarbruecken): Die Auswirkungen des Sprechtempos auf die Automatische
Spracherkennung: Implikationen fuer Aussprachelexikon und akustische
Modellierung

15:45 - 16:15 Kaffeepause

16:15 - 17:15 Anton Batliner (Mustererkennung, Universitaet
Erlangen): Intonationsmodelle, Prosodie und automatische
Sprachverarbeitung: Was passt wie zusammen? **(Abstract siehe unten)

17:15 - 17:45 Evan Mellander (Toronto): On the manifestation of
prominence in prosodic constituents

Anschliessend allgemeine Diskussion.



* ABSTRACT Vortrag B.Wrede
------------------------
Spektrale Korrelate von Dauervariation in spontaner Sprache und ihre
Auswirkungen in der Spracherkennung

Die bekanntesten akustischen Korrelate, die mit der Aenderung der
Segmentdauer in gesprochener Sprache
einhergehen, beziehen sich in der Regel auf die Lage der Vokale im
zweidimensionalen Formantenraum. Dabei ist
strittig, ob es sich bei den zu beobachtenden Phaenomenen um Reduktion,
also die Zentralisierung der
Formantenfrequenzen, handelt, oder um Koartikulation, also die
Verschiebung der Formantenfrequenzen in
Richtung ihres Kontextes. In jedem Fall ist ein Einfluss auf die
Formantenverlaeufe nachweisbar.

Weniger Aufmerksamkeit haben bisher die Auswirkungen von Daueraenderungen
auf das gesamte Spektrum
erhalten. Dabei basieren die Merkmale, die in der Spracherkennung
verwendet werden, in der Regel auf dem
Mel-Spektrum.

Es sollen daher einige Ergebnisse zum Einfluss von Dauer auf die Formanten
sowie deren Verlaeufe vorgestellt
werden, die auf dem spontansprachlichen Verbmobil-Korpus beruhen. In
diesem Zusammenhang sollen ebenfalls
einige vorlaeufige Ergebnisse zur Dynamik des Mel-Spektrums vorgestellt
werden.

Diese Ergebnisse werden schliesslich im Hinblick auf ihre Bedeutung fuer
die Spracherkennung diskutiert.


** ABSTRACT Vortrag A.Batliner
---------------------------
Intonationsmodelle, Prosodie und automatische Sprachverarbeitung: Was
passt wie zusammen?

Automatic speech understanding and speech synthesis, two of the major
speech processing applications, impose
strikingly different constraints and requirements on prosodic models. The
prevalent models of prosody and
intonation fail to offer a unified solution to these conflicting
constraints. As a consequence, prosodic models have
been applied only occasionally in end-to-end automatic speech
understanding systems; in contrast, they have been
applied extensively in speech synthesis systems. In this paper we want to
discuss the reasons for this state of affairs as
well as possible strategies to overcome the shortcomings of the use of
prosodic modelling in automatic speech processing.



Alle Interessierten sind herzlich eingeladen.


Phonetisches Kolloquium im www:
http://www.coli.uni-sb.de/phonetik/ph-kolloquium.html



--------------------------------------------------
Stefan Baumann
University of the Saarland
FR. 4.7 Phonetics
P.O. Box 151150
D-66041 Saarbruecken
--------------------------------------------------

Contact

--email hidden
passcode not visible
logged in users only

Uwe Brahm, 04/12/2007 12:03 -- Created document.