SPARC

Aus wiki.sembase.at Semantic Wiki

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Logo

Sparc.jpg

Kurzbeschreibung

SPARC (Semantic Phonetic Automatic ReConstruction of dictations) wird durch das Österreichische Förderprogramm FIT-IT finanziert und hat das Ziel, die Qualität automatischer Diktiersysteme durch die Einbeziehung semantischer Informationen zu steigern.

Ziele

Ziel dieses Projekts ist es, durch die explizite Verwendung von Erkenntnissen der Semantik die Grundlage für eine radikale Qualitätsverbesserung in der automatisierten Transkription von Diktaten zu bilden. Derzeit gebräuchliche Systeme zielen zwar auf eine wörtliche Transkription des Diktats ab; bedingt durch die immanenten Unterschiede zwischen gesprochener und geschriebener Sprache ist es jedoch sogar erfahrenen Autoren unmöglich, ihre Diktate exakt so zu formulieren, dass es der gewünschten geschriebenen Form des Dokuments entspricht. Bei Autoren mit geringer Diktiererfahrung tritt dieses Problem noch deutlicher zutage. Das hat zur Folge, dass das gesprochene Wort erweitert, umstrukturiert oder umformuliert werden muss, um die gewünschte geschriebene Form zu erzielen. Es sind erfahrene Schreibkräfte, die diese Aufgabe routinemäßig ausführen. Um das Potenzial der Sprachtechnologie vollständig auszuschöpfen, ist es notwendig, dass sich Diktiersysteme ähnlich verhalten, d.h. sie dürfen nicht länger einfach nur geschriebene Textentwürfe produzieren, sondern müssen damit beginnen, Dokumente zu erstellen, die den formalen und informellen Anforderungen an einen geschriebenen Text entsprechen.

Was es derzeit nicht gibt, sind fehlerlose wörtliche Transkriptionen von Originaldiktaten. Nur mithilfe dieser wörtlichen Transkriptionen jedoch kann das System lernen, automatisch jene wiederkehrenden Anpassungen vorzunehmen, die erforderlich sind, damit ein Text dem gewünschten fertigen Dokument weitgehend entspricht. Darüber hinaus können große Mengen an wörtlichen Transkriptionen als Trainingsdaten verwendet werden, um die Wortfehlerrate in der Spracherkennung zu verringern. Daher werden neue Methoden entwickelt werden, die mithilfe der automatischen semantischen Annotation von Entwurfstranskriptionen und fertigen Dokumenten die automatische Rekonstruktion wörtlicher Transkriptionen ermöglichen. Dokumentpaare werden einander gegenübergestellt, um jene Textabschnitte zu identifizieren, die sich unterscheiden. Unter Verwendung der semantischen Annotation werden diese Abschnitte in Hinblick auf semantische wie auch fonetische/akustische Ähnlichkeiten erfasst.

Im Marktsegment der professionellen Dokumenterstellung wird das Einbeziehen expliziter semantischer Erkenntnisse die Qualität der Spracherkennungstechnologie dramatisch steigern. Für Endbenutzer ergeben sich durch die neue Technologie gleich zwei Vorteile: eine deutlich geringere Fehlerrate und daher weniger Korrekturbedarf sowie intelligente Hilfe bei der Strukturierung und Formatierung von Dokumenten, die es den Benutzern ermöglicht, sich voll und ganz auf den Inhalt zu konzentrieren.

Dieses Projekt ist auch Wegbereiter für künftige erfolgreiche Kooperationen zwischen den angesehenen österreichischen Forschungsinstituten ÖFAI und SPSC und ihrem Industriepartner Philips Speech Recognition Systems, GmbH (PSRS), in deren Folge ein Forschungscluster im Bereich der Spracherkennung und Semantic Speech Interpretation entstehen wird. Das Projekt ist ein weiterer wichtiger Beitrag, um die Position der Stadt Wien als internationales Zentrum für moderne Forschung und Entwicklung in der Spracherkennung zu festigen.

Behandelte Themenbereiche

Teilnehmende Organisationen

Involvierte Personen

Publikationen

Projekt-Publikationen

Eckdaten

Facts about SPARC — Click + to find similar pages.View as RDF
Relations to other articles
FundedByFIT-IT  +
Deals withAutomatic Semantic Annotation  +, and Speech Recognition  +
Wird vertreten vonHarald Trost  +
Attribute values
Logo Sparc.jpg  +
Projektname SPARC  +
Homepage http://www.sparc.or.at  +
Email mailto:Harald.Trost@ofai.at  +
Projektstart 2,005  +
Projektende 2,006  +
Laufzeit 24,00   +
Budget 535,944  +
Persönliche Werkzeuge