The MATE workbench – An annotation tool for XML coded speech corpora
2001; Elsevier BV; Volume: 33; Issue: 1-2 Linguagem: Inglês
10.1016/s0167-6393(00)00071-6
ISSN1872-7182
AutoresDavid McKelvie, Amy Isard, Andreas Mengel, Morten Baun Møller, Michael Grosse, Marion Klein,
Tópico(s)Phonetics and Phonology Research
ResumoThis paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs. Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme. Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.
Referência(s)