Artigo Acesso aberto Revisado por pares

Prosodic and lexical indications of discourse structure in human-machine interactions

1997; Elsevier BV; Volume: 22; Issue: 1 Linguagem: Francês

10.1016/s0167-6393(97)00011-3

ISSN

1872-7182

Autores

Marc Swerts, Mari Ostendorf,

Tópico(s)

Linguistic research and analysis

Resumo

From a discourse perspective, utterances may vary in at least two important respects: (i) they can occupy a different hierarchical position in a larger-scale information unit and (ii) they can represent different types of speech acts. Spoken language systems will improve if they adequately take into account both discourse segmentation and utterance purpose. An important question then is how such discourse-structural features can be detected. Analyses of monologues and human-human dialogues have shown that a good indicator of these factors is prosody, defined as the set of suprasegmental speech features. This paper explores whether speakers also use prosody to highlight discourse structure in a particular type of human-machine interaction, viz., information query in a travel-planning domain. More specifically, it investigates if speakers signal (i) the start of a new topic by marking the initial utterance of a discourse segment, and (ii) whether an utterance is a normal request for information or part of a correction sub-dialogue. The study reveals that in human-machine interactions, both discourse segmentation and utterance purpose can have particular prosodic correlates, although speakers also mark this information through choice of wording. Therefore, it is useful to explore in the future the possibilities of incorporating prosody in spoken language systems as a cue to discourse structure. Auf Grund der Struktur einer Rede können sich sprachliche Äuβerungen in mindestens zweierlei Hinsicht voneinander unterscheiden: (i) in ihrer hierarchischen Position in einer gröβeren Informationseinheit, und (ii) in Hinblick auf den Sprechakt, den sie vertreten. Eine adäquate Inkorporierung der Diskurssegmentierung und der Sprechakte sollte dazu beitragen, sprachliche Dialogsysteme zu verbessern. Eine wichtige Frage ist dabei, wie die strukturellen Eigenschaften einer Rede gefunden werden können. Untersuchungen von Monologen und Dialogen zwischen Menschen haben gezeigt daβ Prosodie, definiert als die Gesamtheit suprasegmenteller Spracheigenschaften, ein guter Indikator dieser Faktoren ist. Dieser Beitrag erforscht, am Beispiel eines Reiseinformationssystems, ob Sprecher Prosodie in gleicher Weise auch bei Mensch-Maschine Kommunikation benutzen. Das spezifische Ziel ist herauszufinden, ob Sprecher mit prosodischen Mitteln andeuten (i) ob eine Äuβerung die erste in einer gröβeren Informationseinheit ist, und (ii) ob eine Äuβerung eine einfache Bitte um Information ist, oder eine Korrektur. Diese Arbeit weist nach, daβ die Diskurseinheiten und Sprechakte prosodische Korrelate haben in Mensch-Maschine Dialogen, obwohl Sprecher auch lexikalische Mittel anwenden. Es ist deshalb sinnvoll, in der Zukunft die Inkorporierung prosodischer Eigenschaften in sprachlichen Dialogsystemen weiter zu untersuchen. Les énoncés d'un discours peuvent varier selon deux dimensions essentielles: (i) leur position vis-à-vis de la hiérarchie des unités du discours, (ii) leur contenu, en termes d'actes du discours. L'amélioration des systèmes de dialogue oral peut donc être substantielle s'il est convenablement tenu compte des caractéristiques structurelles du discours et de l'intention d'un énoncé. Une question importante concerne donc la détection de ces éléments structurels. L'analyse de monologues et de dialogues homme-homme montre que la prosodie est un indicateur fidèle de ces facteurs. Cet article étudie dans une application de renseignements pour voyages touristiques ou d'affaires si les locuteurs utilisent la prosodie, pour souligner la structure du discours. Plus particulièrement, il explore si les locuteurs indiquent (i) un changement de thème en marquant prosodiquement le premier énoncé d'une partie du discours, et (ii) si un énoncé donné exprime une demande d'information ou une correction dans un sous-dialogue. Cette étude montre qu'en situation de dialogue homme-machine, la segmentation du discours et l'intention d'un énoncé peuvent être spécifiquement corrélées à des indices prosodiques, bien que les locuteurs puissent également avoir recours au choix d'une phraséologie particulière. L'intégration d'indices prosodiques dans les systèmes de dialogue oral semble donc être une issue prometteuse.

Referência(s)
Altmetric
PlumX