Character and Word Baselines Systems for Irony Detection in Spanish Short Texts

2016; Technical University of Valencia; Volume: 56; Issue: 56 Linguagem: Espanhol

ISSN

1135-5948

Autores

Gabriela Jasso López, Iván Meza,

Tópico(s)

Natural Language Processing Techniques

Resumo

La ironia verbal es un fenomeno linguistico en donde el significado expresado es el opuesto al significado literal del mensaje. Es un reto para el Procesamiento de Lenguaje Natural ya que se debe ensenar a un sistema una forma de reconocer y procesar el cambio de polaridad de lo expresado. Aun cuando han habido esfuerzos recientes en la identificacion de ironia y sarcasmo, ninguno de estos aborda el problema en espanol. En este trabajo nos enfocamos en establecer un sistema base de clasificacion usando caracteristicas simples al nivel de palabras y caracteres para entradas en espanol de la red social Twitter. Presentamos sistemas basados en maquinas de soporte vectorial y selvas aleatorias usando n-gramas, asi como un enfoque distribucional (i.e., word2vec).

Referência(s)