Character and Word Baselines Systems for Irony Detection in Spanish Short Texts
2016; Technical University of Valencia; Volume: 56; Issue: 56 Linguagem: Espanhol
ISSN
1135-5948
AutoresGabriela Jasso López, Iván Meza,
Tópico(s)Natural Language Processing Techniques
ResumoLa ironia verbal es un fenomeno linguistico en donde el significado expresado es el opuesto al significado literal del mensaje. Es un reto para el Procesamiento de Lenguaje Natural ya que se debe ensenar a un sistema una forma de reconocer y procesar el cambio de polaridad de lo expresado. Aun cuando han habido esfuerzos recientes en la identificacion de ironia y sarcasmo, ninguno de estos aborda el problema en espanol. En este trabajo nos enfocamos en establecer un sistema base de clasificacion usando caracteristicas simples al nivel de palabras y caracteres para entradas en espanol de la red social Twitter. Presentamos sistemas basados en maquinas de soporte vectorial y selvas aleatorias usando n-gramas, asi como un enfoque distribucional (i.e., word2vec).
Referência(s)