Universidad de Costa Rica
  • Sobre Kérwá
  • Acceso Abierto
  • Cómo Depositar
  • Políticas
  • Contacto
    • español
    • English
  • English 
    • español
    • English
  • Login
View Item 
  •   Kérwá Home
  • Investigación
  • Ingeniería
  • Computación e informática
  • View Item
  •   Kérwá Home
  • Investigación
  • Ingeniería
  • Computación e informática
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Comparación de modelos de identificación automática de odio en comentarios de microtextos en español

tesis de maestría
Thumbnail
View/Open
TFIA Noelia Navarro Murillo (5.446Mb)
Date
2021-09
Author
Navarro Murillo, Noelia
Metadata
Show full item record
Abstract
Esta investigación se enfoca en la detección de odio en comentarios en español extraídos de Twitter. Se analiza la efectividad de los modelos de SVM (Support Vector Machine) y CNN (Convolutional Neural Network) en la identificación automática del odio en los textos. Se analizan los resultados obtenidos utilizando características de frecuencia de términos y word embeddings para SVM, así mismo el efecto de aplicar sobremuestro. Mientras, para las redes CNN se utilizaron los word embeddings. La investigación provee un corpus de textos anotados, para el cual se utilizó la guía de anotación de identificación de odio en el texto. Este trabajo busca colaborar con la investigación en español sobre la detección del odio, proporcionando el corpus anotado y el análisis de efectividad de los modelos SVM y CNN para la identificación automática del odio.
 
This research focuses on detecting hate in comments in Spanish extracted from Twitter. The effectiveness of the SVM (Support Vector Machine) and CNN (Convolutional Neural Network) models in identifying hate in texts is analyzed. The results were analyzed using characteristics of term frequency and word embeddings for SVM, as well as the effect of oversampling. Meanwhile, for CNN word embeddings were used. The research provides a corpus of texts annotated by people following an annotation guide for the manual identification of hate speech. This work has the aim to collaborate with the Spanish research on hate speech detection. It provides the annotated corpus and the performance results analysis for the SVM and CNN models used to identify hate in text.
 
URI
https://hdl.handle.net/10669/84459
Collections
  • Computación e informática [193]



  • Repositorios universitarios

  • Repositorio del SIBDI-UCR
  • Biblioteca Digital del CIICLA
  • Repositorio Documental Rafael Obregón Loría (CIHAC)
  • Biblioteca Digital Carlos Melendez (CIHAC)
  • Repositorio de Fotografías
  • Colección de videos de UPA-VAS
  • Sitios recomendados

  • Buscador regional de LA Referencia
  • Buscador del Open ROAR
  • Scientific Electronic Library Online (SciELO)
  • Directory of Open Access Journals (DOAJ)
  • Redalyc
  • Redes sociales

  • facebook.com/repositoriokerwa
  • @Ciencia_UCR
  • Sobre Kérwá
  • Acceso Abierto
  • Cómo depositar
  • Políticas
Contact Us | Send Feedback
Repositorio Institucional de la Universidad de Costa Rica. Algunos derechos reservados. Este repositorio funciona con DSpace.
 

 

Browse

All of KérwáCommunities & CollectionsTitlesAuthorsSubjectsProcedenceTypeThis CollectionTitlesAuthorsSubjectsProcedenceType

My Account

LoginRegister

  • Repositorios universitarios

  • Repositorio del SIBDI-UCR
  • Biblioteca Digital del CIICLA
  • Repositorio Documental Rafael Obregón Loría (CIHAC)
  • Biblioteca Digital Carlos Melendez (CIHAC)
  • Repositorio de Fotografías
  • Colección de videos de UPA-VAS
  • Sitios recomendados

  • Buscador regional de LA Referencia
  • Buscador del Open ROAR
  • Scientific Electronic Library Online (SciELO)
  • Directory of Open Access Journals (DOAJ)
  • Redalyc
  • Redes sociales

  • facebook.com/repositoriokerwa
  • @Ciencia_UCR
  • Sobre Kérwá
  • Acceso Abierto
  • Cómo depositar
  • Políticas
Contact Us | Send Feedback
Repositorio Institucional de la Universidad de Costa Rica. Algunos derechos reservados. Este repositorio funciona con DSpace.