Modelo de Análisis del Tratamiento de la Misoginia Digital en Interacciones Percibidas por los Usuarios con LLMs: Un Enfoque Basado en CRISP-DM

Carrasco Aguilar, Álvaro; Carmona Martínez, María Mercedes; Parra Meroño, María Concepción; Camacho Ruiz, Miguel

doi:10.5209/infe.101149

Date

2025-12

Discipline/s

Administración y Dirección de Empresas

Subject/s

Misoginia
Tecnologías de la información y la comunicación
Violencia verbal
Ciberviolencia
Censura
Medios de comunicación
Misogyny
Information and communication technologies
Verbal violence
Cyber-violence
Censorship
Media

Abstract

Resumen: Introducción. La misoginia digital es una manifestación del discurso de odio que afecta la seguridad y participación de las mujeres en espacios en línea. Con el auge de los Grandes Modelos de Lenguaje (LLMs), como ChatGPT y Gemini, estos sistemas han adquirido un papel clave en multitud de tareas que realizan los usuarios. Sin embargo, investigaciones previas han demostrado que los LLMs pueden presentar sesgos en la detección y tratamiento del discurso misógino. Esto es de especial relevancia cuando los LLMs interactúan de manera convencional con los usuarios, sin que se les haya indicado explícitamente que realicen una moderación activa. Objetivos. Este trabajo propone un modelo para evaluar dicho comportamiento de los LLMs en la moderación de mensajes misóginos en comparación con otros tipos de discurso de odio. Se analizan dos aspectos clave: (1) la frecuencia con la que los LLMs bloquean mensajes misóginos en relación con otros discursos de odio y (2) las caracter...

Introduction. Digital misogyny is a manifestation of hate speech that affects the safety and participation of women in online spaces. With the rise of Large Language Models (LLMs) such as ChatGPT and Gemini, these systems have taken on a key role in a wide range of tasks performed by users. However, previous research has shown that LLMs may exhibit biases in the detection and handling of misogynistic speech. This issue is particularly relevant when LLMs interact conventionally with users without being explicitly instructed to perform active moderation. Objectives. This study proposes a model to evaluate LLM behavior in the moderation of misogynistic comments compared to other types of hate speech. Two key aspects are analyzed: (1) the frequency with which LLMs block misogynistic comments in relation to other forms of hate speech, and (2) the characteristics of the responses generated when such blocking does not occur. Methodology. The study follows the CRISP-DM methodology, wi...

Collections

Publicaciones

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional