Modelo de Análisis del Tratamiento de la Misoginia Digital en Interacciones Percibidas por los Usuarios con LLMs: Un Enfoque Basado en CRISP-DM
Author/s
Carrasco Aguilar, Álvaro; Carmona Martínez, María Mercedes; Parra Meroño, María Concepción; Camacho Ruiz, MiguelDate
2025-12Discipline/s
Administración y Dirección de EmpresasSubject/s
MisoginiaTecnologías de la información y la comunicación
Violencia verbal
Ciberviolencia
Censura
Medios de comunicación
Misogyny
Information and communication technologies
Verbal violence
Cyber-violence
Censorship
Media
Abstract
Resumen: Introducción. La misoginia digital es una manifestación del discurso de odio que afecta la
seguridad y participación de las mujeres en espacios en línea. Con el auge de los Grandes Modelos de
Lenguaje (LLMs), como ChatGPT y Gemini, estos sistemas han adquirido un papel clave en multitud de
tareas que realizan los usuarios. Sin embargo, investigaciones previas han demostrado que los LLMs pueden
presentar sesgos en la detección y tratamiento del discurso misógino. Esto es de especial relevancia cuando
los LLMs interactúan de manera convencional con los usuarios, sin que se les haya indicado explícitamente
que realicen una moderación activa. Objetivos. Este trabajo propone un modelo para evaluar dicho
comportamiento de los LLMs en la moderación de mensajes misóginos en comparación con otros tipos de
discurso de odio. Se analizan dos aspectos clave: (1) la frecuencia con la que los LLMs bloquean mensajes
misóginos en relación con otros discursos de odio y (2) las caracter... Introduction. Digital misogyny is a manifestation of hate speech that affects the safety and
participation of women in online spaces. With the rise of Large Language Models (LLMs) such as ChatGPT and
Gemini, these systems have taken on a key role in a wide range of tasks performed by users. However, previous
research has shown that LLMs may exhibit biases in the detection and handling of misogynistic speech. This
issue is particularly relevant when LLMs interact conventionally with users without being explicitly instructed to
perform active moderation. Objectives. This study proposes a model to evaluate LLM behavior in the
moderation of misogynistic comments compared to other types of hate speech. Two key aspects are analyzed:
(1) the frequency with which LLMs block misogynistic comments in relation to other forms of hate speech, and
(2) the characteristics of the responses generated when such blocking does not occur. Methodology. The
study follows the CRISP-DM methodology, wi...





