Fernández Ortega, Alfredo SimónLondoño Navarro, Laura Milena2025-06-192025-06-192025https://hdl.handle.net/11396/8825Resumen Este estudio presenta un análisis comparativo del contenido legislativo sancionado durante los primeros dos años de los gobiernos de Iván Duque y Gustavo Petro en Colombia. Para ello, se emplearon diversas técnicas de extracción de texto (PyPDF y OCR Tesseract) que permitieron obtener de manera eficiente y precisa el contenido de las leyes. Posteriormente, se aplicaron metodologías avanzadas de Procesamiento de Lenguaje Natural (PLN) para el modelado y agrupación de tópicos utilizando la librería BERTopic. Este modelo, combinado con UMAP como técnica de reducción de dimensionalidad y HDBSCAN para el clustering, se configuró en tres métodos distintos que variaron en el modelo de embeddings, la vectorización del texto (completo vs. palabras clave extraídas con YAKE) y los parámetros de UMAP/HDBSCAN. El objetivo principal fue identificar y comparar las prioridades legislativas de ambos gobiernos mediante la frecuencia de palabras clave y la distribución temática de los documentos legislativos, aplicando filtros para eliminar términos irrelevantes y enfocándose en los términos más representativos de cada corpus. Los resultados revelan diferencias significativas en las agendas legislativas de ambos periodos. La producción legislativa del gobierno de Gustavo Petro se centra en la protección de derechos (especialmente de mujeres y víctimas), la cooperación internacional, la promoción cultural y la conservación ambiental. En contraste, la producción legislativa del gobierno de Iván Duque prioriza la salud, la educación, las políticas financieras y la estabilización económica, con un enfoque adicional en el deporte y la seguridad alimentaria. Además, se observó que el método de Embeddings Robustos + Texto Completo, logró el mejor equilibrio entre diversidad temática y cohesión, asignando casi todos los documentos a tópicos coherentes. Este estudio subraya la eficacia de las técnicas de PLN y los modelos de embeddings en el análisis legislativo, proporcionando una herramienta valiosa para comprender las prioridades políticas y la evolución de las agendas públicas en diferentes administraciones.spaAttribution-NonCommercial-NoDerivatives 4.0 InternationalAnálisis comparativo del contenido y temas legislativos sancionados durante los gobiernos de Iván Duque y Gustavo Petro en sus primeros dos añosmaster thesisAnálisis LegislativoProcesamiento de Lenguaje Natural,OCR TesseractPyPDFYAKEBERTopicUMAPHDBSCANGobierno Iván DuqueGobierno Gustavo PetroEmbeddings en Españolhttp://purl.org/coar/access_right/c_abf2