Este documento presenta el análisis de texto a partir de las preguntas recibidas en el proceso permanente de Rendición de Cuentas de la Universidad Nacional de Colombia para la vigencia 2019. El contenido de las preguntas aquí analizadas se recibió antes, durante y después de la audiencia de rendición de cuentas institucional la cual se llevo a cabo el jueves 11 de junio del año en curso. Las preguntas se recibieron a través de cuatro medios de comunicación institucional: Página web de Rendición de Cuentas, Facebook Live, Twitter y YouTube.
El análisis que se presenta a continuación se realizó a través de los softwares estadísticos R y la IDE Rstudio. Los procesos de importación, transformación de datos y depuración del contenido de las preguntas con el fin de eliminar artículos, preposiciones, verbos, números, signos de puntuación y caractéres especiales propios del español, se llevó a cabo a través del uso de las librerías tidytext, NLP, tm, tidyverse, readr y knitr. Las visualizaciones y la publicación web de los resultados se realizó con el apoyo de los paquetes RColorBrewer, Rmarkdown, ggplot2, wordcloud y de GitHub Pages. Finalmente, en el repositorio Rcuentas del espacio web en GitHub de la Oficina Nacional de Estadística, se encuentran disponibles los scripts empleados en este análisis.
A continuación se presenta un breve análisis sobre la cantidad y el contenido que hace parte de las preguntas recibidas. Este análisis se divide en dos partes: análisis descriptivo y análisis de texto.
Durante el proceso de Rendición de Cuentas del año 2019 se recibió un total de 704 preguntas. De estas, como se presenta en la Figura 1, la página web de Rendición de Cuentas, con un 89% (624 preguntas), fue el medio a través del cual se recibió la mayor cantidad de preguntass.
A continuación, en las figuras 2 y 3 se presentan las nubes con las 30 y 50 palabras más empleadas en las 704 preguntas recibidas en el contexto del proceso de Rendición de Cuentas 2019. Así mismo, la Figura 4, presenta la nube de palabras con las 20 palabras más empleadas en las preguntas recibidas a través de las redes sociales (80 preguntas) durante la audiciencia realizada el día 11 de junio del año 2020.