4  Modelo P2C-T

Antes de empezar con el capítulo IV de este libro, se hará un breve repaso por lo que se ha expuesto hasta ahora. Para empezar, en el capítulo I se abordó el concepto polisémico de información desde una perspectiva pragmática. Se enfatizó la idea de la información como cosa, susceptible de ser manipulada 1, analizada y procesada. En este sentido, se destacó la estrecha relación entre la información cuantitativa y la gestión pública, donde a través de los datos se implementan estrategias o políticas de interés para los miembros de una comunidad o un país.

Más adelante, en el capítulo II, se examinó el concepto de estadísticas como un conjunto estructurado de información derivada de cifras descriptivas, el cual desempeña un papel fundamental en la representación y conexión social de los “hechos notables de un estado”. Estas estadísticas son de gran importancia para la gestión pública, ya que permiten describir y analizar de manera significativa la realidad social. Las estadísticas, como se mostró, presentan rasgos o condiciones necesarias, o intrínsecas, sin las cuales no se podría hablar de estadísticas, así como condiciones complementarias, o extrínsecas, pertinentes para su construcción y disposición en el contexto de lo público.

Para continuar, en el capítulo III se abordó el concepto de indicador como una herramienta de medición empleada en la evaluación y el monitoreo de fenómenos de interés en el ámbito de lo público. Se examinó la estrecha relación entre las cifras estadísticas y los indicadores, así como los diversos usos prácticos de estos últimos. Además, se presentó una tipología de indicadores que abarca diferentes categorías, resaltando la importancia de comprender y utilizar en conjunto cada tipo para lograr buenos procesos de gestión en lo público. Por último, se subrayó la naturaleza matemática que está a la base de la creación de indicadores, así como las diversas estrategias empleadas en su formulación.

Ahora bien, en este capítulo se exponen elementos y recomendaciones prácticas que facilitan la conformación de estadísticas e indicadores, así como de áreas de estadística o analítica de datos al interior de las instituciones. Con este objetivo en mente, se expone un modelo de carácter administrativo titulado Modelo P2C-T, compuesto por cinco dimensiones, a saber, planeación estadística (P), conceptualización y metodologías (C), producción estadística (P), disposición y gestión de herramientas tecnológicas (T) y, finalmente, cultura estadística (C). Asimismo, se resaltan tres soportes específicos con los que deben contar las organizaciones y entidades para que el modelo sea funcional: 1) apoyo institucional, 2) acceso y disposición del talento humano y 3) acceso a recursos financieros.

4.1 Definición

Como se ha visto hasta ahora, los datos 2 que resultan de los procesos de gestión en las instituciones, además de aumentar en cantidad y variedad, se consolidan como un bien de alto valor que permite, entre otras, generar información útil para la toma de decisiones; la transparencia institucional; la rendición de cuentas; el fortalecimiento de entidades y gobiernos abiertos; el seguimiento a la implementación de planes, programas o proyectos, y la realización de evaluaciones a políticas públicas. Pues bien, para hacer uso de los datos, así como de las estadísticas, indicadores y demás estrategias de medición que surgen a partir de ellos, las entidades u organizaciones deben reconocer que tal ejercicio no es coyuntural o puntual, sino que exige una apuesta institucional decidida y sostenible que demanda la definición de un modelo que permita su desarrollo a nivel institucional.

En lo que sigue del presente libro, se define el Modelo P2C-T, que resulta de la experiencia acumulada por la UNAL durante los últimos años. El modelo se define con el propósito de fortalecer la conformación de estadísticas e indicadores, especialmente en el ámbito de la educación superior, en particular en las instituciones públicas. Así las cosas, el objetivo de este capítulo no es proponer una metodología para que sea adoptada por las instituciones, para ello se recomienda la consulta de los modelos establecidos a nivel estatal.

Gráfica 5. Representación gráfica Modelo P2C-T. Fuente: elaboración propia.

Como se observa en la Gráfica 5, el Modelo P2C-T está compuesto por cinco dimensiones y tres soportes que favorecen la implementación a nivel público de acciones orientadas al uso de los datos disponibles. Las dimensiones del modelo reconocen, primero, la importancia de la planeación estadística de corto, mediano y largo plazo (P); segundo, la disposición de elementos conceptuales y metodológicos que orienten el ejercicio cuantitativo (C); tercero, la disposición de datos y la producción con calidad y de manera recurrente de la información estadística requerida a nivel institucional (P); cuarto, el acceso y el dominio de las herramientas tecnológicas requeridas para la gestión contemporánea de los datos (T); quinto, el fomento de una cultura estadística en las entidades interesadas en la gestión y uso de la información cuantitativa (C). Las dimensiones en consideración no se pueden desarrollar de manera adecuada sin la disposición de tres soportes requeridos a nivel institucional: primero, apuesta institucional para acceder al valor contenido en los datos disponibles; segundo, acceso y disposición de recursos financieros para el fortalecimiento de la actividad estadística y, tercero, acceso al talento humano especializado en la gestión de datos de naturaleza cuantitativa.

A continuación, se desarrollan cada una de las dimensiones del modelo propuesto, así como los soportes requeridos para su implementación y desarrollo.

4.2 Planeación estadística (P)

La planeación es necesaria en el ámbito de la gestión en general y de la pública en particular. Sin importar la entidad u organización, se busca establecer una serie de pasos y estrategias que permitan alcanzar determinados objetivos, es decir, se establece un plan. De acuerdo con (Rodríguez A. 2019):

La planeación en su forma más general puede ser entendida como la capacidad que tiene una entidad, a partir del comportamiento observado en el pasado, el presente y lo que ocurre en el contexto, de visualizar y formular un futuro deseado y fijar los objetivos, las metas y las estrategias requeridas para alcanzar el horizonte visualizado. Para ello, se apoya en políticas, recursos, instrumentos y mecanismos que garantizan el cumplimiento de los propósitos deseados. (§ 1.2.1)

Pues bien, la producción estadística se ve altamente favorecida si se hace uso de instrumentos de planeación general para el análisis y la proyección a nivel de las entidades. De modo que la primera apuesta que debe ser implementada en una entidad pública interesada en la producción estadística y la gestión estratégica de los datos disponibles es un ejercicio de planeación en general y de planeación estadística en particular.

La planeación permite definir una secuencia de acciones que buscan responder a unos propósitos particulares, en el caso de la planeación estadística, asociados a la consolidación de cifras, datos y, en general, información resultante de estrategias cuantitativas. Así, la planeación estadística permite, por ejemplo, recopilar, analizar, presentar y gestionar los datos relevantes de manera efectiva y oportuna; satisfacer las demandas externas para que la información resultante de los procesos de gestión cumpla con los estándares establecidos; y, además, fortalecer la toma de decisiones basada en evidencias sólidas.

La importancia de la planeación estadística es tal, que en los Objetivos de Desarrollo Sostenible, el número 17 (PNUD), sobre el fortalecimiento de los medios de implementación y la revitalización de la Alianza Mundial para el Desarrollo Sostenible, se destaca la necesidad de mejorar las capacidades estadísticas y fortalecer la producción y el uso de datos confiables y desagregados, lo que muestra la relevancia de una planeación estadística sólida para abordar los desafíos socioeconómicos, evaluar el progreso, y orientar las políticas y acciones hacia el desarrollo sostenible.

Ahora bien, de acuerdo con las necesidades y los objetivos de cada entidad u organización, se pueden establecer diversas aproximaciones y metodologías para la creación de un plan. Para la elaboración y ejecución de un plan estadístico, en Colombia, el DANE (2020c) resalta las siguientes cuatro etapas: formulación, implementación, seguimiento y evaluación.

La primera etapa, de formulación, se caracteriza, en términos del (DANE 2020c), por una fase de preparación, en la que se definen elementos como el alcance, la finalidad, los actores involucrados, entre otros. Luego, una fase de identificación, recolección y organización de información disponible que sirve para elaborar un diagnóstico de la actividad estadística vigente. Finalmente, se construye la parte estratégica del plan (objetivos, estrategias, acciones y metas) y se comunica el documento del plan estadístico resultante con los actores involucrados para la realimentación, aprobación y difusión. En esta etapa de formulación, se busca caracterizar los registros administrativos para que sirvan como fuente primaria de información para la consolidación de poblaciones y muestras.

La segunda etapa, de implementación, consiste, de acuerdo con el (DANE 2020c), en la puesta en práctica de aquello que se definió en la etapa de formulación para el plan estadístico. La implementación involucra el trabajo con diferentes actores, de modo que, en primer lugar, es necesario un proceso de articulación y coordinación entre los actores a través de una estrategia de comunicación que defina el rol y las actividades de cada uno. Para esta segunda etapa es importante programar y realizar las acciones definidas en el plan de acción y generar los productos acordados en los plazos establecidos.

La tercera etapa, de seguimiento, comprende, siguiendo al (DANE 2020c), el monitoreo periódico que se hace de la implementación del plan estadístico. Para ello, se registran de manera sistemática los avances y las evidencias de la ejecución; se presentan los resultados a través de informes de seguimiento y se definen las acciones preventivas y correctivas.

La cuarta y última etapa, de evaluación, conforme con el (DANE 2020c), pretende valorar si se alcanzaron los objetivos planteados y determinar los resultados. Para ello, la evaluación se desarrolla en dos momentos, una evaluación intermedia a la mitad de la vigencia del plan estadístico, y otra final, cuando ha concluido la vigencia. La intermedia pretende ajustar la estrategia para conseguir el efecto esperado, mientras que la final permite determinar qué estrategias necesitan un rediseño en el próximo plan estadístico. Finalmente, es importante señalar que con la etapa de evaluación se busca un mejoramiento de la actividad estadística en general, es decir, la producción, difusión y articulación entre los miembros del ecosistema de datos, así como en la calidad de la información, la accesibilidad y el uso por parte de los usuarios en el ecosistema.

El ejemplo por antonomasia de plan estadístico en Colombia es el denominado Plan Estadístico Nacional (PEN) (DANE 2020e), que es el principal recurso estratégico en la política estadística de la nación, con el objetivo central de fomentar el desarrollo, la divulgación y la aplicación de datos estadísticos. Su función primordial radica en la definición de estrategias encaminadas a asegurar la disponibilidad de información estadística precisa y detallada, facilitando, de esta manera, la toma de decisiones basadas en evidencia.

Por otra parte, la UNAL cuenta con el Plan Estadístico Institucional de la (UNAL 2018), que se realizó con el acompañamiento del DANE y para el cual se definieron cinco líneas de acción que se corresponden con las dimensiones del modelo P2C-T, sobre el cual versa este capítulo. El plan tiene como objetivo, entre otras cosas, fortalecer la producción estadística a nivel institucional y contribuir al desarrollo de la actividad estadística a nivel nacional, sobre todo, para el sistema de educación superior. Para ello se divide en cuatro líneas estratégicas: primero, la construcción de elementos conceptuales de referencia; segundo, la producción estadística; tercero, la gestión de las capacidades técnicas y tecnológicas; y, cuarto, la promoción de la cultura estadística.

4.3 Conceptualización y metodología (C)

Como se ha visto hasta ahora, el mundo de los datos está en constante crecimiento y la información disponible es tan extensa como variada. Ya sea a través de redes sociales y medios digitales, bases de datos y registros administrativos o encuestas y cuestionarios, hay una riqueza en términos de datos que permite mejorar procesos clave para el ámbito de la gestión, como son la toma de decisiones, la optimización de procesos o la evaluación y el monitoreo. En el contexto de lo público, la gestión a través de los datos adquiere, quizá, una relevancia mayor. Los países y sus entidades tienen a disposición una gran cantidad de información que permite describir y comprender, entre otras, las necesidades puntuales de una población, el estado actual y las posibilidades de mejora de procesos de gestión, así como el impacto de las directrices políticas implementadas.

No obstante, la cantidad y diversidad de datos que pueden emplearse en la gestión no garantiza de por sí el éxito o el mejoramiento de los procesos de gestión. De hecho, para que en efecto haya un avance en dichos procesos, es necesario contar con metodologías y marcos conceptuales definidos y consensuados. Así las cosas, podría decirse que para propiciar una gestión efectiva y de calidad es tan importante basar los procesos de gestión en fuentes de datos, como gestionar los datos sobre los cuales se sostienen tales procesos.

Pues bien, la gestión de los datos implica tener en cuenta que los diferentes enfoques estadísticos que se pueden aplicar a los datos 3 y sus distintos usos en el ámbito público 4 llevan consigo aspectos conceptuales, metodológicos y procedimentales diversos. Por ejemplo, diversidad de directrices, lineamientos, normativas y políticas; variedad en los alcances y usos de los datos cuantitativos; multiplicidad de disciplinas y enfoques interesados en el abordaje de datos; diversidad de propósitos y aplicaciones; amplia variedad de herramientas tecnológicas disponibles, entre otras. La unión de estos elementos crea un entramado complejo que orbita alrededor del mundo de los datos en la actualidad, como se muestra en la Gráfica 6.

Gráfica 6. Contexto contemporáneo de los datos. Fuente: Rodríguez y Bernal (2019).

De este modo, la segunda dimensión del modelo P2C-T, sobre conceptualización y metodología, tiene que ver con definir criterios para la clasificación y organización de los datos, así como normas y estándares para su recopilación, almacenamiento y uso. Lo anterior teniendo en cuenta la amplia gama de tipos de datos disponibles, enfoques de análisis, estrategias estadísticas, entidades interesadas y demás componentes propios de la diversidad de la información cuantitativa. Si tales criterios y definiciones no son tenidos en cuenta, los datos se pueden usar de manera inadecuada y, así, en la disposición de cifras o análisis cuantitativos errados o con bajos niveles de calidad que generan desinformación y desconfianza.

En busca de establecer una suerte de consenso en términos de conceptualización y metodología, se han desarrollado guías y manuales que buscan facilitar la aplicación práctica del trabajo con datos. Desde la Oficina Nacional de Estadística de la Universidad Nacional de Colombia, por ejemplo, se han destinado esfuerzos importantes al establecimiento de lineamientos conceptuales para la gestión de estadísticas e indicadores 5.

Como resultado del esfuerzo, se presenta este libro con la intención de proporcionar apoyo conceptual a las entidades públicas en el estudio y la construcción de estadísticas e indicadores institucionales. Además de este texto, la UNAL pone a disposición de los interesados un documento conceptual previo titulado Gestión de la información cuantitativa - Pistas para su abordaje en la era de la sobreinformación (Rodríguez A. 2019), así como una guía metodológica para el diseño y la construcción de indicadores de procesos recurrentes (UNAL). Estos documentos, junto con futuros trabajos, pretenden contribuir al desarrollo de lineamientos que faciliten la comprensión de la dimensión conceptual y metodológica que constituye y debe ser parte integral de la gestión cuantitativa en el ámbito público, sobre todo, de la educación superior.

4.4 Producción estadística (P)

La tercera dimensión del modelo se refiere a la producción estadística, que es, tal vez, la más importante en el modelo, pues las demás dimensiones y soportes propuestos adquieren sentido en función de esta. El propósito de gestionar datos en una entidad pública es, en sentido estricto, el de extraer el valor contenido en estos para garantizar una producción de información estadística útil, de calidad, sostenible en el tiempo y al servicio de los intereses institucionales y de la sociedad en general. Esta actividad debe realizarse en el marco de un proceso estadístico bien definido. Es decir, que se dé a través de una serie de pasos organizados, secuenciales, regulares y recurrentes que se llevan a cabo con el fin de lograr un objetivo específico. La implementación de un proceso definido garantiza la estandarización de las operaciones, mejora la eficiencia y la calidad, y facilita el seguimiento de la producción estadística.

De acuerdo con el (DANE (s.f.b). Requisitos de Calidad), el proceso estadístico debe tener unos atributos particulares que garantizan su calidad, a saber: accesibilidad, claridad, credibilidad, coherencia, comparabilidad, oportunidad, puntualidad, precisión y relevancia. Asimismo, el (DANE (s.f.b). Requisitos de Calidad) resalta la importancia de que en el proceso estadístico se evalúen la planeación, el diseño, la producción, el análisis y la difusión de los resultados de la operación estadística.

En Colombia, el proceso estadístico se establece y se evalúa a través de la Norma Técnica de la Calidad del Proceso Estadístico 6 (NTC PE 1000) del (DANE 2020d), que describe las siguientes fases constitutivas de la actividad de producción estadística: detección y análisis de necesidades, diseño, construcción, recolección o acopio, procesamiento, análisis, difusión y evaluación sistemática. La norma pretende establecer los requisitos, o pasos, de calidad que se deben cumplir en un proceso de generación de estadísticas e indicadores oficiales por parte de las entidades públicas que hacen parte del Sistema Estadístico Nacional (SEN).

En las gráficas 7 y 8 se describen las fases del proceso estadístico desde la norma NTC PE 1000:

Gráfica 7. Proceso estadístico desde la norma NTC PE 1000. Fuente: adaptado del DANE.

Gráfica 8. Etapas de evaluación NTC PE 1000. Fuente: adaptado del DANE.

Para el caso de la UNAL, la información estadística oficial se dispone y produce a través de un proceso que involucra las siguientes etapas: captura, importación, limpieza y transformación, producción y visualización, comunicación y difusión 7. Asimismo, desde el Sistema Integrado de Gestión Académica, Administrativa y Ambiental (SIGA) se disponen, para la UNAL, una serie de procedimientos del Sistema de Gestión de Calidad que buscan, entre otras cosas, armonizar los sistemas de calidad internos con normas nacionales, como la NTC PE 1000 (DANE 2020d).

A modo de ejemplificación de lo abordado en esta sección, se resalta que la producción estadística de la UNAL en la actualidad —que se dispone en la página de estadísticas institucionales— está orientada a la producción de estadísticas institucionales, entre las que se destacan, por ejemplo, estadísticas de inscritos, admitidos, estudiantes matriculados, información de graduados, información de programas académicos, estadísticas de docentes y funcionarios, estadísticas de investigación y extensión, cifras financieras, entre otras.

4.5 Tecnología (T)

Como se mencionó en este libro, tecnología y estadística han estado siempre vinculadas 8. Ya sea a través de recuentos a lápiz, codificaciones digitales, o scripts de R o Python, la producción de cifras estadísticas se ha visto permeada por herramientas que la simplifican y enriquecen. La cuarta dimensión del modelo P2C-T se refiere, pues, al uso e implementación de herramientas tecnológicas para la producción de estadísticas. Como se sabe, las TIC han transformado el proceso estadístico, lo que ha permitido una gestión más eficiente y efectiva de la información cuantitativa. Sin embargo, es crucial recordar que la tecnología debe estar al servicio de la calidad, la producción, la transparencia y la ética en la generación y el uso de las estadísticas. No basta con hacer uso de la tecnología, sino que, además, su uso debe ser adecuado.

A continuación, se exponen cuatro aspectos relacionados con el uso de las TIC en la gestión estadística. En primer lugar, se presenta una propuesta de arquitectura ideal para la gestión de datos en las entidades, sobre todo, de educación superior. Posteriormente, se describen los softwares disponibles para la gestión especializada de datos. Luego, se detallan las herramientas utilizadas por la UNAL en la gestión estadística. Por último, se destaca el aporte de la UNAL a través de la creación del paquete de R UnalR, diseñado para apoyar la gestión y producción de estadísticas institucionales.

4.5.1 Infraestructura tecnológica general para la gestión de datos

En el mundo de la gestión estadística, las herramientas tecnológicas se suelen emplear a través de una propuesta de arquitectura tecnológica sugerida para ser implementada en aquellas entidades interesadas en extraer de manera eficiente el valor contenido en los datos. Comúnmente, la arquitectura necesaria es proporcionada por la inteligencia de negocios.

Gráfica 9. Arquitectura tecnológica típica de un modelo de inteligencia de negocios. Adaptación con base en arquitecturas semejantes. Fuente: elaboración propia con base en el libro de Gestión de la Información. https://estadisticaun.github.io/L_Conceptual/2-4-inteligencia-de-negocios.html

El primer componente de la arquitectura tecnológica propuesta en la Gráfica 9 son los datos contenidos en bases de datos internas de sistemas de información, así como en registros internos, fuentes externas, encuestas o censos. A partir de allí, el segundo componente de un modelo de inteligencia de negocios son las ETL, a través de las cuales se extraen (E) los datos disponibles en las fuentes; se transforman (T) según los requerimientos definidos a nivel funcional en las entidades, y se cargan (L), o disponen, en fuentes de almacenamiento orientadas a la disposición de los datos bajo estructuras que facilitan el uso de estos con propósitos analíticos. Los desafíos en este componente incluyen desconocimiento de la arquitectura de las bases de datos, duplicidad de acciones, tecnologías diferentes, ausencia de normalización de los datos, falta de interoperabilidad, baja calidad de datos, entre otros. En la tercera fase, los datos extraídos y transformados se almacenan en bodegas de datos, data marts o data lakes. Estas bases de datos están diseñadas para mantener datos históricos provenientes de diversas fuentes de información.

Los componentes siguientes de una arquitectura de inteligencia de negocios orientada a la gestión y disposición de los datos disponibles en las entidades son las herramientas y aplicaciones tecnológicas que suministran información a los usuarios finales. Estas incluyen, por ejemplo, cubos de datos, reportes y tableros de mando (dashboards). Los cubos de datos son estrategias tecnológicas útiles para la visualización y el análisis de datos desde diferentes perspectivas y dimensiones; los reportes suministran información tabular de interés institucional, y los dashboards son la herramienta gráfica más utilizada en la actualidad para gestionar la información cuantitativa en una organización.

4.5.2 Softwares especializados en gestión de datos

Dentro de las herramientas tecnológicas más empleadas en la actualidad para el proceso de producción de cifras estadísticas están los softwares especializados en gestión de datos. Tales softwares son aplicaciones informáticas diseñadas para organizar, almacenar, analizar, visualizar o modelar grandes volúmenes de datos de manera eficiente y efectiva.

Los softwares especializados en gestión de datos se pueden clasificar en dos grandes grupos: focalizados y diversificados. Los primeros hacen referencia a recursos cuya funcionalidad y capacidad de procesamiento se centra en procesos particulares, como la visualización, y que permiten realizar operaciones matemáticas simples, así como análisis y modelamientos básicos. Además, son herramientas que funcionan principalmente a través de interfaces gráficas de usuario (GUI), por lo que no requieren altos conocimientos en programación; sin embargo, su funcionalidad está limitada a las características incorporadas en el software. Estos softwares, además, son poco escalables en la medida en que tienen limitaciones en términos de capacidad de procesamiento y manipulación de grandes volúmenes de datos y requieren, generalmente, de licencias para su uso. Algunos ejemplos de este subgrupo de softwares son Excel, Tableau, Power BI o Data Studio.

Por su parte, los softwares diversificados ofrecen una funcionalidad y capacidad de procesamiento mayor, pues permiten realizar tareas complejas, como modelado estadístico, aprendizaje automático (machine learning) y visualización interactiva y estática de datos. Asimismo, no están restringidos a una interfaz como tal; al contrario, se pueden extender con bibliotecas y paquetes adicionales que permiten una mayor flexibilidad y personalización en el procesamiento de datos, análisis y creación de visualizaciones adaptadas a las necesidades específicas del usuario. Sin embargo, es necesario contar con conocimientos en programación para aprovechar la flexibilidad y personalización que ofrecen. Las herramientas en cuestión son altamente escalables en la medida en que permiten el análisis de datos a gran escala y no requieren, generalmente, licenciamiento. Algunos ejemplos son R, SQL, Julia o Python. La Gráfica 10 da cuenta de los softwares especializados en gestión de datos focalizados y diversificados, así como de sus principales características.

Gráfica 10. Herramientas tecnológicas para la gestión de datos. Fuente: elaboración propia.

4.5.3 Herramientas tecnológicas utilizadas por la UNAL para la gestión de los datos

Hasta la fecha, en la UNAL, al igual que en muchas entidades públicas de este y otros países, no se ha implementado una arquitectura tecnológica sólida y enfocada en la gestión efectiva de datos, como la arquitectura basada en inteligencia de negocios, mencionada en la primera parte de este apartado. No obstante, esta situación no ha impedido el uso de diversas herramientas tecnológicas alternativas que facilitan la gestión de los datos disponibles y permiten, por ejemplo, disponer de cifras estadísticas oficiales como las que se encuentran en la página de estadísticas de la UNAL 9.

Con todo, en el ciclo de producción de las estadísticas institucionales de la UNAL, se emplean diversas herramientas tecnológicas a lo largo del proceso de producción. Como se muestra en la Gráfica 11, para la captura de datos se utilizan, principalmente, bases de datos Oracle; para la importación, limpieza y transformación preliminar, se recurre a Excel y otras herramientas similares; para la limpieza y transformación final de los datos, así como para la construcción de tablas y gráficas, se emplean, sobre todo, R y RStudio; en cuanto al control de versiones, disposición de repositorios, alojamiento de aplicaciones en la nube y trabajo colaborativo, se utilizan Git, GitHub y Amazon Web Services (AWS); y, por último, para la comunicación y difusión de los resultados se emplean lenguajes como HTML, CSS y JavaScript (JS) para la construcción y disposición de la información estadística en ambientes web, así como en aplicaciones haciendo uso de Shiny de R.

Gráfica 11. Herramientas tecnológicas empleadas por la UNAL en la producción de estadísticas. Fuente: elaboración propia.

Es relevante destacar que las herramientas utilizadas en el proceso de producción estadística en la UNAL pueden tener aplicaciones diversas en otras entidades, adaptándose a las necesidades y los procesos específicos de cada una. Dicho de otro modo, la variedad de herramientas y posibilidades existentes permite que cada entidad pueda elegir su propio camino en función de sus necesidades y preferencias.

4.5.4 Aporte de la UNAL a la producción de estadísticas institucionales. El paquete de R UnalR

La UNAL, durante los últimos años, ha realizado esfuerzos importantes para contribuir en la construcción y disposición de recursos tecnológicos que faciliten la gestión de cifras, especialmente en el ámbito de las estadísticas institucionales. En este sentido, se ha desarrollado el paquete UnalR 10 para el lenguaje de programación R, con el objetivo de facilitar y mejorar la gestión de microdatos, así como la visualización de cifras y estadísticas institucionales dentro del sistema de planeación institucional.

Este paquete de R, de alto uso en la UNAL 11 y disponible de manera libre, agrupa un número importante de funciones orientadas a facilitar la visualización estática e interactiva de gráficos y tablas asociadas a estadísticas e indicadores institucionales, así como la disposición de algunas funciones auxiliares que facilitan la gestión estadística institucional, sobre todo, a nivel de educación superior. Además, no solo aborda los desafíos específicos en materia de gestión estadística en esta institución, sino que también se posiciona como una opción práctica para la gestión de datos y la consolidación de cifras cuantitativas en otras entidades a nivel nacional e internacional. El paquete, alojado actualmente en GitHub 12, cuenta con una guía de instalación y ejemplos prácticos que ilustran cómo implementar las funciones de visualización gráfica y tabular a través de situaciones reales.

Invitamos a las entidades y los actores interesados en la gestión y disposición de estadísticas e indicadores institucionales a nivel nacional e internacional a hacer uso de este paquete, así como a colaborar y aportar en el desarrollo y crecimiento de este con el fin de contar a futuro con una herramienta tecnológica de acceso libre y construida en comunidad.

4.6 Cultura estadística (C)

Uno de los aspectos poco trabajados en la producción de cifras estadísticas, pero de máxima importancia, es el fortalecimiento de la cultura estadística al interior de los Estados y sus instituciones. Para lograr este objetivo, es necesario adelantar acciones en diferentes frentes.

En primer lugar, es importante fortalecer el conocimiento y la comprensión de los datos institucionales a nivel directivo y gerencial, así como la información derivada de estos, con el fin de impulsar la toma de decisiones fundamentadas. Los responsables de tomar decisiones deben ser conscientes de la importancia de utilizar datos confiables y actualizados como base para sus acciones estratégicas. En este sentido, es importante brindar capacitación y recursos adecuados que les permitan acceder y comprender la información institucional relevante. De hecho, el conocimiento y uso de la información cuantitativa contenida, por ejemplo, en estadísticas o indicadores debería ser una característica necesaria del nivel directivo, ya que su desconocimiento puede llevar a tomar decisiones basadas en creencias personales en lugar de evidencia sólida.

Otro frente importante es el fortalecimiento del conocimiento sobre la ubicación y disposición de las cifras oficiales. Es fundamental que todos los miembros de las entidades estatales, las instituciones y la sociedad en general conozcan dónde y cómo acceder a las cifras oficiales, ya sea a través de portales web, bases de datos internas u otros medios. Esto facilita la consulta y el uso de la información estadística en diferentes contextos y contribuye a una mayor transparencia y acceso a los datos.

Además, es importante fortalecer las competencias numéricas y la alfabetización estadística de los miembros de las entidades estatales, las instituciones y la sociedad en general. Esto implica mejorar la comprensión de conceptos estadísticos básicos, la interpretación de cifras y la capacidad de evaluar la calidad de los datos. El desarrollo de estas competencias permite una mejor comprensión de las cifras institucionales y una utilización más efectiva de la información cuantitativa en la toma de decisiones, por ejemplo.

Asimismo, es necesario fortalecer las competencias académicas y técnicas de los equipos encargados de la producción estadística. Estos profesionales deben contar con conocimientos actualizados en metodologías estadísticas, herramientas de análisis de datos y buenas prácticas en la gestión estadística. Esto garantiza la calidad y precisión de las estadísticas producidas, así como la aplicación de enfoques y técnicas adecuadas para abordar los desafíos específicos de los países y sus instituciones.

Para llevar a cabo estas acciones se pueden implementar diversas estrategias. Por ejemplo, se pueden utilizar correos institucionales para compartir información relevante sobre datos y estadísticas, así como para fomentar la participación y el intercambio de conocimientos entre los miembros de los Estados y sus instituciones. También se pueden realizar campañas en redes sociales para promover la importancia de la cultura estadística y compartir datos relevantes de manera accesible y atractiva.

Además, se puede disponer de videos educativos que expliquen conceptos estadísticos clave y su aplicación. Esto facilitará el aprendizaje y la comprensión de la información estadística. De igual manera, se pueden ofrecer cursos tanto virtuales como presenciales para capacitar a los miembros de las entidades estatales, las instituciones y la sociedad en general en temas estadísticos y promover el uso efectivo de los datos.

Es importante también fomentar la participación en conferencias y eventos relacionados con la gestión de datos y estadísticas. Estas instancias brindan oportunidades de aprendizaje, intercambio de experiencias y establecimiento de redes de trabajo colaborativo con otras instituciones y profesionales del campo.

4.7 Soportes del modelo P2C-T

Hasta ahora hemos explorado cómo la planeación estadística, el establecimiento de conceptos y metodologías orientadoras, la producción estadística enmarcada en un proceso organizado y recurrente, el aprovechamiento de herramientas tecnológicas, y la promoción de una cultura estadística se combinan para establecer un modelo que impulse la consolidación de cifras y el uso adecuado de datos disponibles a nivel estatal e institucional. Sin embargo, la producción estadística requiere de otros elementos que brinden apoyo y sustento a la continuidad del proceso, pues es, sobre todo, una tarea de perseverancia y permanencia, no de velocidad. A continuación, se destacan tres soportes del modelo P2CT.

4.7.1 Apoyo institucional

Las dinámicas en la esfera de lo público se dan dentro de un marco normativo y una estructura administrativa establecida. Para fomentar la gestión de datos en el ámbito de las entidades públicas, es necesario contar con normativas y una estructura administrativa adecuada que facilite su implementación y asegure su continuidad.

Sin embargo, resulta sorprendente que, aunque a lo largo de la historia se haya evidenciado la necesidad de contar con cifras y estadísticas en los Estados e instituciones, la promoción de una institucionalidad que favorezca y permita la gestión de los datos haya sido escasa, e incluso inexistente. Sin embargo, para el caso de la UNAL se pueden destacar algunos hitos normativos que han favorecido la gestión estadística de la institución.

En primer lugar, se destaca la creación del componente estadístico en lo que anteriormente se conocía como la Oficina Nacional de Planeación, la cual pasó a llamarse Dirección Nacional de Planeación y Estadística a partir de 2013. Este cambio reflejó el reconocimiento de la importancia de la estadística en el ámbito institucional.

En el Acuerdo 113 de 2013 del Consejo Superior Universitario (CSU) (UNAL 2013), se estableció la estructura interna académico-administrativa a nivel nacional de la UNAL. En el artículo 13 de este acuerdo se asignaron funciones específicas a la Dirección Nacional de Planeación y Estadística, entre las que se encuentran el monitoreo de la ejecución de la planeación y la recopilación de información académica y administrativa para producir datos estadísticos que orienten la gestión de la UNAL y sean reportados a las instituciones competentes.

Otro hito relevante fue la creación de la Oficina Nacional de Estadística, como se establece en la Resolución 383 de 2014 (UNAL 2014). Esta resolución definió la estructura interna de la Dirección Nacional de Planeación y Estadística, así como las funciones específicas de la Oficina Nacional de Estadística.

Finalmente, se destaca la creación del Régimen de Planeación y de Evaluación Permanente de Resultados de la UNAL, establecido en el Acuerdo 238 de 2017 del CSU (UNAL 2017). En el capítulo VI de este acuerdo se menciona el Sistema Integrado de Estadísticas e Indicadores como una herramienta fundamental para el monitoreo, el seguimiento y la evaluación de la UNAL. Este sistema, construido en fases, se basa en planes estadísticos institucionales que establecen la visión estadística a mediano y largo plazo, los proyectos requeridos y las fuentes de financiamiento.

4.7.2 Talento humano

El segundo elemento que garantiza el respaldo y la continuidad del modelo se relaciona directamente con las habilidades, los conocimientos y la experiencia de las personas responsables de recolectar, procesar, visualizar y analizar los datos, así como de llevar a cabo los procesos asociados. Es a través del talento humano que se asegura, en gran medida, la precisión y confiabilidad de las estadísticas generadas.

En un mundo donde las nuevas tendencias están orientadas hacia la gestión de datos, como la estadística, la inteligencia de negocios, la analítica de datos, la ingeniería de datos y el big data, es fundamental comprender el propósito detrás del uso de estos. Así, en el campo de la gestión contemporánea de los datos, dependiendo de si se buscan análisis descriptivos, correlacionales, predictivos o prescriptivos, se deben aplicar enfoques disciplinarios y perfiles especializados más adecuados. Por ello es que muchos de los programas educativos actuales 13 se centran en formar profesionales con conocimientos en matemáticas y estadísticas, habilidades avanzadas en tecnología y programación, así como una comprensión del entorno empresarial y una base teórica sólida en la medición. Sin embargo, en la práctica, se enfrentan a un desafío considerable, ya que es difícil para un único profesional desempeñar todas las tareas y poseer todos los conocimientos requeridos debido a la complejidad y diversidad de competencias exigidas en este campo.

En lugar de depender exclusivamente de un profesional especializado, es preferible conformar equipos de trabajo interdisciplinarios para abordar los desafíos de la gestión de datos. La colaboración entre expertos en diferentes áreas, como matemáticas, estadística, tecnología, programación e, incluso, economía, administración, derecho, antropología, historia o lingüística, permite aprovechar la diversidad de habilidades y perspectivas para obtener resultados más completos y sólidos. Al trabajar en conjunto, estos equipos pueden combinar sus conocimientos y enfoques disciplinarios para enfrentar los retos complejos que surgen en el análisis y uso de los datos. Esto fomenta la sinergia y la complementariedad entre los profesionales, lo que maximiza el potencial de los datos y su aplicación en diferentes contextos estatales o institucionales.

En este sentido, a lo largo del trabajo desarrollado por la Oficina Nacional de Estadística de la UNAL, se ha contado con el apoyo de diversos profesionales provenientes de diversas disciplinas. Así, se ha trabajado en colaboración con diseñadores gráficos, ingenieros industriales y de computación, expertos en ciencias sociales como la sociología, la antropología, la historia y la lingüística, así como con matemáticos, estadísticos y profesionales de áreas administrativas como la economía, la administración y la contaduría, entre otros. Todavía más, la conformación del presente libro refleja la fusión de dos áreas del conocimiento: las ciencias exactas, como la estadística y la ingeniería, y las humanidades, con la presencia de la lingüística y la sociología. Aunque estas áreas pueden parecer inicialmente distintas en la forma de entender y explicar el mundo, en realidad se complementan mutuamente en este libro para enriquecer la comprensión de la gestión de la información cuantitativa en el ámbito de lo público.

4.7.3 Recursos económicos

Los recursos económicos desempeñan un papel protagónico para el apoyo y sustento del proceso estadístico. La manera en la que los recursos económicos soportan dicho proceso se puede dividir en dos grandes grupos. En primer lugar, dentro de las entidades hay costos fijos necesarios para mantener las operaciones y garantizar la sostenibilidad y regularidad de la producción estadística. Esto incluye, por ejemplo, la disposición de personal especializado; la adquisición, el mantenimiento y la actualización de herramientas tecnológicas para la gestión de datos; los servicios de almacenamiento local o en la nube, bases de datos y difusión de resultados a través de informes, publicaciones y plataformas en línea. Aparte de los costos fijos, es importante contar, en segundo lugar, con recursos destinados a la inversión en innovación, proyectos, mejoras e investigación para estar a la vanguardia en el mundo de los datos.

A partir de la experiencia de la UNAL, desde la creación de la Oficina Nacional de Estadística de la institución, se ha asignado a un reducido grupo de funcionarios (pagados con recursos de funcionamiento), tanto a nivel nacional como en sus sedes, para liderar y mantener el ejercicio de la actividad estadística. Esta estrategia ha sido clave para sostener la base de la práctica estadística institucional a lo largo de los últimos años. Además, se han destinado recursos para la inversión a través de la formulación y el desarrollo de tres proyectos específicos, incluidos en planes de desarrollo de tres gobiernos institucionales. Estos proyectos de inversión se han diseñado para cumplir con lo establecido, principalmente, en el Plan Estadístico Institucional.


  1. Es decir, que es susceptible de ser operada o intervenida.↩︎

  2. Es decir, la información como cosa, que es susceptible de ser usada, entre otras, para la conformación de estadísticas e indicadores.↩︎

  3. Por ejemplo, descriptivo, correlacional, explicativo, predictivo y prescriptivo.↩︎

  4. Tales como la toma de decisiones, la implementación de evaluaciones de impacto, la rendición pública de cuentas o la transparencia institucional.↩︎

  5. El trabajo conceptual y metodológico adelantado hasta este momento por la Oficina Nacional de Estadística de la Universidad Nacional de Colombia se ha centrado principalmente en el estudio de la dimensión de las estadísticas y los indicadores en el escenario de lo público y, en especial, en el de las estadísticas oficiales. No obstante, falta aún profundizar a nivel conceptual en otros posibles usos de los datos disponibles en los Estados y sus entidades como, por ejemplo, la implementación de evaluaciones de impacto, la realización de estudios e investigaciones de naturaleza correlacional o explicativa, la implementación de predicciones, así como la implementación de análisis de naturaleza prescriptiva.↩︎

  6. Con base en esta norma se construye el documento del (DANE 2020b) que establece, de manera formal, los lineamientos para el proceso estadístico en el Sistema Estadístico Nacional.↩︎

  7. Las etapas, como es de esperar, se fundamentan en los lineamientos del DANE para el proceso estadístico en el Sistema Estadístico Nacional. No obstante, se adaptan a la dinámica interna de la creación de cifras estadísticas dentro de la UNAL. No se busca promover la transición a un nuevo modelo ni proponer alternativas a los documentos establecidos a nivel estatal en Colombia; simplemente, se quiere compartir la experiencia en generación de cifras estadísticas en la UNAL.↩︎

  8. En el capítulo II del presente libro, una de las características extrínsecas de las estadísticas alude al uso intensivo de las TIC, donde se menciona la relación entre tecnología y consolidación de cifras estadísticas.↩︎

  9. UNAL en un vistazo. http://estadisticas.unal.edu.co/home/↩︎

  10. UnalR. https://estadisticaun.github.io/UnalR/index.html↩︎

  11. De hecho, la manera en la que se construyen y visualizan en la web las estadísticas oficiales de esta Universidad es a través del paquete de R en mención. estadisticas.unal.edu.co/menu-principal/cifras-general/cifras-generales/↩︎

  12. UnalR. https://estadisticaun.github.io/UnalR↩︎

  13. En Colombia se puede observar este fenómeno en la promoción de estrategias estatales como los bootcamps del Ministerio de Tecnologías de la Información y Comunicaciones (MinTIC), que buscan fomentar la formación en temas relacionados con los datos. Además, instituciones de educación formal como la Universidad Externado de Colombia y la Universidad Javeriana, por ejemplo, han desarrollado programas académicos de pregrado en Ciencia de Datos. Asimismo, existe una amplia oferta de plataformas de educación en línea, como Coursera, Udemy, Edx, DataCamp, Platzi, Digital House y Soy Henry, que ofrecen cursos en esta área.↩︎