2.1 Los datos
Los datos, según (“Etymonline” 2016), citado en el Conpes 3920, son “la representación primaria de variables cualitativas y cuantitativas que son almacenables, transferibles, pueden ser visualizados, controlados y entendidos”88. Así mismo, según este documento, los datos en la actualidad pueden ser clasificados en estructurados, semiestructurados y no estructurados según su grado de afinidad con las siguientes definiciones89.
Estructurados: están organizados conforme a un modelo o esquema. Se almacenan en forma tabular y algunas veces su estructura también incluye la definición de las relaciones entre ellos. Típicamente están representados en bases de datos que hacen parte del funcionamiento de sistemas de información.
Semiestructurados: su organización y presentación tiene una estructura básica (etiquetas o marcadores), pero no tienen establecida una definición de relaciones en su contenido. En esta categoría se incluyen contenidos de correos electrónicos, tuits, archivos XML.
No estructurados: su organización y presentación no está guiada por ningún modelo o esquema. En esta categoría se incluyen las imágenes, texto, audios, contenidos de redes sociales, videos, entre otros.
Hace no más de 30 años el mundo de los datos estaba gobernado por aquellos de naturaleza estructurada; hoy estos conservan un lugar especial, pero el protagonismo está pasando, gracias a la incidencia de las nuevas tecnologías, al escenario de lo semiestructurado y lo no estructurado. Esta realidad ha implicado grandes transformaciones, entre ellas, en la forma como los datos son capturados, procesados y, sobre todo, analizados. De un escenario del análisis de datos centrado en la matemática y la estadística, estamos incursionando en uno donde están participando nuevos fenómenos, disciplinas y marcos de trabajo soportados en gran medida en las nuevas tecnologías de la información y las comunicaciones. El Big Data, la analítica o minería de datos, la inteligencia de negocios y la ciencia de los datos se han sumado hoy a la matemática y la estadística para conformar un verdadero arsenal capaz de enfrentar y extraer el conocimiento oculto en conjuntos de datos que hoy crecen de manera vertiginosa en cantidad y variedad.
Referencias
“Etymonline.” 2016. http://www.etymonline.com/index.php?term=data.