Calidad de los datos dentro de una organización

Calidad de los datos dentro de una organización

Comencemos respondiendo una pregunta simple ¿Qué son datos de calidad?, estos se refieren a los datos que representan la realidad que pretenden describir. Aunque no es posible evaluar directamente la exactitud o precisión de los datos. Existen metodologías como la Autoevaluación de la Calidad del Dato o Auditoría de Calidad del Dato; que permiten analizar algunos de los atributos de los datos y del sistema de información, aportando información que permite mejorarla.

Te puede interesar: Perfil de los científicos de datos y su papel en la 4° revolución industrial

Modelo de Calidad de los Datos

Según el Modelo de Calidad de los Datos (Norma ISO 25012); esta es la cualidad de un conjunto de información, recogida en una base de datos o un sistema de información. Entre sus características están, la exactitud, completitud, integridad, actualización, coherencia, relevancia, accesibilidad y confiabilidad necesarias para que estos datos resulten útiles en el procesamiento.

¿Cuál es la importancia de la calidad de datos en la Big Data?

Si deseas tomar buenas decisiones en tu negocio, la calidad de los datos es sumamente indispensable para apoyar de manera efectiva las decisiones empresariales. Todo se debe a que si consigues gran cantidad de datos pero estos no tienen calidad las decisiones que tomes para tu negocio no serán acertadas y pueden llevarte a tener dificultades. De nada sirve realizar un análisis y llegar a conclusiones que se esperan apoye la toma de decisiones importantes si la calidad de datos es deficiente. 

¿Cómo se puede medir la calidad de los datos?

No existen estandarizaciones, ni una talla única en lo que se refiere a Calidad de datos (Data Quality). Mantener la exactitud e integridad de todos los tipos de datos en la organización es trabajar por su aptitud para cumplir con su propósito en un contexto dado. Pero hemos reunido algunas características que los datos obtenidos deben tener para considerarse de valor o calidad.

  • Exactitud:

También conocida como validez. Los datos exactos se consideran correctos: los datos miden lo que se pretende medir. Los datos exactos reducen al mínimo los errores  hasta tal punto que llegan a ser insignificantes.

  • Precisión:

Implica que los datos tienen detalles suficientes y apropiados.

  • Accesibilidad:

Mide el grado de inclusión de todos de los resultados notificados. Representa el grado en que la información es recibida por la lista completa de personas o unidades pertinentes y no solo por una parte de la lista.

  • Oportunidad:

Los datos son oportunos cuando la información está disponible antes de la fecha establecida como plazo para hacer la notificación. Es decir, este atributo de la calidad de datos permite conocer si éstos están disponibles cuando se requiere.

  • Integridad:

Los datos tienen integridad cuando el sistema utilizado para generarlos está protegido de sesgos deliberados o de manipulaciones por razones políticas o personales. La integridad puede estar indicada por la ausencia de alteraciones de los datos entre dos actualizaciones de un registro de datos. En la integridad de los datos influyen directamente la exactitud de los datos almacenados.

  • Actualidad:

Los datos deben estar siempre actualizados con el día a día de la empresa. 

  • Coherencia:

Grado en que una pieza única de datos contiene el mismo valor a través de múltiples conjuntos de datos.

¿Cuáles son los diferentes tipos de datos que afectan la calidad de estos?

Obtener datos limpios es un desafío, requiere compartir información presisa entre dispositivos y formatos que no se integran fácilmente. Hoy día es frecuente encontrar datos que no están limpios o datos desestructurados. Un problema añadido a las cuestiones de calidad de datos es que la mayoría de los sistemas requieren el uso de la entrada manual de datos, que expone a la organización a errores humanos.

Entre los tipos de datos que mayores efectos adversos pueden provocar en términos de calidad se encuentran:

  • Datos oscuros:

Son los datos que se recopilan, procesan y almacenan como parte de las actividades comerciales cotidianas, pero que la organización no utiliza con ningún otro fin. Su existencia revela que el sistema de calidad de datos de la empresa no es el óptimo ni está lo suficientemente avanzado, puesto que permite que en la recopilación y gestión de datos les falte eficiencia y eficacia.

  • Datos sucios:

Este tipo de datos supone un grave problema de calidad, en un entorno como la nube. En el ámbito de sistemas automatizados, los datos sucios pueden causar en la organización un daño real, al obligarla a incurrir en un costo económico causado por las acciones automáticas que dan inicio con datos que no son válidos.

  • Datos no estructurados: 

En ocasiones, los datos están disponibles, pero no están preparados para su uso. Deben ser enriquecidos de alguna manera para poder considerarse compatibles con el sistema que los va a consumir. Si no se hace, los problemas de calidad empezarán a aparecer.

¿Cómo se puede gestionar la calidad de los datos?

Para que las empresas puedan estar seguras de la calidad de datos que manejan, deben recurrir a una Gestión de la calidad de los datos (Data Quality Management). La DQM (por sus siglas en inglés) es una forma de administración que abarca desde la definición y designación de roles hasta el despliegue de funciones, de la definición de políticas y responsabilidades al establecimiento de procedimientos para la adquisición, mantenimiento, disposición y distribución de datos.

Sabemos que un enfoque eficaz de la gestión de la calidad de los datos comprende tanto elementos reactivos, que incluyen la gestión de problemas en los datos situados en bases de datos existentes; como elementos proactivos, que son los que tiene que ver con:

  • Establecimiento de la gobernanza.
  • Identificación de las funciones y responsabilidades.
  • Creación de las expectativas de calidad, así como de las estrategias empresariales de apoyo.
  • Implementación de una plataforma técnica que facilite estas prácticas empresariales.

Ver también:  Calidad de Datos. Cómo impulsar tu negocio con los datos.

En resumen; organizaciones públicas y privadas deben ver la calidad de datos como objetivo estratégico e implementar planes de gestión de calidad. Asegurar la calidad de la información contenida en las bases de datos y su alineación con los objetivos de negocio. Una iniciativa de gestión de calidad de los datos tiene éxito, si se garantiza la cooperación entre las áreas de IT y negocio. 

cerrar