Definition

Linaje de datos

El linaje de los datos es el historial de los datos, incluido el lugar donde los datos han viajado a lo largo de su existencia dentro de una organización. El linaje de datos es una parte necesaria del cumplimiento de la política de datos corporativos y gubernamentales. El seguimiento del historial de datos se logra mediante la documentación y el software de linaje de datos. Sin una forma de identificar dónde se introducen los errores de datos en el entorno, es difícil para los administradores de datos identificar y solucionar problemas de calidad de los datos.

Con herramientas eficaces, la gobernanza de los datos se puede facilitar mediante la documentación de todo el recorrido de los datos a través de la organización. La documentación del linaje de datos ayuda a simplificar dos de las principales preocupaciones de la gobernanza de datos en cuanto a los efectos de los cambios en los datos: análisis de causa raíz y análisis de impacto empresarial (BIA). La comprensión clara de las causas fundamentales y los impactos de los problemas con los datos obtienen ayuda al saber todo lo que sucedió con los datos desde que surgieron.

En el desarrollo de software, el seguimiento del linaje de datos puede ayudar a conciliar las dificultades entre las mejores prácticas de desarrollo ágil, las regulaciones de gobierno de datos y la política de datos de la empresa. Las herramientas y los procedimientos de linaje de datos ayudan a rastrear dónde se introdujeron las fallas de datos, lo que puede facilitar los diagnósticos y la corrección.

Implementar el seguimiento del linaje de datos puede ser difícil y, a menudo, se considera de baja prioridad; sin embargo, la corrección más temprana significa menos propagación de errores, lo que significa que, a menudo, la implementación de herramientas de linaje de datos al principio del proceso demuestra que vale la pena el esfuerzo.

Este contenido se actualizó por última vez en enero 2021

Investigue más sobre Almacenamiento flash y en drives