Definition

Visualización de datos

La visualización de datos es la práctica de traducir información en un contexto visual, como un mapa o gráfico, para facilitar que el cerebro humano comprenda y extraiga información útil. El objetivo principal de la visualización de datos es facilitar la identificación de patrones, tendencias y valores atípicos en grandes conjuntos de datos. El término a menudo se usa indistintamente con otros, incluidos gráficos de información, visualización de información y gráficos estadísticos.

La visualización de datos es uno de los pasos del proceso de ciencia de datos, que establece que una vez que los datos se han recopilado, procesado y modelado, deben visualizarse para obtener conclusiones. La visualización de datos también es un elemento de la disciplina más amplia de la arquitectura de presentación de datos (DPA), que tiene como objetivo identificar, localizar, manipular, formatear y entregar datos de la manera más eficiente posible.

La visualización de datos es importante para casi todas las carreras. Puede ser utilizado por los maestros para mostrar los resultados de las pruebas de los estudiantes, por científicos informáticos que exploran los avances en inteligencia artificial (IA) o por ejecutivos que buscan compartir información con las partes interesadas. También juega un papel importante en proyectos de big data. A medida que las empresas acumulaban colecciones masivas de datos durante los primeros años de la tendencia de los grandes datos, necesitaban una forma de obtener una visión general de sus datos de manera rápida y fácil. Las herramientas de visualización eran un ajuste natural.

La visualización es fundamental para el análisis avanzado por razones similares. Cuando un científico de datos escribe algoritmos avanzados de análisis predictivo o aprendizaje automático (machine learning o ML), se vuelve importante visualizar los resultados para monitorear los resultados y garantizar que los modelos funcionen según lo previsto. Esto se debe a que las visualizaciones de algoritmos complejos son generalmente más fáciles de interpretar que las salidas numéricas.

¿Por qué es importante la visualización de datos?

La visualización de datos proporciona una forma rápida y efectiva de comunicar información de manera universal utilizando información visual. La práctica también puede ayudar a las empresas a identificar qué factores afectan el comportamiento del cliente; determinar áreas que necesitan ser mejoradas o que necesitan más atención; hacer que los datos sean más memorables para las partes interesadas; entender cuándo y dónde colocar productos específicos; y predecir los volúmenes de ventas.

Otros beneficios de la visualización de datos incluyen:

  • la capacidad de absorber información rápidamente, mejorar los conocimientos y tomar decisiones más rápidas;
  • una mayor comprensión de los próximos pasos que deben tomarse para mejorar la organización;
  • una capacidad mejorada para mantener el interés de la audiencia con información que puedan entender;
  • una distribución fácil de información que aumenta la oportunidad de compartir ideas con todos los involucrados;
  • eliminar la necesidad de científicos de datos ya que los datos son más accesibles y comprensibles; y
  • una mayor capacidad para actuar sobre los resultados rápidamente y, por lo tanto, lograr el éxito con mayor velocidad y menos errores.

Visualización de datos y big data

La creciente popularidad de los proyectos de big data y análisis de datos ha hecho que la visualización sea más importante que nunca. Las empresas utilizan cada vez más el aprendizaje automático para recopilar grandes cantidades de datos que pueden ser difíciles y lentos de clasificar, comprender y explicar. La visualización ofrece un medio para acelerar esto y presentar información a los dueños de negocios y partes interesadas de manera que la puedan entender.

La visualización de grandes volúmenes de datos a menudo va más allá de las técnicas típicas utilizadas en la visualización normal, como gráficos circulares, histogramas y gráficos corporativos. En su lugar, utiliza representaciones más complejas, como mapas de calor y gráficos de fiebre. La visualización de big data requiere potentes sistemas informáticos para recopilar datos sin procesar, procesarlos y convertirlos en representaciones gráficas que los humanos puedan usar para obtener información útil rápidamente.

Si bien la visualización de big data puede ser beneficiosa, puede presentar varias desventajas para las organizaciones. Son los siguientes:

  • Para aprovechar al máximo las herramientas de visualización de big data, se debe contratar a un especialista en visualización. Este especialista debe poder identificar los mejores conjuntos de datos y estilos de visualización para garantizar que las organizaciones estén optimizando el uso de sus datos.
  • Los proyectos de visualización de big data a menudo requieren la participación de TI, así como la administración, ya que la visualización de big data requiere hardware informático potente, sistemas de almacenamiento eficientes e incluso un cambio a la nube.
  • Los conocimientos proporcionados por la visualización de big data solo serán tan precisos como la información que se visualiza. Por lo tanto, es esencial contar con personas y procesos para gobernar y controlar la calidad de los datos corporativos, metadatos y fuentes de datos.

Ejemplos de visualización de datos

En los primeros días de la visualización, la técnica de visualización más común era usar una hoja de cálculo de Microsoft Excel para transformar la información en una tabla, gráfico de barras o gráfico circular. Si bien estos métodos de visualización todavía se usan comúnmente, ahora hay disponibles técnicas más complejas, que incluyen:

  • Infografía
  • Nubes de burbujas
  • Gráficos de viñetas
  • Mapas de calor
  • Tablas de fiebre
  • Gráficos de series de tiempo

Algunas otras técnicas populares incluyen:

Gráficos lineales. Esta es una de las técnicas más básicas y comunes utilizadas. Los gráficos de líneas muestran cómo las variables pueden cambiar con el tiempo.

Cartas de área. Este método de visualización es una variación de un gráfico de líneas; muestra múltiples valores en una serie de tiempo, o una secuencia de datos recopilados en puntos consecutivos e igualmente espaciados en el tiempo.

Gráfico de dispersión. Esta técnica muestra la relación entre dos variables. Un diagrama de dispersión toma la forma de un eje X o Y con puntos para representar puntos de datos.

Mapas de árbol. Este método muestra datos jerárquicos en un formato anidado. El tamaño de los rectángulos utilizados para cada categoría es proporcional a su porcentaje del total. Los mapas de árbol se usan mejor cuando hay varias categorías presentes, y el objetivo es comparar diferentes partes de un todo.

Pirámides de población. Esta técnica utiliza un gráfico de barras apiladas para mostrar la compleja narrativa social de una población. Se utiliza mejor cuando se intenta mostrar la distribución de una población.

Casos de uso comunes de visualización de datos

Los casos de uso comunes para la visualización de datos incluyen:

Ventas y marketing. La investigación de la agencia de medios Magna predice que la mitad de todos los dólares de publicidad global se gastarán en línea en 2020. Como resultado, los equipos de marketing deben prestar mucha atención a sus fuentes de tráfico web y cómo sus propiedades web generan ingresos. La visualización de datos facilita ver las tendencias del tráfico a lo largo del tiempo como resultado de los esfuerzos de marketing.

Política. Un uso común de la visualización de datos en política es un mapa geográfico que muestra el partido por el que votó cada estado o distrito.

Cuidado de la salud. Los profesionales de la salud con frecuencia usan mapas coropléticos para visualizar datos importantes de salud. Un mapa coroplético muestra áreas geográficas o regiones divididas a las que se les asigna un determinado color en relación con una variable numérica. Los mapas coropléticos permiten a los profesionales ver cómo una variable, como la tasa de mortalidad por enfermedad cardíaca, cambia en territorios específicos.

Científicos. La visualización científica, a veces denominada en forma abreviada como SciVis, permite a los científicos e investigadores obtener una mayor comprensión de sus datos experimentales.

Finanzas. Los profesionales de finanzas deben realizar un seguimiento del desempeño de sus decisiones de inversión al elegir comprar o vender un activo. Los gráficos de velas se utilizan como herramientas de negociación y ayudan a los profesionales financieros a analizar los movimientos de los precios a lo largo del tiempo, mostrando información importante, como valores, derivados, monedas, acciones, bonos y materias primas. Al analizar cómo ha cambiado el precio con el tiempo, los analistas de datos y los profesionales de finanzas pueden detectar tendencias.

Logística. Las compañías navieras pueden usar herramientas de visualización para determinar las mejores rutas de envío globales.

Datos científicos e investigadores. Las visualizaciones creadas por científicos de datos suelen ser para uso propio del científico o para presentar la información a un público selecto. Las representaciones visuales se crean utilizando bibliotecas de visualización de los lenguajes y herramientas de programación elegidos. Los científicos e investigadores de datos utilizan con frecuencia lenguajes de programación de código abierto, como Python, o herramientas patentadas diseñadas para análisis de datos complejos. La visualización de datos realizada por estos científicos e investigadores de datos les ayuda a comprender conjuntos de datos e identificar patrones y tendencias que de otro modo habrían pasado desapercibidos.

La ciencia de la visualización de datos

La ciencia de la visualización de datos proviene de la comprensión de cómo los humanos recopilan y procesan la información. Daniel Kahn y Amos Tversky colaboraron en una investigación que definió dos métodos diferentes para recopilar y procesar información.

El sistema 1 se centra en el procesamiento del pensamiento que es rápido, automático e inconsciente. Este método se usa con frecuencia en la vida cotidiana y ayuda a lograr:

  • leer el texto en un letrero;
  • resolver problemas matemáticos simples, como 1 + 1;
  • identificar de dónde viene un sonido;
  • montar una bicicleta; y
  • determinar la diferencia entre colores.

El sistema 2 se enfoca en un procesamiento de pensamiento lento, lógico, calculador y poco frecuente. Este método se usa para:

  • recitar un número de teléfono;
  • resolver problemas matemáticos complejos, como 132 x 154;
  • determinar la diferencia en el significado entre múltiples signos de pie uno al lado del otro; y
  • comprender señales sociales complejas.

Herramientas y proveedores de visualización de datos

Las herramientas de visualización de datos se pueden usar de varias maneras. El uso más común hoy en día es como herramienta de informes de inteligencia empresarial (Business Intelligence, BI). Los usuarios pueden configurar herramientas de visualización para generar paneles de control automáticos que rastrean el rendimiento de la empresa a través de indicadores clave de rendimiento (Key Performance Indicators o KPIs) e interpretan visualmente los resultados.

Las imágenes generadas también pueden incluir capacidades interactivas, lo que permite a los usuarios manipularlas o mirar más de cerca los datos para preguntas y análisis. También se pueden integrar indicadores diseñados para alertar a los usuarios cuando los datos se han actualizado o cuando ocurren condiciones predefinidas.

Muchos departamentos comerciales implementan software de visualización de datos para rastrear sus propias iniciativas. Por ejemplo, un equipo de marketing podría implementar el software para monitorear el rendimiento de una campaña de correo electrónico, rastreando métricas como la tasa de apertura, la tasa de clics y la tasa de conversión.

A medida que los proveedores de visualización de datos amplían la funcionalidad de estas herramientas, se utilizan cada vez más como interfaces para entornos de big data más sofisticados. En esta configuración, el software de visualización de datos ayuda a los ingenieros y científicos de datos a realizar un seguimiento de las fuentes de datos y hacer un análisis exploratorio básico de conjuntos de datos antes o después de análisis avanzados más detallados.

Los nombres más importantes en el mercado de herramientas de big data incluyen Microsoft, IBM, SAP y SAS. Algunos otros proveedores ofrecen software especializado de visualización de big data; los nombres populares en este mercado incluyen Tableau, Qlik y Tibco.

Si bien Microsoft Excel continúa siendo una herramienta popular para la visualización de datos, se han creado otros que brindan capacidades más sofisticadas. Los ejemplos incluyen:

  • IBM Cognos Analytics
  • Qlik Sense y QlikView
  • Microsoft Power BI
  • Oracle Visual Analyzer
  • SAP Lumira
  • SAS Visual Analytics
  • Tibco Spotfire
  • Zoho Analytics
  • D3.js
  • Jupyter
  • MicroStrategy
  • Google Charts

 

Este contenido se actualizó por última vez en marzo 2020

Investigue más sobre Análisis de negocios y BI