Ronald Hudson - Fotolia
Cómo hacer un proyecto de analítica de datos avanzado barato
Entregar un proyecto de análisis de datos avanzado puede llegar a costar una fortuna. Pero con un poco de imaginación, los CIOs pueden hacerlo por centavos de dólar. Niel Nickolaisen explica cómo.
Los líderes de TI y los departamentos tienen una gran oportunidad para cambiar la percepción y la realidad de nuestro valor a nuestras organizaciones. Tenemos frente a nosotros –en este momento– los recursos que necesitamos para ofrecer un servicio de increíblemente alto valor a nuestras organizaciones, y hacerlo por muy poco dinero. Eso es correcto, muy barato.
Antes de contarles acerca de esta oportunidad, déjenme confesar que lo que voy a decir va a parecer contradictorio y, para muchos de ustedes, contracultural. Se nos ha dicho durante años que si queremos ofrecer servicios de alto valor a nuestras organizaciones, costarán mucho dinero. Sí, entregar servicios de alto valor podría costar una fortuna, pero no si hace lo que yo he hecho. Ahí va:
Una de las mejores maneras para que podamos mover la aguja en la vida de nuestras organizaciones es hacer un proyecto de análisis de datos avanzado, muy barato.
Sé que esto es posible porque lo he hecho (y barato). Aquí está mi historia.
Yo era el CIO en una gran universidad. Durante el tiempo en que estuve allí, el equipo de liderazgo de la universidad tenía un objetivo principal: aumentar las tasas de graduación. Cada vez que nos reuníamos, siempre hablábamos de lo que podríamos hacer para aumentar las tasas de graduación. Durante una de estas reuniones, hice de improviso una observación cínica. "Si tan solo admitimos a estudiantes que sabemos que se graduarán, nuestra tasa de graduación subiría a 100%". Todo el mundo se echó a reír y luego volvió a hablar sobre cambiar nuestro plan de estudios y nuestro modelo de apoyo a los estudiantes y nuestro modelo facultad.
Después de esa reunión, reflexioné un poco más la idea de admitir solo a aquellos estudiantes que sabíamos que se graduarían. Teníamos un modelo de admisión: un modelo construido por expertos académicos. Incluía varios factores que nos ayudaban a decidir qué estudiantes admitir. Los tres factores más importantes eran las puntuaciones de los estudiantes prospectos en los exámenes de competencia obligatoria en Inglés, Escritura y Matemáticas. Por lo tanto, cada estudiante prospecto tuvo que tomar estos exámenes (y obtener una buena puntuación en los exámenes) con el fin de entrar.
Mientras pensaba en esto, me pregunté si nuestros datos apoyaban nuestro modelo de admisión. Ciertamente, teníamos un poco de información acerca de nuestros estudiantes prospectos, los estudiantes que habíamos aceptado y aquellos que posteriormente se habían graduado. Sería muy bueno analizar estos datos para ver cómo se correlacionan con nuestro modelo de admisión. Pero, ¿cómo empezar? Yo no tenía científicos de datos reales en mi personal. No tenía el costoso entorno masivo o las herramientas para un proyecto de análisis de datos avanzado.
Pero, resultó que no necesitaba esas cosas, al menos no para empezar. Publiqué mi problema y mis conjuntos de datos (obviamente con datos anónimos, para no revelar la información personal de los estudiantes universitarios) en un sitio web de desafío de datos y dejé que algunos muy brillantes científicos de datos, analistas y estadísticos de todo el mundo crearan mi nuevo modelo de admisión por mí.
Le tomó al mundo cerca de dos semanas para desarrollar un modelo que fuera mejor de lo que esperaba que podría ser (dado mi conjunto de datos), y así declaré un ganador y emití el premio al equipo ganador. ¿Cuánto costó este trabajo avanzado de análisis de datos? 3,500 dólares (no 35,000, no 350,000, no 3.5 millones). Si el modelo de datos no funcionaba, hubiera perdido 3,500 dólares, una cantidad que podía cubrir fácilmente en mi presupuesto existente.
¿Qué valor tuvo el nuevo modelo de admisión creado para la universidad? Los datos revelaron importantes lagunas en el modelo de admisiones definido por humanos. Los datos revelaron que lo que pensábamos era el factor más importante era, en verdad, el sexto factor más importante. El segundo factor más importante era realmente el noveno más importante. Y así. A medida que nos fijamos en los datos, nos dimos cuenta de que ni siquiera necesitábamos que muchos de nuestros futuros estudiantes tomaran los exámenes de competencias en Inglés, Escritura y Matemáticas. Si sus datos para los factores más importantes eran lo suficientemente bueno, estaban admitidos.
A un costo de solo 3,500 dólares, cambiamos la manera en que operaba la universidad y sentamos las bases para un futuro de decisiones basadas en datos. Nosotros refinamos y centramos nuestro marketing y reclutamiento (ahora conocíamos las características importantes de los que serían estudiantes exitosos, así que, ¿por qué apuntar hacia alguien más?). Conociendo los factores de fondo que llevaban al éxito de los estudiantes, comenzamos a apoyar a los estudiantes en esas áreas. Por ejemplo, la falta de cursos anteriores en ciencia, tecnología, ingeniería o matemáticas (STEM) daba lugar a que no hubiera admisión. Eso significaba que los estudiantes matriculados que eran débiles en STEM necesitaban mayor atención y apoyo con el fin de aumentar sus posibilidades de éxito.
Tras el éxito de este proyecto de análisis de datos, hicimos las inversiones que llevaron a un modelo integral de análisis avanzado para soporte de estudiantes que nos ayudó a identificar a los estudiantes en riesgo para que pudiéramos volver los enormes recursos de la universidad hacia esos estudiantes y ayudarles a tener éxito.
Oh sí, y el equipo de TI fue el grupo de genios que había entregado estos asombrosos resultados.
Proyecto de análisis de datos: Primeros pasos
Si esto le interesa, así es cómo usted puede comenzar. En primer lugar, piense en algunos problemas retorcidos que han molestado a su organización por un largo tiempo. Estos problemas podrían ser la retención de clientes, los rendimientos de fabricación, las predicciones de la demanda, los objetivos de marketing, etcétera. A continuación, consulte los datos disponibles para resolver el problema.
- ¿Tiene los datos que usted puede necesitar?
- ¿En qué forma están los datos?
- ¿Qué datos le faltan y cómo puede llenar los vacíos?
Luego, encuentre un grupo dispuesto a desarrollar su modelo. Hay sitios de concursos de datos. Hay universidades locales en busca de proyectos para los estudiantes. Hay grupos de usuarios locales de big data/científicos de datos que pueden ayudarle a empezar. Y, si usted no tiene los datos para resolver su problema retorcido, usted pierde una pequeña cantidad de dinero y puede intentarlo de nuevo.
Una cosa más: Conforme nosotros construimos nuestras competencias en analítica avanzada en la universidad, nunca hicimos una gran inversión en cualquier tipo de infraestructura o entorno de big data. Requería grandes cantidades de poder de cómputo poder ejecutar nuestro modelo de "estudiantes en riesgo", pero ya que solo ejecutábamos ese modelo cada dos semanas, alquilamos ese poder de cómputo en la nube por algunas horas, dos veces al mes. Pagamos alrededor de 3,000 dólares al mes para ejecutar un modelo que consumía alrededor de 2,000 elementos de datos para más de 50,000 estudiantes. Una ganga, incluso para algo que generaba un valor bajo. De hecho, en nuestro caso era un genuino robo, ya que este modelo mejoró la retención de estudiantes en diez puntos porcentuales y generó decenas de millones de dólares en ahorros. Usted puede hacer lo mismo.
Sobre el autor: Niel Nickolaisen es CTO de O.C. Tanner Co., una empresa de consultoría en recursos humanos con sede en Salt Lake City que diseña e implementa programas de reconocimiento de los empleados. Escritor y orador frecuente sobre la transformación de TI y el liderazgo de TI, Nickolaisen tiene una maestría en ingeniería del MIT, así como un MBA y un B.S. en Física de la Universidad del Estado de Utah. Puede contactarlo en: [email protected].