Las habilidades de ciencia de datos con más demanda que necesitará
Con el aumento de la necesidad de científicos de datos, también se demandan habilidades asociadas con el rol. Echa un vistazo a estas habilidades principales para uno de los mejores trabajos.
Según el «Informe de empleos emergentes» de LinkedIn en Estados Unidos de este mes, los científicos de datos tuvieron el tercer mayor crecimiento anual, con un 37 %, y han estado en la cima del informe durante los últimos tres años. Eso pone a los científicos de datos, y las habilidades de ciencia de datos, en gran demanda.
Las habilidades requeridas para trabajos de científicos de datos incluyen aprendizaje automático, Python, R y Apache Spark, según el informe de LinkedIn. Pero una vez que se tiene esos fundamentos, ¿qué hace un científico de datos a continuación para prepararse para el futuro de su carrera? Los expertos recomiendan estas habilidades primarias para los científicos de datos.
Conocimiento del negocio
Los científicos de datos más buscados no solo saben cómo usar la tecnología, sino cuándo usarla y por qué, dicen los expertos. Eso requiere una comprensión de los beneficios comerciales de los datos, así como la capacidad de comunicar estos beneficios a ejecutivos y colegas en otras áreas de la empresa.
«He visto que muchos científicos de datos tienen una buena comprensión de los modelos y no tienen ningún impacto comercial», dijo Andrew Fast, científico jefe de datos de CounterFlow Inc., una compañía de seguridad cibernética con sede en Charlottesville, Virginia.
Para abordar el problema, algunos profesionales se están concentrando en casos de uso específicos.
«Vemos que el mercado se está volviendo más especializado», dijo Fast. «En lugar de que alguien sea bueno en ciencia de datos, se podría decir que alguien está interesado en ciencia de datos para marketing o ciencia de datos para IoT. Desarrollar una especialidad o enfocarse en un área en particular lo ayudará a obtener tracción a medida que la ciencia de datos y el análisis crecen en popularidad. Tener un área que pueda llamar suya es muy valiosa para el éxito».
También puede ser útil comprender las finanzas y cómo los proyectos de ciencia de datos pueden ayudar a los resultados de una empresa.
«Muchas personas técnicas y científicas no sienten nada por el dinero ni la economía», dijo Michael Feindt, asesor estratégico y fundador de Blue Yonder, parte de JDA Software Group, una compañía alemana de software de inteligencia artificial.
En Europa en particular, dijo, parece que los científicos de datos piensan que el dinero es algo malo. Un MBA u otro programa de educación formal puede ayudar, dijo Feindt, pero el mejor lugar para aprender sobre negocios es en su trabajo actual.
«Para las personas que son inteligentes y analíticas, aprender sobre negocios es bastante fácil», dijo. «Hay que querer aprenderlo, pero no ser demasiado arrogante y respetar a las personas que no son demasiado científicas».
Las habilidades blandas marcan el camino
Fuera del conocimiento técnico y la familiaridad comercial, la buena comunicación y otras habilidades blandas están en la parte superior de la lista para las habilidades necesarias de ciencia de datos en el mercado laboral.
En True Fit Corp., una compañía de recomendaciones de moda impulsada por IA, son las habilidades no técnicas las que marcan la diferencia.
«Se ha hecho mucho hincapié en las habilidades técnicas, en el aprendizaje de un algoritmo específico o una clase de algoritmos», dijo Rhonda Textor, directora de ciencia de datos de True Fit. «Lo complicado es que si no entiendes el problema que estás resolviendo y no entiendes cómo funciona el negocio del que eres parte, cómo gana dinero, cómo se alimenta tu algoritmo en el panorama general para hacer eso, entonces no importa si se comprende todo sobre las redes neuronales porque no podrá aplicarlo a los problemas correctos».
La compañía busca buenas habilidades de comunicación, dijo. «Y también buscamos personas que no solo entiendan la ciencia de los datos, sino que puedan asignar eso al valor comercial y al impacto comercial».
Incluso las empresas más orientadas técnicamente, como el proveedor de ciberseguridad de San Francisco, Kenna Security, están comenzando a preferir a los científicos de datos que pueden ver el panorama general en lugar de perseguir el último algoritmo.
«Ya sea aprendizaje profundo o bosques aleatorios o regresiones, esas conversaciones se están volviendo menos interesantes», dijo Michael Roytman, científico jefe de datos de Kenna Security. «Lo que más me entusiasma es descubrir la forma correcta de estructurar la investigación, la ciencia de datos y el desarrollo juntos, de modo que desde el inicio hasta la producción, un nuevo producto pueda ver la luz del día más rápido. Para mí, todo se trata de las habilidades blandas: comunicación, personas y equipos».
Se trata de la ejecución
Los científicos de datos que saben cómo trabajar con ingenieros de datos, o ellos mismos tienen fuertes habilidades de ingeniería, pueden marcar la diferencia entre simplemente tener un proyecto piloto de exhibición y entregar un ROI sólido con una implementación exitosa.
Esto no significa que los científicos de datos necesariamente tengan que volver a capacitarse como ingenieros de software, dijo Fast de CounterFlow.
«Es difícil esperar que un científico de datos sea bueno en ambas cosas», dijo. «Pero necesitan entender el lenguaje del desarrollo de software».
Habilidades de plataforma a prueba de futuro
El lenguaje de programación Python continuará siendo una habilidad fundamental en el futuro previsible, y los científicos de datos pueden aumentar eso con nuevas técnicas como redes neuronales, aprendizaje profundo, redes adversas y aprendizaje de transferencia.
También hay un creciente énfasis para los científicos de datos en las implementaciones basadas en la nube, que permiten una fácil transferencia de las pruebas a los entornos de producción, escalado automático y rentable, y bibliotecas integradas y fáciles de usar de algoritmos y datos de capacitación. Además, las plataformas se integran bien con las fuentes de datos más populares, como los conjuntos de datos disponibles comercialmente, así como los datos obtenidos de sistemas internos o socios comerciales.
Las tres pilas principales pertenecen a Google, Microsoft y Amazon. También hay plataformas dedicadas a la ciencia de datos, como Databricks, DataRobot y Domino Data Lab, que permiten a los científicos de datos colaborar en la construcción e implementación de modelos. Por lo tanto, puede beneficiar a los científicos de datos familiarizarse con estas plataformas.
«Estas herramientas están tratando de convertirse en una ventanilla única para todo lo que se quiere hacer, y tienen las integraciones correctas, la funcionalidad correcta y son muy flexibles», dijo Ivaylo Bahtchevanov, jefe de ciencia de datos en ForgeRock, una empresa de ciberseguridad con sede en San Francisco.
Lo que es más importante, las plataformas en la nube hacen que sea fácil para las empresas comenzar de a poco y luego escalar fácilmente.
«Puede expandir fácilmente la cantidad de servidores o recursos que necesita sin tener que ir a comprar hardware real», dijo Charles Ng, vicepresidente de IA empresarial en Appier, una compañía de tecnología de marketing basada en IA con sede en Taiwán.
«Las plataformas de inteligencia artificial y aprendizaje automático están cambiando drásticamente», dijo Myke Miller, decana del Deloitte Cloud Institute, parte de Deloitte Consulting LLP.
Las nuevas plataformas simplifican el trabajo del científico de datos, dijo, y agregan una enorme cantidad de automatización a las secuencias de ciencia de datos. Los científicos de datos necesitan aprender a usar las nuevas plataformas, pero después de eso, las plataformas realmente reducen la necesidad de ciertas habilidades específicas de ciencia de datos.
«La necesidad de Python o Firehose o cualquiera de los productos componentes está disminuyendo», dijo Miller. «Y la necesidad de colaboración y comprensión del problema comercial continúa aumentando».