Quais empresas requerem cientistas de dados?
O crescimento que o mercado de big data e analítica de negócios está tendo cria a necessidade de capital humano capaz de ler e moldar esses dados.
Embora o termo Ciência de Dados soe como novidade, não é tanto assim, já que tem estado presente desde 2013, quando se dizia que este seria o trabalho que mais futuro teria, graças ao impulso tomado pela big data. Tanto é que, de acordo com a IDC, o mercado de big data e análise de negócios (Business Analytics, BA) seguirá com sua tendência de crescimento, alcançando um valor de mercado de US$ 260 mil milhões de dólares para o ano 2022.
Atualmente, um cientista de dados, ou Data Scientist, é aquele profissional que pode combinar habilidades tecnológicas, velocidade de rede e melhores técnicas para o gerenciamento de dados; por isso mesmo, é construtor de modelos estatísticos e matemáticos. Outra de suas qualidades deve ser a comunicação, já que ele deve saber como informar à empresa se ela conta com a maturidade para ser capaz de extrair a informação mais precisa a partir dos dados obtidos. Já obtidos, esses dados devem ser organizados nos diferentes sistemas com os quais se trabalha no momento.
De acordo com o estudo “Where do Data Scientists Come From? “ realizado pela Indeed, o cargo de cientista de dados tem a maior diversidade em campos de estudo, sem que nenhuma carreira se sobresaia. O estudo indica que se pode quantificar essa diversidade usando o coeficiente de Gini (uma medida de desigualdade usada para calcular qualquer distribuição díspar), sendo que conta com 85% de diversidade de carreiras que vão desde Ciências Sociais, Ciências Naturais, Matemáticas, Negócios e Economia a Engenharias e apenas 15% é graduado em Ciências de Dados.
De acordo com Antonio Galindo, vice-presidente de engenharia na BEDU, empresa dedicada à educação especializada, os grandes cientistas de dados não são necessariamente formados em carreiras de informática, porque o que é necessário realmente é criar modelos matemáticos baseados na vida real que sejam tangíveis. Por exemplo, "Eu vi engenheiros civis, que, a partir da aprendizagem automática (aprendizagem de máquina, ML) buscavam os danos que poderiam vir a sofrer as estruturas, assim como fazendo edifícios cada vez mais resistentes."
Ainda que os dados sempre tenham existido, a única coisa que mudou agora é a forma como tratamos essa informação. “Um exemplo são as pesquisas do INEGI, que coletava dados sobre nós, mas o processo de depuração de big data mudou; não importa a profissão que se tenha, os dados sempre vão ajudar a resolver um problema ou ajudar a obter informações, isso vai de mãos dadas com qualquer profissão", compartilha Vieri Figallo, CEO da agência de comunicação criativa Figallo.
E ao se obter esses dados de forma digital, à diferença da forma em que se obtinha antes (pesquisas, campo de estudos), é possível medir o comportamento, “e esse não mente”, diz Maria Villalobos, CEO da SOME, agência de marketing de relevância, e prossegue: “a pegada digital pode mostrar do que gostamos e do que não, mas o problema é converter isso em dados inteligentes; podemos ter todas as informações que quisermos, mas torná-las acessíveis é muito diferente”.
Ciência para qualquer um
Talvez o que mais tem assustado as empresas é o termo “ciência de dados”. Embora a obtenção de dados seja complexa, podemos falar de uma indústria de extração de dados e esta informação representa uma grande oportunidade para as pequenas e médias empresas (PME). "O concorrente não está tirando proveito dos dados, porque sempre há uma resistência à mudança, mas a pandemia tem trazido uma aceleração digital e de dados estão evitando que as pessoas tomem decisões no escuro e lhes dando direções para onde seguir" menciona Vieri Figallo.
A evidência mostra que quanto melhor seja o manuseio de dados, melhor valor “podemos dar aos nossos pontos fortes, pois é um investimento mais de tempo do que econômico”, pondera Antonio Galindo, e prossegue “nem todos os modelos são necessariamente bons para acabar com todos os problemas, não existe uma bala de prata que acabe com todos os males, conforme vamos evoluindo o modelo vai evoluindo também". Por isso, de acordo com Pietro Delai , gerente de Programa, Software e Soluções em Nuvem da IDC América Latina, "as análises e big data são a segunda prioridade na região "isto sem importar o tamanho da organização, porque para as PME se nota uma adoção de tecnologias de open source que reduz de maneira significativa os custos de implementação.
Grande parte do sucesso da implementação de soluções de big data inclui o bônus de estar acompanhada de um cientista de dados, nas palavras do vice-presidente de BEDU, estes especialistas devem "ter ética e evitar os vieses na forma como esta informação é trabalhada, porque se uma empresa chega a ter um interesse, a informação pode ter a tendência" que não ajuda os resultados procurados.
Uma advertência sobre o exposto acima é dada por Maria Villalobos: "O Facebook é um exemplo de algoritmo dos mais tendenciosos, já não permite formar opiniões, causando um problema para a empresa, gerando um boicote das marcas, porque é um problema grave, “como se pode evitar o viés?" A resposta parece ser: com a gestão ética dos dados obtidos.
Minha empresa requer um cientista de dados?
No entanto, nem todas as empresas exigem um cientista de dados. Talvez só precisem de um analista, mas o que é certo é que devem considerar a adoção deste tipo de perfil. "Eu vejo um risco a médio prazo, se não começarmos a adotar este tipo de dinâmica", diz Antonio Galindo, que haja empresas que só exijam que toda a sua informação seja tomada, analisada e que os resultados lhe sejam entregues; são tarefas realizadas por um analista de dados , enquanto as tarefas do cientista de dados vai mais além, porque um Data Scientist, antes de entregar os resultados, deve formular conclusões a partir dos dados apresentados e criar um plano de ação futura de negócios para a empresa, baseado nessas informações.
Finalmente, se houver consciência da necessidade de um cientista de dados, as necessidades salariais também devem ser levadas em consideração, porque de acordo com a página mx.talent.com o salário médio de um cientista de dados no México é de 420.000 pesos por ano ou 215 pesos por hora. Os cargos de nível inicial começam em 96.000 pesos anuais, enquanto profissionais mais experientes alcançam até 600.000 pesos anuais”.