kirill_makarov - stock.adobe.com
Diversos grupos de talentos e conjuntos de dados ajudam com vieses de IA
Trazer funcionários historicamente sub-representados para partes críticas do processo de design enquanto cria um modelo de IA pode reduzir ou eliminar o preconceito nesse modelo.
O preconceito em IA é um problema sério que pode criar resultados indesejados em modelos de IA, impactando negativamente as empresas que os utilizam.
Os fornecedores de tecnologia podem ajudar a resolver esse problema contratando diversos funcionários para fornecer suas opiniões sobre os produtos de IA criados pelos fornecedores.
Diversidade dentro, diversidade fora
"Insumos inclusivos levam a resultados inclusivos", disse Annie Jean-Baptiste, diretora de inclusão de produtos do Google.
Em um painel sobre preconceitos raciais e de gênero na inteligência artificial na feira de tecnologia virtual CES 2021 em 12 de janeiro, Jean-Baptiste observou a importância de incluir múltiplas perspectivas, especialmente aquelas que historicamente têm sido sub-representadas na indústria de informática. Tecnologia, em momentos críticos no desenvolvimento de produtos para ajudar a reduzir o preconceito racial ou de gênero em modelos de IA.
Quando o Google criou o Google Assistant, disse Jean-Baptiste, o fornecedor também o submeteu a testes adversos, essencialmente testes para tentar quebrar o produto, para garantir que permanecesse imparcial.
Parte desse teste envolveu trazer grupos que tradicionalmente eram sub-representados com base em raça, gênero e orientação sexual para encontrar e alterar as respostas negativas que o Google não queria que o Assistente dissesse e adicionar referências culturais positivas às suas respostas.
Jean-Baptiste disse que essa etapa fundamental no processo de design foi um sucesso, pois reduziu muito o número de respostas tendenciosas ou potencialmente alienantes do Google Assistant.
Nesse ínterim, as empresas devem priorizar a contratação de diversos candidatos, disse a palestrante Taniya Mishra, fundadora e CEO da SureStart, uma empresa que ajuda as organizações a construir uma força de trabalho diversificada com treinamento e educação.
Ela disse que ouve muitas pessoas dizerem que, embora a diversidade seja importante, elas querem o melhor candidato. Esse pensamento, ele apontou, está errado.
Em vez disso, as empresas deveriam dizer: "A diversidade é realmente importante e eu quero o melhor", disse Mishra, enfatizando que as metas têm o mesmo valor.
"Não há problema entre ter um grupo diversificado de candidatos e conseguir o melhor", disse ele.
Embora seja necessário um pool de talentos diversificado para criar diversidade nas organizações, construir modelos com conjuntos de dados grandes e diversos também é fundamental, disse Kimberly Sterling, diretora sênior de economia da saúde e pesquisa de resultados da ResMed, fornecedora de IoT em saúde.
Os fornecedores de tecnologia devem usar diversos conjuntos de dados com base em diversas populações para desenvolver seus modelos, disse ele.
Isso é particularmente importante na área de saúde, pois certos medicamentos ou produtos podem funcionar de maneira diferente em diferentes tipos de pessoas. Suponha que uma empresa de saúde crie um modelo preditivo baseado em dados obtidos principalmente de homens brancos. Nesse caso, você pode cuspir previsões tendenciosas ou incorretas ao tentar prever como uma droga, por exemplo, pode reagir a uma mulher ou pessoa de cor.
“Quando você tem conjuntos de dados que não são representativos, acabamos encontrando situações realmente desafiadoras”, disse Sterling.
Ela disse que as empresas devem se certificar de incluir grupos sub-representados em todas as suas coletas de dados e testes de produtos.
Da mesma forma, Mishra disse que se concentrou em tecnologia de voz em seus estudos na Oregon Health and Science University no início dos anos 2000. Ele lembrou que, naquela época, a maioria dos conjuntos de dados com que ele precisava trabalhar consistia em gravações de âncoras de notícias.
Primeiramente, disse ele, as vozes nos conjuntos de dados eram caucasianos com sotaque americano padrão e uma maneira refinada de falar. A falta de diversidade tornou difícil para ele construir modelos de voz que entendessem diferentes tipos de alto-falantes, incluindo aqueles com sotaque, disse ele.
Embora ele tenha notado que os conjuntos de dados de voz melhoraram desde então, eles ainda carecem de dados de crianças e idosos, o que faz com que muitos modelos de voz tenham dificuldade em entender esses dados demográficos.
Ele explicou que os tecnólogos devem se concentrar na coleta de dados de grupos sub-representados e na construção de seus modelos de IA com diversos conjuntos de dados.