Definition

Aprendizado profundo (deep learning)

O aprendizado profundo (deep learning), também conhecido como redes neurais profundas, é um aspecto da inteligência artificial (IA) que emula a abordagem de aprendizado que os seres humanos usam para obter certos tipos de conhecimento. Em sua forma mais simples, o aprendizado profundo pode ser visto como uma forma de automatizar a análise preditiva. 

Enquanto os algoritmos tradicionais de aprendizado automático são lineares, os algoritmos de deep learning se acumulam em uma hierarquia de complexidade e abstração crescentes. Para entender o aprendizado profundo, imagine uma criança cuja primeira palavra seja "cachorro". A criança aprende o que é um cachorro (e o que não é) apontando para objetos e dizendo a palavra "cachorro". O pai diz "sim, isso é um cachorro" ou "não, isso não é um cachorro". Conforme a criança continua a apontar para os objetos, ela vai se tornando mais consciente das características que todos os cães possuem. O que a criança faz, sem saber, é esclarecer uma abstração complexa (o conceito de cachorro), construindo uma hierarquia na qual cada nível de abstração é criado com o conhecimento obtido na camada anterior. 

Os programas de computador que usam o deep learning passam pelo mesmo processo. Na hierarquia, cada algoritmo aplica uma transformação não linear à sua entrada e usa o que aprende para criar um modelo estatístico como saída. As iterações continuam até que a saída tenha alcançado um nível de precisão aceitável. O número de camadas de processamento pelas quais os dados passam é o que inspirou a classificação “deep” (profunda). 

No aprendizado de máquina tradicional, o processo é supervisionado e o programador deve ser muito, muito específico ao dizer ao computador que tipo de coisas ele deve procurar para decidir se uma imagem contém ou não um cachorro. Esse é um processo trabalhoso chamado extração de características e a taxa de sucesso do computador depende inteiramente da capacidade do programador de definir com precisão um conjunto de recursos para "cachorro". A vantagem do deep learning é que o programa cria o conjunto de recursos por conta própria, sem supervisão. Isso não é apenas mais rápido, mas geralmente é mais preciso. 

Inicialmente, o programa de computador poderia receber dados de treinamento, um conjunto de imagens marcadas com metatags por um ser humano com "cachorro" ou "não cachorro". O programa usa as informações que recebe no treinamento para criar um conjunto de características para o cão e construir um modelo preditivo. Nesse caso, o modelo que o computador cria pela primeira vez pode prever que qualquer coisa em uma imagem que tenha quatro pernas e uma cauda deve ser rotulada como "cachorro". Claro, o programa não está ciente dos rótulos "quatro patas" ou "cauda", ele simplesmente procurará padrões de pixel nos dados digitais. A cada iteração, o modelo preditivo que o computador cria torna-se mais complexo e preciso. 

Como esse processo imita o pensamento humano, o deep learning, às vezes, é chamado de aprendizado neural profundo ou redes neurais profundas. Ao contrário da criança pequena, que levará semanas ou até meses para entender o conceito de "cachorro", um programa de computador usando algoritmos de aprendizado profundo pode exibir um conjunto de treinamento classificando-o em milhões de imagens, identificando com precisão, em apenas alguns minutos, quais delas têm cães. 

Para atingir um nível aceitável de precisão, os programas de deep learning exigem acesso a grandes quantidades de dados de treinamento e poder de processamento – e nenhum deles estava facilmente disponível até a era do big data e da computação em nuvem. Como o deep learning é capaz de criar modelos estatísticos complexos diretamente de sua própria saída iterativa, ele consegue criar modelos preditivos precisos a partir de grandes quantidades de dados não rotulados e não estruturados. 

Isso é importante à medida em que a internet das coisas (IoT) se torna mais difundida, porque a maioria dos dados que humanos e máquinas criam não são estruturados e nem rotulados. Os casos de uso atuais para deep learning incluem todos os tipos de aplicativos de análise de big data, especialmente aqueles focados em processamento de linguagem natural (PNL), traduções, diagnósticos médicos, negociação de ações, segurança de rede e identificação de imagens. 

Este conteúdo foi atualizado pela última vez em Julho 2021

Saiba mais sobre Inteligência artificial e automação