O trabalho de conclusão de curso de Engenharia de Computação do Instituto de Ciência e Tecnologia (ICT/Unifesp) - Campus São José dos Campos, de autoria do aluno Matheus Augusto de Castro Santos, teve como objetivo desenvolver um método automatizado para classificação de pneumonia em imagens de raio-x via aprendizagem profunda.
A pesquisa contou com a orientação da professora Lilian Berton e foi iniciada em 2021 durante uma iniciação científica (IC) Pibic/Unifesp. Matheus testou algumas bases de dados de imagens torácicas de pacientes saudáveis, acometidos por pneumonia e por covid-19. Na IC, o aluno desenvolveu um aplicativo para Android para classificar as imagens. O trabalho foi indicado pela Unifesp para concorrer ao prêmio anual do CNPq em 2022.
Durante a iniciação científica, Matheus encontrou dificuldades para identificar bases de dados confiáveis, reconhecer as imagens via câmera de celular, entre outras. Por isso, no TCC, defendido em janeiro de 2022, optou por desenvolver um sistema web para reconhecimento de imagens, utilizando um conjunto de imagens maior e obtendo maior confiabilidade.
O reconhecimento das imagens de raio-x é feito via aprendizagem profunda, uma das técnicas de aprendizado de máquina, uma subárea da inteligência artificial que visa desenvolver algoritmos que possam aprender a reconhecer padrões em grandes bases de dados. "A aprendizagem profunda utiliza redes neurais artificiais compostas por várias camadas. As redes neurais são algoritmos inspirados no funcionamento do cérebro humano, compostos por nós conectados imitando os neurônios do cérebro. Esses algoritmos usam dados de treinamento para aprender a reconhecer padrões e podem ser usados em novos dados não vistos no processo de treinamento", explica a professora Lilian.
Para o TCC, foram analisados conjuntos de imagens radiográficas da região torácica de pacientes com pneumonia, com covid-19 e pacientes saudáveis. As imagens foram obtidas a partir de um levantamento em bases de dados públicas disponíveis na web e foram coletadas em hospitais do Brasil e do exterior.
Essas imagens foram utilizadas no treinamento de redes neurais convolucionais, como a VGG, ResNET-50 e EfficientNet, a fim de identificar se o indivíduo apresenta uma enfermidade e, em caso positivo, diferenciar a covid-19 das demais pneumonias. "As redes neurais convolucionais são uma classe de rede neural que vem sendo empregada com sucesso na análise de imagens. Esses algoritmos são inspirados no córtex visual dos animais, os quais respondem a estímulos apenas em regiões restritas do campo de visão. Existem diferentes algoritmos propostos na literatura, como a VGG, ResNET50 e EfficientNet, os quais foram usados no trabalho por serem bastante famosos”, pontua Matheus.
A metodologia adotada envolve o processamento dos dados, que abrange o redimensionamento das imagens, remoção de imagens duplicadas, entre outros tratamentos. Depois, os dados são divididos em três conjuntos: treino, validação e teste. O conjunto de treino é passado para as redes neurais aprenderem os padrões. O conjunto de validação é aplicado após o treinamento para avaliar a acurácia obtida e, quando necessário, reajustar os parâmetros dos algoritmos. Por último, é usado o conjunto de teste para validar a efetividade do algoritmo. "Existem métricas estatísticas que são comumente computadas para avaliar algoritmos de aprendizado de máquina, as quais foram empregadas no trabalho. Uma vez identificado o melhor modelo de rede neural convolucional, ele foi usado no sistema web”, afirma a professora Lilian.
Por meio de um site, o usuário faz login e o upload de uma imagem de raio-x. O sistema usa uma rede neural convolucional treinada em outros dados e faz a classificação dessa nova imagem indicando se seria de um paciente saudável, com pneumonia ou covid-19.
O sistema foi aplicado em uma base de dados externa, a qual não foi utilizada no treinamento das redes neurais, e alcançou 95% de acurácia. Os dados são do Hospital Cruz Vermelha em Curitiba e podem ser acessados neste link.