DESENVOLVIMENTO DE MODELOS PREDITIVOS COM MACHINE LEARNING -ANÁLISE DE DADOS PARA SAÚDE DE GESTANTES E PUÉRPERAS. DEVELOPMENT OF PREDICTIVE MODELS WITH MACHINE LEARNING -DATA ANALYSIS FOR THE HEALTH OF PREGNANT AND POSTPARTUM WOMEN (original) (raw)

AVALIAÇÃO E COMPARAÇÃO DE ALGORITMOS DE APRENDIZADO DE MAQUINA PARA CLASSIFICAÇÃO DE DADOS MÉDICOS

AVALIAÇÃO E COMPARAÇÃO DE ALGORITMOS DE APRENDIZADO DE MAQUINA PARA CLASSIFICAÇÃO DE DADOS MÉDICOS, 2023

Ao analisar a base de dados "Predict Diabetes" disponível no Kaggle, o problema a ser investigado é aclassificação de pacientes em diabéticos ou não diabéticos com base em suas características médicas. Portanto, o problema de classificação a ser investigado é o seguinte: Problema: Classificação de pacientes em diabéticos ou não diabéticos com base em característicasmédicas. Na descrição do estudo, são utilizadas as informações médicas fornecidas na base de dados paradesenvolver um modelo de classificação capaz de prever se um paciente é diabético ou não diabético. Avariável alvo, chamada de "Outcome" ou "Resultado", é binária, onde 0 representa não diabético e 1representa diabético. O método proposto envolve a realização de uma análise exploratória dos dados, o tratamento de valoresausentes ou inconsistentes, o pré-processamento dos dados e a seleção de características relevantes. Emseguida, diferentes algoritmos de classificação podem ser avaliados e comparados para determinar qualdeles oferece o melhor desempenho na tarefa de classificação. As métricas comuns, como acurácia, precisão, recall, F1-score e matriz de confusão, serão utilizadas paraavaliar a qualidade dos classificadores e selecionar o modelo de classificação mais adequado para a basede dados em questão. É importante ressaltar a necessidade de realizar a divisão adequada dos dados em conjuntos detreinamento e teste, a fim de avaliar o desempenho dos classificadores de forma robusta. Além disso, ésempre recomendado utilizar técnicas de validação cruzada para obter uma estimativa mais confiável dodesempenho dos modelos. Este estudo tem como objetivo contribuir para a área de classificação médica, fornecendo insightsvaliosos sobre a predição da ocorrência de diabetes com base em características médicas específicas.Através da análise exploratória, do pré-processamento dos dados, da seleção criteriosa de característicase da comparação de diferentes algoritmos de classificação, espera-se obter um modelo de classificaçãopreciso e confiável.