Mostrar registro simples

dc.creatorSilva, Alesson Alves da
dc.date.accessioned2025-12-03T12:33:24Z
dc.date.available2025-12-03T12:33:24Z
dc.date.issued2025-08-01
dc.identifier.citationSILVA, Alesson Alves da; DAMAZIO JUNIOR, Pedro Alves. Avaliação de modelos de aprendizado de máquina para triagem de COVID-19 com base em sintomas autodeclarados. 2025. 21 f. Artigo (Graduação em Análise e Desenvolvimento de Sistemas)—Instituto Federal de Educação, Ciência e Tecnologia de Pernambuco, Campus Paulista, 2025.pt_BR
dc.identifier.urihttps://repositorio.ifpe.edu.br/xmlui/handle/123456789/1927
dc.description.abstractThe Coronavirus outbreak, which began in 2019, rapidly overwhelmed healthcare The COVID-19 outbreak, which began in 2019, quickly overwhelmed healthcare systems, with a high number of severe cases requiring hospitalization and intensive care. Faced with resource shortages and difficulties in performing efficient triage, it became essential to seek solutions that could assist in the rapid identification of infected patients. This study aims to develop and evaluate Machine Learning models capable of predicting COVID-19 test results based on symptomatic data. For this purpose, a dataset provided by the Foundation for the Support of Science and Technology of the State of Pernambuco was used, containing records of symptoms and the corresponding test results collected during the pandemic. The proposal seeks to compare the performance of different classification algorithms, contributing to research focused on the application of artificial intelligence techniques in the healthcare field. Among the evaluated models, the Naive Bayes classifier achieved the best performance, with an F1-Score of 0.6964 on the test set, demonstrating greater predictive capability within the proposed scenario.pt_BR
dc.format.extent33 p.pt_BR
dc.languagept_BRpt_BR
dc.relationAKIBA, T. et. al. Optuna: A next-generation hyperparameter optimization framework. In: ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY & DATA MINING, 2019. Disponível em: https://doi.org/10.48550/arXiv.1907.10902. Acesso em: 02 fev. 2025. ALPAYDIN, E. Introduction to Machine Learning. Cambridge: MIT Press, 2020. Acesso em: 30 set. 2024. ARPACI, I. et al. Prevendo a infecção por COVID-19 com quatorze características clínicas usando algoritmos de classificação de aprendizado de máquina. Multimedia Tools and Applications, v. 80, p. 11943–11957, 2021. Disponível em: https://doi.org/10.1007/s11042-020-10340-7 Acesso em: 02 fev. 2025. AZEVEDO, J. M. R.; BARBOSA, M. A. Triagem em serviços de saúde: percepções dos usuários. Revista Enfermagem UERJ, v. 15, n. 1, p. 33–39, 2007. Disponível em: http://repositorio.bc.ufg.br/handle/ri/17730 Acesso em: 25 mar. 2025. BATALI, A. et al. On the effectiveness of data sampling techniques for imbalanced classification. Procedia Computer Science, v. 159, p. 2244–2253, 2019. Acesso em: 06 fev. 2025. BREIMAN, L. Random forests. Machine Learning, v. 45, n. 1, p. 5–32, 2001. Acesso em: 30 set. 2024. CHANDRASHEKAR, G.; SAHIN, F. A survey on feature selection methods. Computers & Electrical Engineering, v. 40, n. 1, p. 16–28, 2014. Acesso em: 06 fev. 2025. CHAPMAN, P. $et~al.$ CRISP-DM 1.0: Step-by-step Data Mining Guide. [S.l.]: The CRISP-DM Consortium, 2000. Acesso em: 13 out. 2024. CHEN, T.; GUESTRIN, C. XGBoost: A scalable tree boosting system. In: ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 22., 2016. [S.l.: s.n.], 2016. Disponível em: https://doi.org/10.48550/arXiv.1603.02754. Acesso em: 30 set. 2024. COVER, T.; HART, P. Nearest neighbor pattern classification. IEEE Transactions on Information Theory, v. 13, n. 1, p. 21–27, 1967. Instituto Federal de Educação, Ciências e Tecnologia Pernambuco. Campus Paulista. Curso de Analise e Desenvolvimento de Sistemas. 01 de agosto de 2025. ERDEN, C.; DEMIR, H. I.; KOKÇAM, A. H. Enhancing machine learning model performance with hyperparameter optimization: a comparative study. arXiv preprint, arXiv:2302.11406, 2023. Acesso em: 03 fev. 2025. FACEPE. Banco de Dados - COVID-19. 2024. Disponível em: https://www.facepe.br/acervos/banco-de-dados-covid-19/. Acesso em: 20 dez. 2024. 8 FRIEDMAN, J. H. Greedy function approximation: A gradient boosting machine. Annals of Statistics, v. 29, n. 5, p. 1189–1232, 2001. Disponível em: https://doi.org/10.1214/aos/1013203451. Acesso em: 30 set. 2024. 4 GARCIA, P.; OLIVEIRA, F. Inteligencia artificial aplicada a saúde: Benefícios e limitações. Informática Médica , v. 15, n. 3, p. 80–95, 2020. Acesso em: 30 set. 2024. 2 HE, H.; GARCIA, E. A. Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering, v. 21, n. 9, p. 1263-1284, 2009. Disponível em: https://doi.org/10.1109/TKDE.2008.239. Acesso em: 06 fev. 2025. 12 HOSMER, D. W.; LEMESHOW, S.; STURDIVANT, R. X. Applied logistic regression. Hoboken: John Wiley & Sons, 2013. Disponível em: https://doi.org/10.1002/0471722146 Acesso em: 30 set. 2024. 4 JAMES, G. et al. An introduction to statistical learning. New York: Springer, 2013. Acesso em: 30 set. 2024. KE, G. et. Al. LightGBM: A highly efficient gradient boosting decision tree. In: Proceedings Of The 31st Conference On Neural Information Processing Systems (Nips 2017), Long Beach, 2017. p. 3149-3157. Disponível em: https://dl.acm.org/doi/10.5555/3294996.3295074. Acesso em: 30 set. 2024. 5 KLEINBAUM, D. G.; KUPPER, L. L.; MULLER, K. E. Applied regression analysis and other multivariable methods. [S.l.]: Cengage Learning, 2008. Acesso em: 30 set. 2024. 4 KURGAN, L.; MUSILEK, P. A survey of knowledge discovery and data mining process models. The Knowledge Engineering Review, v. 21, n. 1, p. 1–24, 2006. Acesso em: 23 set. 2024. 5, 6 Instituto Federal de Educação, Ciências e Tecnologia Pernambuco. Campus Paulista. Curso de Analise e Desenvolvimento de Sistemas. 01 de agosto de 2025. LIMA, J. A.; COSTA, M. F.; ALMEIDA, R. S. Fundamentos do aprendizado de máquina. Revista Brasileira de Computação, v. 13, n. 2, p. 45–60, 2020. Acesso em: 28 set. 2024. 3 MARISCAL, G.; MARBAN, O.; FERNANDEZ, C. A survey of data mining and knowledge discovery process models and methodologies. The Knowledge Engineering Review, v. 25, n. 2, p. 137–166, 2010. Acesso em: 23 set. 2024. 5 MARTINS, P. A.; MONTEREI, L. G. Aplicabilidade do aprendizado de máquina na ciência da informação. In: CONFERENCIA BRASILEIRA DE INFORMAÇÃO, São Paulo, 2022. São Paulo: USP, 2022. p. 215–230. Acesso em: 28 set. 2024. 2, 3 MEZZADRI, G. et. al. Hold-out strategy for selecting learning models. Journal of Mathematical Analysis and Applications, v. 506, n. 2, p. 125599, 2022. Disponível em: https://www.sciencedirect.com/science/article/abs/pii/S0022249622000372. Acesso em: 23 abr. 2025. 11 MINISTÉRIO DA SAÚDE. Orientações para manejo de pacientes com COVID-19. 2023. Disponível em: https://www.gov.br/saude/pt-br/assuntos/saude-de-a-a-z/c/covid-19/publicacoes-tecnicas/recomendacoes/orientacoes-para-manejo-de-pacientes-com-covid-19/view. Acesso em: 8 jun. 2025. 7 MITCHELL, T. Machine learning. New York: McGraw Hill, 1997. Acesso em: 15 dez. 2024.3, 4 MUHAMMAD, L. J.; ALGEHYNE, E. A.; USMAN, S. S. et. Al. Supervised machine learning models for prediction of COVID-19 infection using epidemiology dataset. SN Computer Science, v. 2, n. 11, 2021. Disponível em: https://doi.org/10.1007/s42979-020-00394-7. Acesso em: 15 dez. 2024. 6, 7 MURPHY, K. P. Machine learning: a probabilistic perspective. Cambridge: MIT Press, 2012. Acesso em: 15 dez. 2024. 5 OLIVEIRA, R. S.; SOUZA, T. P. Métodos não supervisionados para descoberta de conhecimento em bases de dados. Journal of Artificial Intelligence Research, v. 25, n. 3, p. 120–134, 2021. Acesso em: 28 set. 2024. 3 ORGANIZAÇÃO PAN-AMERICANA DA SAÚDE. Histórico da emergência internacional de covid-19. Organização Pan-Americana da Saúde, 2023. Disponível em: https://www.paho.org/pt/historico-da-emergencia-internacional-covid-19. Acesso em: 14 abr. 2025. 2 Instituto Federal de Educação, Ciências e Tecnologia Pernambuco. Campus Paulista. Curso de Analise e Desenvolvimento de Sistemas. 01 de agosto de 2025. QUINLAN, J. R. Induction of decision trees. Machine Learning, v. 1, n. 1, p. 81–106, 1986. Acesso em: 15 dez. 2024. 4 REBELLO, P. D. et. al. Analise qualitativa sobre a atuação e as experiencias dos enfermeiros na gestão hospitalar frente a covid-19. Ciência & Saúde Coletiva, v. 29, n. 8, p. 1–10, 2024. Disponível em: https://www.scielo.br/j/csc/a/sPVN7rMRhpG4SRLGKtNSYnn/. Acesso em: 26 jun. 2025. 2 SANTOS, R.; PEREIRA, L.; ALVES, M. Inteligência artificial na medicina: Avanços e desafios. Revista de Saúde Digital, v. 12, n. 2, p. 35–50, 2021. Acesso em: 30 set. 2024. 2 SANTOS, V. B.; FERREIRA, L. R. Analise de algoritmos supervisionados no contexto do aprendizado de máquina. Revista de Estatística e Computação, v. 18, n. 1, p. 32–47, 2019. Acesso em: 30 set. 2024. 3 MINISTÉRIO DA SAÚDE. Brasil confirma primeiro caso de novo coronavírus. Ministério da Saúde, 2020. Disponível em: https://www.gov.br/saude/pt-br/assuntos/noticias/2020/fevereiro/brasil-confirma-primeiro-caso-de-novo-coronavirus. Acesso em: 31 mar. 2025. 2 SCHMIDT, M. I. et. al. Doenças crônicas não transmissíveis no brasil: carga e desafios atuais. Cadernos de Saúde Pública, v. 27, n. 7, p. 1499–1509, 2020. Disponível em: https://www.scielo.br/j/csp/a/swM7NVTrnYRw98Rz3drwpJf. Acesso em: 23 out. 2024. 2 SHEARER, C. The CRISP-DM Model: The New Blueprint for Data Mining. Chicago, IL: SPSS Inc., 2000. Acesso em: 30 set. 2024. 5 SHIMAOKA, A. M.; FERREIRA, R. C.; GOLDMAN, A. The evolution of crisp-dm for data science: Methods, processes and frameworks. SBC Reviews on Computer Science, v. 1, n. 1, p. 1–15, 2023. Acesso em: 09 fev. 2025. 5 SOKOLOVA, M.; LAPALME, G. Performance measures in classification of learning. Information Processing & Management, v. 45, n. 4, p. 427–437, 2009. Disponível em: https://doi.org/10.1016/j.ipm.2009.03.002. Acesso em: 8 jan. 2025. 14 SOLAYMAN, S. et. al. Automatic covid-19 prediction using explainable machine learning techniques. International Journal of Cognitive Computing in Engineering, v. 4, p. 36–46, jun. 2023. Disponível em: https://doi.org/10.1016/j.ijcce.2023.01.003 Acesso em: 14 out. 2024. 6, 7 Instituto Federal de Educação, Ciências e Tecnologia Pernambuco. Campus Paulista. Curso de Analise e Desenvolvimento de Sistemas. 01 de agosto de 2025. VIDYANTI, A. N. et. al. Symptom-based scoring technique by machine learning to predict covid-19: a validation study. BMC Infectious Diseases, v. 23, p. 871, 2023. Acesso em: 13 out. 2024. 6, 22 WIRTH, R.; HIPP, J. Crisp-dm: Towards a standard process model for data mining. In: Proceedings Of The Fourth International Conference On The Practical Application Of Knowledge Discovery And Data Mining, 2000. p. 29–39. Acesso em: 23 set. 2024. 5 ZHANG, H. The optimality of naive bayes. In: INTERNATIONAL FLAIRS CONFERENCE, 17., 2004, Menlo Park. [S.l.: s.n.], 2004. p. 562–567. Disponível em: https://aaai.org/papers/flairs-2004-097/. Acesso em: 30 set. 2024. 5 ZOABI, Y.; DERI-ROZOV, S.; SHOMRON, N. Machine learning-based prediction of covid-19 diagnosis based on symptoms. npj Digital Medicine, v. 4, p. 3, 2021. Acesso em: 13 out. 2024.6, 7, 22pt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAn error occurred on the license name.*
dc.rights.uriAn error occurred getting the license - uri.*
dc.subjectCOVID-19pt_BR
dc.subjectDados clínicospt_BR
dc.subjectAprendizagem de Máquinapt_BR
dc.titleAvaliação de Modelos de Aprendizado de Máquina para Triagem de Covid-19 com Base em Sintomas Autodeclarados.pt_BR
dc.title.alternativeEvaluation of Machine Learning Models for COVID-19 Screening Based on Self-Reported Symptoms.pt_BR
dc.typeArticlept_BR
dc.creator.Latteshttp://lattes.cnpq.br/9429761877732053pt_BR
dc.contributor.advisor1Silva, Rodrigo Cesar Lira da
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2442224050349612pt_BR
dc.contributor.advisor-co1Oliveira, Flavio Rosendo da Silva
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/6828380394080049pt_BR
dc.contributor.referee1Sá Neto, Antônio Correia de
dc.contributor.referee2Cordeiro, Paulo Roger Gomes
dc.contributor.referee1Latteshttp://lattes.cnpq.br/27 73609778338983pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/76 71177677866299pt_BR
dc.publisher.departmentPaulistapt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpt_BR
dc.description.resumoO surto de COVID-19, iniciado em 2019, rapidamente sobrecarregou os sistemas de saúde, com um número elevado de casos graves que exigiam internação e cuidados intensivos. Diante da escassez de recursos e da dificuldade em realizar triagens eficientes, tornou-se essencial buscar soluções que auxiliassem na identificação rápida de pacientes infectados. Este trabalho tem como objetivo desenvolver e avaliar modelos de Aprendizagem de Máquina (AM) capazes de prever o resultado de testes para COVID-19 com base em dados clínicos. Para isso, foi utilizada uma base de dados disponibilizada pela Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco, contendo registros de sintomas e os respectivos resultados dos testes realizados durante a pandemia. A proposta visa comparar o desempenho de diferentes modelos de classificação, contribuindo para estudos voltados à aplicação de técnicas de Inteligência Artificial na área da saúde. Entre os modelos avaliados, o Naive Bayes apresentou o melhor desempenho, com F1-Score de 0,6964 no conjunto de teste, demonstrando maior capacidade preditiva dentro do cenário proposto.pt_BR
dc.creator.name2Damazio Junior, Pedro Alves
dc.creator.Lattes2lattes.cnpq.br/5936290672087084pt_BR


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples