Mostrar registro simples

dc.creatorMoura, Pedro Paulo de Oliveira
dc.date.accessioned2024-12-20T17:19:12Z
dc.date.available2024-12-20T17:19:12Z
dc.date.issued2024-10-04
dc.identifier.citationMOURA, Pedro P. O.; HOLMES, Raphael Barbosa; MEDEIROS, Sheyla Natália de. Aprendizado de máquina na precificação de carros usados: desenvolvimento de uma base de dados para modelos de regressão. Orientadora: Sheyla Natália de Medeiros. 2024. Artigo (Tecnólogo em Análise e Desenvolvimento de Sistemas) - Instituto Federal de Educação, Ciência e Tecnologia de Pernambuco - Campus Paulista, Paulista, PE, 2024. 20 p.pt_BR
dc.identifier.urihttps://repositorio.ifpe.edu.br/xmlui/handle/123456789/1462
dc.description.abstractThe buying and selling of used cars is a vital activity for the Brazilian economy and for access to urban mobility, especially in a scenario of rising new vehicle prices. However, determining the fair price of a used car can be challenging. This final year project explores the use of Machine Learning techniques to improve the accuracy of used car pricing. A comprehensive dataset was developed, extracted from the OLX Brazil platform through Web Scraping using Scrapy. Subsequently, exploratory data analysis was carried out, as well as cleaning and preparation for training various supervised learning models focused on regression. The results were promising, especially with the Random Forest model, which achieved a determination coefficient of 0.9434 and a mean absolute error of 4855.27. These results indicate that regression models can be effective in predicting vehicle prices based on their characteristics, and suggest the need for further investigations to further improve used car pricing techniques.pt_BR
dc.format.extent20 p.pt_BR
dc.languagept_BRpt_BR
dc.relationAHMED, M. Waqar. Understanding Mean Absolute Error (MAE) in Regression: A Practical Guide. Medium. 2023. Dispon´ıvel em: https://medium.com/@m.waqar.ahmed/understanding-meanabsolute- error-mae-in-regression-a-practical-guide-26e80ebb97df. Acesso em: 03/06/2024. AZNAR, Pablo. What is the difference between Extra Trees and Random Forest?. Junho de 2020. Dispon´ıvel em: https://quantdare.com/what-is-the-difference-between-extra-trees-andrandom- forest/. Acesso em: 07/06/2024. BATUWITA, R.; PALADE, V. Class imbalance learning methods for support vector machines. In: HE, H.; MA, Y. (Eds.). Imbalanced learning. [S.l.]: Wiley, 2013. BREIMAN, Leo. Bagging Predictors. Machine Learning, v. 24, p. 123-140, 1996. BREIMAN, Leo. Random Forests. Machine Learning, v. 45, p. 5-32, 2001. Bukvic et al. Price Prediction and Classification of Used-Vehicles Using Supervised Machine Learning. Sustainability, v. 14, 2022. CHICCO, Davide et al. The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. PeerJ Computer Science, 2021. DIAS, Willamy Mamede Da Silva. MACHINE LEARNING E A PREVISA˜ O DE PREC¸OS DE TERRENOS EM BRAS´ILIA. Tese (Mestrado Profissional em Economia) - Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa - IDP. Bras´ılia. 2023. DREHMER, Vit´oria. Venda de carros usados cresce 14% e ´e 7 vezes maior que a de novos. AutoEsporte. 2024. Dispon´ıvel em: https://autoesporte.globo.com/carros/usados-eseminovos/ noticia/2024/02/venda-de-carros-usados-cresce-14percent-e-e-7-vezes-maior-que-ade- novos.ghtml. Acesso em: 13 de marc¸o de 2024. GEURTS et al. Extremely randomized trees. Machine Learning, v. 63, p. 3-42, 2006. IBM. What is Machine Learning?. 2023. Dispon´ıvel em: https://web.archive.org/web/20231227153910/https://www.ibm.com/topics/machine-learning. Acesso em: 25 de setembro de 2024. JORDAN, M. I.; MITCHELL, T. M. Machine learning: trends, perspectives, and prospects. Science, v. 349, n. 6245, p. 255–260, 2015. LOH, Wei-Yin. Fifty Years of Classification and Regression Trees. International Statistical Review, v. 82, n. 3, p. 329-348, 2014. MAGALHA˜ ES, Toma´s Silva de. Sistema de Previsa˜o de Prec¸o de Carros Usados atrave´s de Machine Learning. Tese (Mestrado em Engenharia de Inteligˆencia Artificial) - Departamento de Engenharia e Inform´atica, Instituto Superior de Engenharia do Porto. MITCHELL, Tom M. Machine Learning. McGraw-Hill Science/Engineering/Math. 1997. NILSSON, N. J. Introduction to Machine Learning. Draft of Incomplete Notes, 2015. Dispon´ıvel em: https://web.archive.org/web/20190816182600/http://ai.stanford.edu/people/nilsson/mlbook.html. Acesso em: 12 de novembro de 2023. OLX Brasil. Dispon´ıvel em: https://www.olx.com.br/. Acesso em: 12 de novembro de 2023. PEDREGOSA, F. et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, v. 12, p. 2825-2830, 2011. RAJ, Ashwin. A Quick and Dirty Guide to Random Forest Regression. Towards Data Science. Junho de 2020. Dispon´ıvel em: https://towardsdatascience.com/a-quick-and-dirty-guide-to-random-forestregression- 52ca0af157f8. Acesso em: 06/05/2024. REITZ, Kenneth. HTML Scraping. The Hitchhiker’s Guide to Python. 2016. Dispon´ıvel em: https://docs.python-guide.org/scenarios/scrape/#web-scraping. Acesso em: 25 de setembro de 2024. SALA´ RIO MI´NIMO - Tabela de Prec¸o. Dispon´ıvel em: https://www.guiatrabalhista.com.br/guia/salario minimo.htm. Acesso em: 10 de agosto de 2024. Sci-Kit Learn. Ensembles: Gradient boosting, random forests, bagging, voting, Stacking. Dispon´ıvel em: https://scikit-learn.org/stable/modules/ensemble.html. Acesso em: 28 de novembro de 2024. Scrapy documentation. Dispon´ıvel em: https://docs.scrapy.org/en/latest/. Acesso em: 28 de novembro de 2024. SILVA, Thiago C´esar de Miranda. Uso de Machine Learning para Previs˜ao de Valores de Apartamentos no Munic´ıpio do Recife. Tese (Bacharelado em Sistemas de Informac¸ ˜ao) - Universidade Federal Rural de Pernambuco - UFPE. Recife. 2023. Tabela FIPE: Entenda o que ´e e como funciona. Quatro Rodas. Dispon´ıvel em: https://quatrorodas.abril.com.br/tabela-fipe. Acesso em: 12 de novembro de 2023. Tabela Fipe Kwid. Dispon´ıvel em: https://tabelacarros.com/anos modelos/carros/renault/kwid. Acesso em: 10 de agosto de 2024. ZHAO, Bo. Web Scraping. Encyclopedia of Big Data, p. 1-3, 2017.pt_BR
dc.rightsAcesso Abertopt_BR
dc.rightsAn error occurred on the license name.*
dc.rights.uriAn error occurred getting the license - uri.*
dc.subjectAprendizado de Máquinapt_BR
dc.subjectAprendizado Supervisionadopt_BR
dc.subjectRaspagem de Dadospt_BR
dc.subjectAnálise de Dadospt_BR
dc.subjectRegressãopt_BR
dc.titleAprendizado de máquina na precificação de carros usados: desenvolvimento de uma base de dados para modelos de regressão.pt_BR
dc.title.alternativeMachine learning in used car pricing: development of a database for regression models.pt_BR
dc.typeArticlept_BR
dc.creator.Latteshttp://lattes.cnpq.br/5107529910755765pt_BR
dc.contributor.advisor1Medeiros, Sheyla Natália de
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5315530469973453pt_BR
dc.contributor.referee1Oliveira, Flávio Rosendo da
dc.contributor.referee2Brito Junior, Ozonias de Oliveira
dc.contributor.referee1Latteshttp://lattes.cnpq.br/6828380394080049pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/0287523204946792pt_BR
dc.publisher.departmentPaulistapt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpt_BR
dc.description.resumoA compra e venda de carros usados ´e uma atividade vital para a economia brasileira e para o acesso à mobilidade urbana, especialmente em um cenário de aumento dos preços de veículos novos. No entanto, determinar o preço de um carro usado pode ser desafiador. Este trabalho explora o uso de técnicas de aprendizado de máquina para aprimorar a acurácia na precificação de automóveis usados. Desenvolveu-se um conjunto de dados abrangente, extraído da plataforma OLX Brasil por meio de raspagem de dados utilizando Scrapy. A seguir, realizou-se uma análise exploratória dos dados, além de limpeza e preparação para o treinamento de diversos modelos de aprendizado supervisionado voltados para regressão. Os resultados mostraram-se promissores, especialmente com o modelo de Floresta Aleatória, que alcançou um coeficiente de determinação de 0,9434 e um erro médio absoluto de 4855,27. Estes resultados indicam que modelos de regressão podem ser eficazes na previsão de preços de veículos com base em suas características, e sugerem a necessidade de investigação adicionais para aprimorar ainda mais as técnicas de precificação de carros usados.pt_BR
dc.creator.name2Holmes, Raphael Barbosa
dc.creator.Lattes2http://lattes.cnpq.br/9459474420278540pt_BR


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples