dc.creator | Moura, Pedro Paulo de Oliveira | |
dc.date.accessioned | 2024-12-20T17:19:12Z | |
dc.date.available | 2024-12-20T17:19:12Z | |
dc.date.issued | 2024-10-04 | |
dc.identifier.citation | MOURA, Pedro P. O.; HOLMES, Raphael Barbosa; MEDEIROS, Sheyla Natália de. Aprendizado de máquina na precificação de carros usados: desenvolvimento de uma base de dados para modelos de regressão. Orientadora: Sheyla Natália de Medeiros. 2024. Artigo (Tecnólogo em Análise e Desenvolvimento de Sistemas) - Instituto Federal de Educação, Ciência e Tecnologia de Pernambuco - Campus Paulista, Paulista, PE, 2024. 20 p. | pt_BR |
dc.identifier.uri | https://repositorio.ifpe.edu.br/xmlui/handle/123456789/1462 | |
dc.description.abstract | The buying and selling of used cars is a vital activity for the Brazilian economy
and for access to urban mobility, especially in a scenario of rising new vehicle prices. However,
determining the fair price of a used car can be challenging. This final year project explores
the use of Machine Learning techniques to improve the accuracy of used car pricing.
A comprehensive dataset was developed, extracted from the OLX Brazil platform through
Web Scraping using Scrapy. Subsequently, exploratory data analysis was carried out, as
well as cleaning and preparation for training various supervised learning models focused
on regression. The results were promising, especially with the Random Forest model, which
achieved a determination coefficient of 0.9434 and a mean absolute error of 4855.27. These
results indicate that regression models can be effective in predicting vehicle prices based on
their characteristics, and suggest the need for further investigations to further improve used
car pricing techniques. | pt_BR |
dc.format.extent | 20 p. | pt_BR |
dc.language | pt_BR | pt_BR |
dc.relation | AHMED, M. Waqar. Understanding Mean Absolute Error (MAE) in Regression: A Practical
Guide. Medium. 2023. Dispon´ıvel em: https://medium.com/@m.waqar.ahmed/understanding-meanabsolute-
error-mae-in-regression-a-practical-guide-26e80ebb97df. Acesso em: 03/06/2024.
AZNAR, Pablo. What is the difference between Extra Trees and Random Forest?. Junho de
2020. Dispon´ıvel em: https://quantdare.com/what-is-the-difference-between-extra-trees-andrandom-
forest/. Acesso em: 07/06/2024.
BATUWITA, R.; PALADE, V. Class imbalance learning methods for support vector machines.
In: HE, H.; MA, Y. (Eds.). Imbalanced learning. [S.l.]: Wiley, 2013.
BREIMAN, Leo. Bagging Predictors. Machine Learning, v. 24, p. 123-140, 1996.
BREIMAN, Leo. Random Forests. Machine Learning, v. 45, p. 5-32, 2001.
Bukvic et al. Price Prediction and Classification of Used-Vehicles Using Supervised Machine
Learning. Sustainability, v. 14, 2022.
CHICCO, Davide et al. The coefficient of determination R-squared is more informative than
SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. PeerJ Computer Science,
2021.
DIAS, Willamy Mamede Da Silva. MACHINE LEARNING E A PREVISA˜ O DE PREC¸OS
DE TERRENOS EM BRAS´ILIA. Tese (Mestrado Profissional em Economia) - Instituto Brasileiro
de Ensino, Desenvolvimento e Pesquisa - IDP. Bras´ılia. 2023.
DREHMER, Vit´oria. Venda de carros usados cresce 14% e ´e 7 vezes maior que a de novos.
AutoEsporte. 2024. Dispon´ıvel em: https://autoesporte.globo.com/carros/usados-eseminovos/
noticia/2024/02/venda-de-carros-usados-cresce-14percent-e-e-7-vezes-maior-que-ade-
novos.ghtml. Acesso em: 13 de marc¸o de 2024.
GEURTS et al. Extremely randomized trees. Machine Learning, v. 63, p. 3-42, 2006.
IBM. What is Machine Learning?. 2023. Dispon´ıvel em:
https://web.archive.org/web/20231227153910/https://www.ibm.com/topics/machine-learning.
Acesso em: 25 de setembro de 2024.
JORDAN, M. I.; MITCHELL, T. M. Machine learning: trends, perspectives, and prospects.
Science, v. 349, n. 6245, p. 255–260, 2015.
LOH, Wei-Yin. Fifty Years of Classification and Regression Trees. International Statistical
Review, v. 82, n. 3, p. 329-348, 2014.
MAGALHA˜ ES, Toma´s Silva de. Sistema de Previsa˜o de Prec¸o de Carros Usados atrave´s de
Machine Learning. Tese (Mestrado em Engenharia de Inteligˆencia Artificial) - Departamento de
Engenharia e Inform´atica, Instituto Superior de Engenharia do Porto.
MITCHELL, Tom M. Machine Learning. McGraw-Hill Science/Engineering/Math. 1997.
NILSSON, N. J. Introduction to Machine Learning. Draft of Incomplete Notes, 2015. Dispon´ıvel em:
https://web.archive.org/web/20190816182600/http://ai.stanford.edu/people/nilsson/mlbook.html.
Acesso em: 12 de novembro de 2023.
OLX Brasil. Dispon´ıvel em: https://www.olx.com.br/. Acesso em: 12 de novembro de 2023.
PEDREGOSA, F. et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning
Research, v. 12, p. 2825-2830, 2011.
RAJ, Ashwin. A Quick and Dirty Guide to Random Forest Regression. Towards Data Science. Junho
de 2020. Dispon´ıvel em: https://towardsdatascience.com/a-quick-and-dirty-guide-to-random-forestregression-
52ca0af157f8. Acesso em: 06/05/2024.
REITZ, Kenneth. HTML Scraping. The Hitchhiker’s Guide to Python. 2016. Dispon´ıvel em:
https://docs.python-guide.org/scenarios/scrape/#web-scraping. Acesso em: 25 de setembro de 2024.
SALA´ RIO MI´NIMO - Tabela de Prec¸o. Dispon´ıvel em:
https://www.guiatrabalhista.com.br/guia/salario minimo.htm. Acesso em: 10 de agosto de 2024.
Sci-Kit Learn. Ensembles: Gradient boosting, random forests, bagging, voting, Stacking.
Dispon´ıvel em: https://scikit-learn.org/stable/modules/ensemble.html. Acesso em: 28 de novembro
de 2024.
Scrapy documentation. Dispon´ıvel em: https://docs.scrapy.org/en/latest/. Acesso em: 28 de
novembro de 2024.
SILVA, Thiago C´esar de Miranda. Uso de Machine Learning para Previs˜ao de Valores de
Apartamentos no Munic´ıpio do Recife. Tese (Bacharelado em Sistemas de Informac¸ ˜ao) - Universidade
Federal Rural de Pernambuco - UFPE. Recife. 2023.
Tabela FIPE: Entenda o que ´e e como funciona. Quatro Rodas. Dispon´ıvel em:
https://quatrorodas.abril.com.br/tabela-fipe. Acesso em: 12 de novembro de 2023.
Tabela Fipe Kwid. Dispon´ıvel em: https://tabelacarros.com/anos modelos/carros/renault/kwid.
Acesso em: 10 de agosto de 2024.
ZHAO, Bo. Web Scraping. Encyclopedia of Big Data, p. 1-3, 2017. | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.rights | An error occurred on the license name. | * |
dc.rights.uri | An error occurred getting the license - uri. | * |
dc.subject | Aprendizado de Máquina | pt_BR |
dc.subject | Aprendizado Supervisionado | pt_BR |
dc.subject | Raspagem de Dados | pt_BR |
dc.subject | Análise de Dados | pt_BR |
dc.subject | Regressão | pt_BR |
dc.title | Aprendizado de máquina na precificação de carros usados: desenvolvimento de uma base de dados para modelos de regressão. | pt_BR |
dc.title.alternative | Machine learning in used car pricing: development of a database for regression models. | pt_BR |
dc.type | Article | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/5107529910755765 | pt_BR |
dc.contributor.advisor1 | Medeiros, Sheyla Natália de | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5315530469973453 | pt_BR |
dc.contributor.referee1 | Oliveira, Flávio Rosendo da | |
dc.contributor.referee2 | Brito Junior, Ozonias de Oliveira | |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/6828380394080049 | pt_BR |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/0287523204946792 | pt_BR |
dc.publisher.department | Paulista | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO | pt_BR |
dc.description.resumo | A compra e venda de carros usados ´e uma atividade vital para a economia brasileira
e para o acesso à mobilidade urbana, especialmente em um cenário de aumento
dos preços de veículos novos. No entanto, determinar o preço de um carro usado pode
ser desafiador. Este trabalho explora o uso de técnicas de aprendizado de máquina para
aprimorar a acurácia na precificação de automóveis usados. Desenvolveu-se um conjunto
de dados abrangente, extraído da plataforma OLX Brasil por meio de raspagem de dados
utilizando Scrapy. A seguir, realizou-se uma análise exploratória dos dados, além de limpeza
e preparação para o treinamento de diversos modelos de aprendizado supervisionado
voltados para regressão. Os resultados mostraram-se promissores, especialmente com o
modelo de Floresta Aleatória, que alcançou um coeficiente de determinação de 0,9434 e
um erro médio absoluto de 4855,27. Estes resultados indicam que modelos de regressão
podem ser eficazes na previsão de preços de veículos com base em suas características, e
sugerem a necessidade de investigação adicionais para aprimorar ainda mais as técnicas
de precificação de carros usados. | pt_BR |
dc.creator.name2 | Holmes, Raphael Barbosa | |
dc.creator.Lattes2 | http://lattes.cnpq.br/9459474420278540 | pt_BR |