Costa, Carlos Manuel Jorge daCosta, João Ricardo Galhardo Almeida2025-04-292025-04-292025-02Costa , João Ricardo Galhardo Almeida (2025). “Predicting Airbnb prices using machine learning algorithm”. Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestãohttp://hdl.handle.net/10400.5/100356The hospitality industry has changed as a result of the growth of short-term rental websites like Airbnb. Since hosts and policymakers have the need to possess a deep understanding of the variables that affect price, in order to balance housing accessibility and economic opportunity, price prediction has become an essential tool for them. Overall, Airbnb hosts may improve their pricing tactics and policymakers can create more balanced policies to maintain urban housing stability and tourism-driven growth, by utilizing data-driven techniques. This study evaluates several models to investigate numerous machine learning techniques for predicting Airbnb prices in Lisbon's parish. To comprehend the nature of the data and find crucial characteristics for price prediction, the data is first cleaned and pre-processed before the undergoing descriptive, prescriptive and exploratory analysis. The predictive performance of four distinct models was assessed, namely Ordinary Least Squares, Geographically Weighted Regression, Random Forest and XGBoost. Among these four, the Random Forests model outperformed the othersin terms of rental price estimation, demonstrating how well it captures intricates market trends.O setor da hotelaria tem sofrido alterações significativas devido ao crescimento de plataformas de aluguer de curta duração, como o Airbnb. Dado que tanto os anfitriões como as entidades reguladoras necessitam de um conhecimento aprofundado sobre as variáveis que influenciam o preço — com o objetivo de equilibrar a acessibilidade da habitação e as oportunidades económicas —, a previsão de preços tornou-se uma ferramenta essencial. De um modo geral, os anfitriões do Airbnb podem otimizar as suas estratégias de definição de preços, enquanto as entidades reguladoras podem desenvolver políticas mais equilibradas para manter a estabilidade da habitação urbana e, simultaneamente, fomentar o crescimento impulsionado pelo turismo, recorrendo a técnicas baseadas em dados. Este estudo avalia diversos modelos com o intuito de explorar diferentes técnicas de aprendizagem automática aplicadas à previsão de preços no Airbnb, especificamente nas freguesias de Lisboa. Para compreender a natureza dos dados e identificar as variáveis mais relevantes para a previsão, foi realizado um processo de limpeza e préprocessamento, seguido por análises descritivas, exploratórias e prescritivas, e consequente modelização. Com base na análise do desempenho preditivo de quatro modelos distintos — Mínimos Quadrados Ordinários, Regressão Geograficamente Ponderada, Floresta Aleatória e XGBoost —, a Floresta Aleatória destacou-se como o modelo com melhor desempenho na estimativa dos preços de arrendamento, demonstrando uma elevada capacidade para captar as tendências intrínsecas do mercado.engAirbnbLIsbonMachine LearningPrice PredictionShort-Term RentalsSharing EconomyLisboaAprendizagem automáticaPrevisão de preçosAluger de curta duraçãoEconomia de partilhaPredicting Airbnb prices using machine learning algorithmsmaster thesis