Costa, Carlos J.Chen, Xin2025-03-282025-03-282024-10Chen, Xin .(2024). “Analyzing the performance of AIRBNB listings in Lisbon using machine learning techniques” . Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestãohttp://hdl.handle.net/10400.5/99830Since its opening in 2008, Airbnb has expanded rapidly to over 220 countries and regions over these years. In order to understand the performance of its listings and predict future trends, it has become essential to study performance metrics in light of this global growth. The objective of this research is to identify the key drivers of performance metrics, specifically occupancy and review ratings, and to compare different machine learning models for performance prediction. The data set used in this study focuses on Lisbon, Portugal, and contains more than 20.000 different advertisements and 75 variables in total. After the cleaning and pre-processing of the dataset, the Least Absolute Shrinkage and Selection Operator were applied to select the most relevant variables to be included in the models. The results show that host-related factors, such as superhost status, acceptance rate, and response rate, are the features that most influence the listing performance. In addition, the number of amenities also plays a key role in success. Among the predictive models, tree-based ensemble methods, namely Random Forest, outperformed other approaches and provided the most accurate predictions.Desde o seu lançamento em 2008, a Airbnb expandiu-se rapidamente para mais de 220 países e regiões ao longo destes anos. A compreensão do desempenho dos seus anúncios e a previsão de tendências futuras tornam essencial o estudo das métricas de desempenho à luz deste crescimento global. O objetivo desta investigação é identificar os principais fatores que influenciam as métricas de desempenho, nomeadamente, as taxas de ocupação e de avaliação dos comentários, e comparar diferentes modelos de aprendizagem automática para a previsão do desempenho. A base de dados utilizada neste estudo é constituída por dados referentes a anúncios publicados no Airbnb da cidade Lisboa, Portugal, e comtempla mais de 20.000 anúncios diferentes e 75 variáveis no total. Após a limpeza e o pré-processamento do conjunto de dados, foi aplicado o operador de seleção e redução mínima absoluta para selecionar as variáveis mais relevantes a incluir nos modelos. Os resultados mostram que os fatores relacionados com o anfitrião, como o estatuto de superhost, a taxa de aceitação e a taxa de resposta, são as variáveis que mais influenciam o desempenho da propriedade. Além disso, os números de comodidades oferecidas também desempenham um papel fundamental nas métricas de sucesso. Entre os modelos preditivos, o método de ensemble, nomeadamente o Random Forest, superaram outras abordagens e forneceram as previsões mais exatas.engAirbnbMachine LearningPerformance MetricsLisbonAirbnbAprendizagem AutomáticaMétricas de DesempenhoLisboaAnalyzing the performance of Airbnb listings in Lisbon using machine learning techniquesmaster thesis