Bastos, João A.Loggia, Gabriele2024-11-252024-11-252024-07Loggia, Gabriele (2024). “A hybrid approach to option pricing integrating unsupervised and supervised machine learning models”. Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestãohttp://hdl.handle.net/10400.5/95620Mestrado Bolonha em FinançasThis thesis explores a novel approach to option pricing by integrating unsupervised and supervised machine learning models. The objective is to assess whether these models can outperform the traditional Black-Scholes-Merton model and to investigate the effect of clustering on prediction accuracy. The analysis uses data from the Ivy DB US database, focusing on S&P 500 options traded on the CBOE from December 30, 2019, to December 30, 2022. The methodology involves applying K-means clustering to segment the dataset, followed by training Random Forest and Deep Neural Network models on these clusters. The models' performances are then compared against non-clustered machine learning models and the BSM model. The results show that the hybrid machine learning approach improves option pricing accuracy. Specifically, the Deep Neural Network models achieve a median improvement of 39.1%, while the Random Forest models show a median improvement of 5.2%. This suggests the potential of integrating advanced clustering techniques in financial modeling for more precise option pricing.Esta tese explora uma abordagem inovadora para a precificação de opções, integrando modelos de machine learnig supervisionados e não supervisionados. O objetivo é avaliar se esses modelos podem superar o modelo tradicional de Black-Scholes-Merton e investigar o efeito da clusterização na precisão das previsões. A análise utiliza dados do banco de dados Ivy DB US, focando-se em opções do S&P 500 negociadas na CBOE de 30 de dezembro de 2019 a 30 de dezembro de 2022. A metodologia envolve a aplicação da clusterização K-means para segmentar o conjunto de dados, seguida pelo treinamento de modelos Random Forest e Deep Neural Network nesses clusters. O desempenho dos modelos é então comparado com os modelos de machine learnig não clusterizados e com o modelo BSM. Os resultados mostram que a abordagem híbrida machine learnig melhora a precisão da precificação de opções. Especificamente, os modelos de Deep Neural Network alcançam uma melhoria média de 39,1%, enquanto os modelos Random Forest mostram uma melhoria média de 5,2%. Isso sugere o potencial de integrar técnicas avançadas de clusterização na modelagem financeira para uma precificação de opções mais precisa.engOption PricingMachine LearningK-Means ClusteringRandom ForestDeep Neural NetworkA hybrid approach to option pricing integrating unsupervised and supervised machine learning modelsmaster thesis