Decentralized solar PV generation forecast based on peer-to-peer approach

Silva, Luís Carlos Claudino Teixeira da

http://hdl.handle.net/10451/33924

Utilize este identificador para referenciar este registo.

Nome:	Descrição:	Tamanho:	Formato:
ulfc124464_tm_Luís_Silva.pdf		1.8 MB	Adobe PDF	Ver/Abrir

Contacte-nos

Autores

Silva, Luís Carlos Claudino Teixeira da

Orientador(es)

Brito, Miguel Centeno

Pedro, Margarida

Resumo(s)

Atualmente, cerca de 80% de energia consumida provêm de fontes não renováveis. O aumento da concentração de gases de efeito de estufa e poluentes na atmosfera está fortemente relacionado com a conversão de combustíveis fósseis em eletricidade, calor e a sua utilização em veículos. Este percurso leva a mudanças climáticas que vão perturbar o delicado equilíbrio dos ecossistemas e pode facilmente levar várias espécies de animais e plantas à sua extinção. A utilização de fontes de energia renováveis como solar ou o vento para a produção de energia elétrica pode fornecer uma solução fazível para a redução de emissão de gases de efeito de estufa, já que são livres de emissões poluentes para a atmosfera, e desta forma salvaguardar futuras gerações. A energia solar, em particular produção fotovoltaica (PV), pode satisfazer as necessidades elétricas de toda a humanidade. Na última década, sistemas PV têm vindo a aumentar o seu potencial, com a integração de células PV em edifícios de habitação e serviços. Em 2015, o mercado PV ultrapassou vários recordes com a sua expansão global, tendo nesta altura uma capacidade total instalada de cerca de 227 GW, dez vezes maior do que em 2009. Em 2016 voltaram-se a bater recordes com um aumento de cerca de 75 GW. Em Portugal a tecnologia PV tem sido, de todas as tecnologias renováveis, a que mais cresceu, sendo praticamente inexistente em 2006 para uma capacidade instalada de 467 MW no fim de 2016. Cerca de 72 MW estão instalados no sector residencial. Na Europa cerca de 20 GW está instalado no sector residencial, para um total da ordem de 50 GW (no mundo). A introdução desta nova tecnologia na rede elétrica levanta desafios devido ao seu carácter não controlável, causando vários problemas para os operadores da rede elétrica, como por exemplo problemas de fluxo de potência inversa ou de controlo de voltagem. As previsões de radiação solar e/ou produção fotovoltaica proporcionam um modo para os operadores de rede controlarem e gerirem os balanços de produção e de consumo de energia de forma a otimizar o processo e não terem de usar as suas reservas de segurança, reduzindo custos. Com o aumento de produção PV distribuído, a necessidade de prever a sua potência produzida é cada vez maior para o operador do sistema distribuição (DSO). Um dos principais objetivos desta dissertação é estudar e desenvolver um modelo de previsão para a produção PV distribuída na perspetiva do DSO. Isto significa que o modelo de previsão criado deve poder ser aplicado a qualquer sistema sem saber os seus detalhes técnicos; os sistemas analisados vão ser considerados como caixas negras, onde apenas a potência instalada, a distância entre sistemas e o seu histórico de produção é conhecido. Existe uma grande variedade de técnicas de previsão. Como tal foi feita uma filtragem destas técnicas com o objetivo de ter um modelo simples como base de comparação, um modelo eficiente e um modelo mais complexo, mas com um grande potencial. Após uma análise de bibliografia os modelos escolhidos foram a Persistência (usada como um bom modelo de referência), regressões multivariáveis (simples, com resultados bastante satisfatórios) e o modelo de vetores de suporte (que têm tido um acréscimo de desenvolvimento e resultados bastante interessantes). A Persistência é o modelo que assume que o que está a acontecer no presente se repetirá no futuro. Embora simples, este modelo pode obter melhores resultados do que modelos numéricos de previsão de tempo (NWP) já que para horizontes curtos consegue traduzir uma melhor representação das nuvens do que os modelos de NWP. Nos casos de horizontes mais alargados (algumas horas ou dias) este modelo começará a obter erros bastantes grandes, mas serve uma base de comparação apropriada para outros modelos. O modelo de regressões multivariáveis (ARX) é um modelo de regressão linear que incorpora mais do que uma variável independente. Na maioria dos casos as relações principais costumam ser lineares ou, caso não sejam, podem ser assumidas de uma forma satisfatória, e desta forma aplicar este modelo e obter resultados interessantes. As grandes vantagens deste modelo é a sua fácil utilização e implementação, mas pode levantar dificuldades quando temos poucos dados ao fazer um ajuste demasiado fino aos dados de treino e perder a sua capacidade de generalizar para variáveis ainda não conhecidas. Um modelo mais complexo que também usa regressões é o modelo de vetores de suporte. Este modelo foi inicialmente um modelo orientado para problemas de classificação linear, para separar duas classes através de uma linha reta num plano em outra dimensão, chamado de Hyperplane. Este modelo foi mais tarde usado para problemas não lineares onde foi adaptado para problemas de previsões através de regressões lineares por Vapnik, 1995, passando a chamar-se regressão de vetores de suporte (SVR). O conceito geral deste modelo é transformar os dados fornecidos para uma outra dimensão onde seja possível fazer uma regressão linear, e depois devolver esta função. Esta transformação para outra dimensão é bastante facilitada graças a facilidade de incorporar o uso de funções kernel já existentes. O único problema é a escolha dos vários kernel que se torna um problema não trivial. Para este trabalho escolheu-se o kernel RBF, o mais usado por outros estudos semelhantes. Os parâmetros principais deste modelo são o épsilon e o cost. Estes parâmetros vão ser coeficientes que vão criar um intervalo onde o que esteja dentro deste será ignorado pelo modelo, olhando este apenas para os que restaram; estes dados que não são ignorados são chamados de vetores de suporte. Outra forma deste modelo é o nu SVR, que em vez de nos deixar escolher o épsilon, permite-nos escolher a percentagem de vetores de suporte a usar e desta forma ele automaticamente calcula o épsilon a usar. A vantagem desta abordagem é na poupança de tempo computacional a escolher o melhor épsilon, mas com a contrapartida de perder algum controlo sobre o erro do modelo, já que não é possível escolher o épsilon. A grande vantagem do modelo SVR é que de certa forma é imune ao excesso de ajuste dos dados para o treinar já que os parâmetros épsilon e cost evitam isto e consegue obter desempenhos satisfatórios com o uso de poucos dados. Para a previsão de radiação solar ou produção fotovoltaica é importante considerar o índice de céu limpo. O índice de céu limpo (K) relaciona a condição de um instante totalmente limpo (sem nebulosidade) com a condição real existente. Este índice varia entre K=1, que é um instante sem nebulosidade, e K=0, que representa um instante sem qualquer luz (noite, ou eclipse). O K pode ser usado para isolar a interferência causada pelas nuvens e eliminar os impactos da posição dos módulos ou da variabilidade sazonal. A remoção destes impactos permite a utilização da informação de vários sistemas diferentes de uma forma equivalente. Neste trabalho o K é calculado através da abordagem de Lonij, pela sua simplicidade e a necessidade de apenas do histórico de produção do(s) sistema(s) selecionado(s). Nesta dissertação os dados usados para desenvolver e testar os modelos de previsão referem-se a Inglaterra, região de East Midlands, para um ano completo (01/07/2015 até o dia 30/06/2016), com um passo de 30 min. Foi realizada uma análise preliminar a estes dados, eliminando as estações com demasiados valores em falta; no final são usados dados de 57 sistemas. Além da previsão da geração individual de cada sistema, foi também considerado testar a previsão para a geração agregada da região em estudo. Todos os modelos foram desenvolvidos em R. Um dos primeiros problemas identificados foi o tempo necessário para a aplicação do modelo SVR. Os dados foram transformados para um passo de 1h de forma a reduzir em metade o número de dados usados. Os parâmetros para o SVR foram reduzidos a cinco hipóteses por parâmetro (épsilon, cost e gamma). Os números de estações previstas do modelo foram reduzidos de 57 a 12 (as 57 estações foram usadas como variáveis pelos modelos para a previsão) e o nu SVR foi utilizado para verificar se a redução no tempo era significativa e se haveria perda de desempenho. Os horizontes estudados foram de 1h até 6h. O modelo da Persistência foi o primeiro a ser testado. Cada modelo terá inicialmente apenas informações do tempo presente (n = 1), sendo o primeiro caso de estudo, depois adicionando 2 pontos passados (n = 3) e, finalmente, adicionando 4 pontos passados (n = 5). Em todos os casos de estudo, tanto o ARX quanto o SVR superaram o modelo de Persistência, exceto no quarto caso (n=5), o ARX neste caso, especialmente para horizontes maiores, têm o pior resultado. Os resultados em geral demonstraram que o uso de informações das estações próximas ajuda a precisão da previsão. Concentrando no caso em que se usa apenas dados do presente (n = 1), a previsão do ARX e SVR, mostra um desempenho muito semelhante, com ligeira vantagem para SVR em horizontes maiores. Um aspeto sistemático na previsão para o caso regional é ter um desempenho menor do que o caso individual para horizontes inferiores, mas quase igual para horizontes maiores. Como a referência de comparação de ambos os modelos (ARX e SVR) é a Persistência e esta melhora no caso regional, devido a soma dos vários sistemas suavizar o comportamento da produção PV, os modelos aparentam ter pior performances para horizontes baixos, o que não se verifica no erro médio quadrático normalizado (nRMSE). Quando n = 3 e n = 5, o SVR supera o ARX, sobretudo para horizontes maiores, mas com pior desempenho do que o caso de usar apenas informação presente (n = 1). Isso significa que adicionar informação passada apenas teve impacto negativo nos modelos. Isto pode ser uma adversidade de usar dados com um passo de 1 hora e não o passo original de 30 minutos, já que desta forma, para horizonte grandes (4h para cima) o modelo ARX pode perder a sua capacidade de generalizar tendo um ajuste demasiado grande ao treino, devido a redução de alvos na previsão. As nuvens podem ser eventos muito rápidos, portanto, para um melhor resultado, dever-se-ia usar dados de resolução mais alta, já que o passo de 1 hora é uma resolução muito baixa. A principal ideia que pode ser retirada destes casos é que o modelo SVR é um modelo mais robusto do que o ARX e pode lidar melhor com o uso de mais variáveis, não sofrendo de excesso de ajustamento, que parece acontecer no modelo ARX. O modelo SVR exige uma computação muito mais exigente do que o ARX, sendo o principal problema o processo de otimização dos parâmetros. A alternativa utilizada nu SVR, reduziu consideravelmente esse processo sem perda de desempenho, uma alternativa ótima para o caso em questão, mas se realmente for necessário controlar a quantidade de erro no modelo e ir para o melhor desempenho possível, o épsilon SVR é o modelo escolhido. Estes modelos deveriam ser testados com dados de resolução mais elevada, já que deve melhorar ambos os modelos, especialmente o SVR, uma vez que parece que pode superar o problema de excesso de ajustamento melhor, mas tal não foi possível tendo em consideração o computador usado para esta dissertação.

This work studies solar power forecasting based on multivariable linear regressions (ARX) and support vector regressions (SVR) for a set of spatially distributed photovoltaic systems, and their aggregate. Models consider data-driven through a clear sky index from multiple neighbor systems available. The method is applied for very short-forecasting from the perspective of the distributed system operator (DSO). Forecast performance is assessed by comparison with the performance of the Persistence model, by evaluating forecast root mean square error (RMSE). Results for a case study with 57 PV systems in Sheffield, UK, show that in general, the SVR model presented better performances than ARX, especially for longer horizons. It is also shown that the SVR model can handle well overfitting problems. On the other hand, the model requires large computation power and time. The addition of neighbor’s information has a positive result in the forecasting performance for all models.

Descrição

Tese de mestrado integrado em Engenharia da Energia e do Ambiente, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2018

Palavras-chave

Regressões lineares multivariáveis (ARX) Regressão de vetores de suporte (SVR) Persistência Potência solar Índice de céu limpo Previsões de minutos/horárias Operador do sistema de distribuição (DSO) R Teses de mestrado - 2018

URI

http://hdl.handle.net/10451/33924

Coleções

FC - Dissertações de Mestrado

Ver registo completo