Utilize este identificador para referenciar este registo: http://hdl.handle.net/10400.5/101133
Título: Development of remote electronic monitoring methodologies for application in biological data collection used in scientific advice to fisheries management
Autor: Correia, Inês Rebanda
Orientador: Vasconcelos, Rita Maria Pina
Tanner, Susanne Eva
Palavras-chave: Visão computacional
Pescas
Deteção
Medição
Classificação
Teses de mestrado - 2025
Data de Defesa: 2025
Resumo: A importância socio-económica da pesca para os seres humanos é amplamente reconhecida em todo o mundo, contribuindo com grandes receitas, proporcionando emprego a milhões de pessoas e garantindo o fornecimento de fontes alimentares essenciais. O consumo de alimentos aquáticos tem vindo a aumentar de forma constante desde a década de 60, com um aumento da sobrepesca, deixando uma grande percentagem de unidades populacionais de peixes a serem exploradas de forma não sustentável. A sobrepesca é uma das principais ameaças aos ecossistemas marinhos, mas outros factores como as alterações climáticas, a poluição, a destruição de habitats e a proliferação de espécies invasoras também representam riscos significativos, ameaçando os ecossistemas marinhos e as suas comunidades e populações. Para evitar o declínio das populações de peixes, os países e organizações internacionais começaram a desenvolver estratégias de gestão sustentável das pescas. Na União Europeia, a Política Comum das Pescas (PCP) tem por objetivo assegurar uma pesca sustentável, juntamente com o regulamento relativo às medidas técnicas, que estabelece regras sobre a atividade pesqueira, incluindo especificações das artes de pesca e zonas protegidas à pratica desta atividade. A gestão das pescas baseia-se em pareceres científicos, principalmente derivados de avaliações das unidades populacionais de peixes que envolvem a recolha e análise de dados sobre o estado das unidades populacionais. A avaliação depende de dados como a identificação da espécie e parâmetros chave como o comprimento dos individuos, que são tradicionalmente realizados manualmente, tornando-se um processo moroso e dispendioso. Para melhorar a eficiência, reduzir os erros e diminuir os custos, estudos recentes têm se centrado na automatização destes processos. Para substituir a recolha deste tipo de dados biológicos no contexto das pescas, e noutros contextos, de uma forma manual, a fotografia e o vídeo tornaram-se ferramentas essenciais, especialmente para estudos a longo prazo, gerando grandes quantidades de dados. No entanto, a análise destes vastos conjuntos de dados tornou-se um desafio, levando à integração da visão computacional (“computer vision”) - um domínio da Inteligência Artificial (IA) - para ajudar a automatizar e simplificar o processo de análise, melhorando a velocidade e a consistência da interpretação dos dados na investigação em biologia. A visão computacional, permite que os computadores interpretem e analisem dados visuais, à semelhança da forma como os seres humanos percepcionam o seu redor através da visão. Devido à complexidade dos algoritmos utilizados no desenvolvimento da visão computacional, a aprendizagem automática (“Machine Learning”) é incorporado nestes sistemas permitindo aos computadores melhorar o desempenho ao longo do tempo através do reconhecimento de padrões. Deste forma, o computador è capaz de lidar com grandes volumes de dados, criando modelos que podem classificar e prever tendências com base em dados fornecidos, facilitando a adaptação de algoritmos a diferentes categorias de objectos. A aprendizagem profunda (“Deep Learning”), um subconjunto da aprendizagem automática, envolve o treino de redes neuronais para reconhecer padrões e modelar relações em grandes conjuntos de dados. Estas redes, inspiradas no cérebro humano, são constituídas por várias camadas em que os nós estão ligados por ligações ponderadas, que influenciam a ativação de cada camada com base nos valores de entrada. Na visão computacional, por exemplo, a intensidade da luz de um pixel serve de entrada para a primeira camada e, através de camadas sucessivas, os objectos podem ser detectados. A eficiência dos modelos de aprendizagem profunda depende da quantidade e diversidade de dados anotados utilizados no treino inicial desses mesmos modelos, sendo que conjuntos de dados maiores e diversos tendem a melhorar o desempenho. Embora a preparação dos dados para construir um modelo possa ser morosa, os benefícios a longo prazo podem superar esse tempo inicial dispendido. Depois de o modelo ser treinado e atingir o seu melhor desempenho, pode ser utilizado numa quantidade muito maior de dados. Os avanços na Inteligência Artificial, na aprendizagem automática e, consequentemente, na aprendizagem profunda permitiram a aplicação da visão computacional na automatização da recolha de dados em vários domínios da biologia. Estas técnicas têm vindo a ser progressivamente mais utilizadas na recolha de dados biológicos sobre a pesca, com destaque para a determinação da espécie e a medição do comprimento dos indivíduos. No entanto, continuam a existir desafios, como o desenvolvimento de algoritmos mais robustos para lidar com a diversidade de espécies de peixes e melhorar a eficiência das medições, especialmente quando se identificam várias espécies ao mesmo tempo ou se efectuam várias medições. Desta forma, este estudo surge como uma contribuição relevante para compreender a eficiência de modelos de visão computacional na deteção, classificação e medição de indivíduos de quatro espécies de peixes importantes em termos de desembarques em Portugal Continental, besugo (Pagellus acarne), faneca (Trisopterus luscus), pescada (Merluccius merluccius) e robalo (Dicentrarchus labrax), através de imagens obtidas numa lota e armazenadas remotamente na plataforma da Fishmetrics. Nesta plataforma, criada pela empresa Fishmetrics, é possível realizar medições em individuos de peixe presentes em imagens, obtendo comprimentos reais, graças à calibração 3D desenvolvida. Este estudo avalia o desempenho de dois tipos de modelos de visão computacional utilizando um algoritmo pré-existente (YOLOv8): i) quatro modelos especificos, um para cada espécie; e ii) um modelo multi-específico, para qualquer uma dessas quatro espécies. Para os modelos específicos de cada espécie, este estudo avalia o desempenho na deteção de indivíduos, analisando os níveis de confiança das detecções e o número máximo de indivíduos detectados numa imagem. Essas detecções são utilizadas para extrair medidas de comprimento total dos indivíduos, que são depois comparadas com medidas manuais, avaliando a precisão dos modelos na medição. Para o modelo multi-específico, este estudo avalia o desempenho do modelo na deteção e medição de indivíduos, bem como na identificação das espécies. A classificação da espécie efectuada pelo modelo é comparada com a classificação originalmente dada pela lota ao indivíduo. De acordo com os gráficos obtidos posteriormente ao treino, a evolução de diversas métricas permitiram validar os modelos, estando aptos para serem testados. De acordo com os gráficos do valor de F1, os modelos (especificos e multi-especifico) registaram niveis de confiança entre 0.40 e 0.50 para os quais apresentam o valor máximo de F1, sendo estes os valores para os quais é esperado que os modelos apresentem o seu melhor desempenho. Na fase de teste, todos os modelos específicos treinados foram capazes de detetar, com niveis de confiança entre 0.60 e 0.64, 40 a 50% de indivíduos por caixa, permitindo também a extração de medições com uma diferença média da medida real de 1 cm. O modelo especifico do besugo obteve, em geral, o melhor desempenho quando comparado com os modelos específicos das outras espécies, possivelmente explicado pela maior número de imagens de treino. O modelo multi-específico também foi capaz de detetar, com niveis de confiança médios para cada espécie entre 0.58 e 0.69, 40 a 75% de indivíduos por caixa, sendo possivel extrair as medições do comprimento total do corpo dos individuos com uma diferença média de 1cm da medida real. Destacaram-se as deteções relativas ao robalo, apresentando a menor diferença média entre o número de indivíduos detectados por caixa e o número de indivíduos contados visualmente, tendo sido capaz de detetar em média 75% dos individuos. Esta diferença poderá ter-se devido a existência de um menor número de individuos por caixa, nas amostras de robalo e também pelas carasteristicas dos individuos desta espécie, que apresentam dimensões superiores aos individuos das outra espécies. O modelo multiespecífico foi também capaz de classificar as espécies dos indivíduos detetados, classificando corretamente entre 70 a 99% das detecções de cada espécie. Apesar dos resultados, foi discutida a possivel influência de vários fatores no desempenho dos modelos treinados. A qualidade das imagens pode ter um grande impacto nos modelos, começando logo por facilitar o treino e, posteriormente, produzir modelos com melhor desempenho, se estas apresentarem uma boa qualidade. As condições em que as imagens foram tiradas também podem influenciar os resultados, tais como a iluminação, o ângulo da câmera, a sua distância ao objeto e ainda o background das imagens. Para além destes fatores, as configurações para o treino do modelo, como o tamanho dos lotes de processamento e o tipo de modelo pré-existente selecionado (neste estudo foi o YOLOv8n), conjugado com as capacidades computacionais do computador podem afetar o posterior desempenho dos modelos treinados. Existem muito poucos estudos publicados sobre modelos de visão computacional aplicados à aquisação de dados sobre peixes, pelo que é importante continuar esta investigação. Este grupo de seres vivos é muito diversificado em termos de forma e cor, pelo que o estudo com várias espécies permitirá melhorar o conhecimento sobre a adaptação de parâmetros mais indicada a modelos de visão computacional para deteção, medição e classificação de peixes. A adoção de modelos de visão computacional, como os desenvolvidos neste estudo, podem vir a automatizar o processo de aquisição e análise de dados biológicos usados na avaliação de unidades populacionais de pescas em Portugal, diminuindo o tempo dispensado e os recursos necessários, aumentando ainda a quantidade e qualidade dos dados que podem ser analisados num curto espaço de tempo.
The socio-economic importance of fisheries is widely recognised around the world, along the urgent need for sustainable management to avoid overfishing. Countries and international organisations have therefore been developing sustainable fisheries management strategies, based on stock assessment and scientific advice. To achieve this it is necessary to collect and analyse biological data related to the state of stocks, including key variables such as body length of landed individuals. Traditionally, this variable has been collected manually, however to improve efficiency, reduce errors and lower costs, recent studies have focused on automating these processes using computer vision models. This study evaluates the performance of two types of models (species-specific and multi-specific) using a pre-existing algorithm (YOLOv8), in the detection, classification and measurement of individuals from four different species of fish, axillary seabream (Pagellus acarne), pouting (Trisopterus luscus), European hake (Merluccius merluccius) and European seabass (Dicentrarchus labrax). The analysis is based on images obtained from one Portuguese auction centre and stored remotely on the Fishmetrics platform. Both species-specific models and multi specific model detected 40 to 75% of individuals per box, with confidence levels ranging from 0.58 to 0.69, depending on the species. Model extracted length measurements showed an average difference from the real measurement of 1 cm. The multi-specific model was also able to correctly classify the species of the detected individual in 70 to 99% of total detections, depending on the species. The study discusses the possible influence of different parameters on model performance. Given that there is limited research on computer vision models applied to biological data on fishes in the context of fisheries management, further studies are of key importance. Further advancements in this research will allow the practical implementation of these models, enhancing the quantity and quality of collected data.
Descrição: Tese de Mestrado, Ecologia Marinha, 2025, Universidade de Lisboa, Faculdade de Ciências
URI: http://hdl.handle.net/10400.5/101133
Designação: Mestrado em Ecologia Marinha
Aparece nas colecções:FC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
TM_Inês_Correia.pdf10,17 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.