Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10400.5/101133
Título: | Development of remote electronic monitoring methodologies for application in biological data collection used in scientific advice to fisheries management |
Autor: | Correia, Inês Rebanda |
Orientador: | Vasconcelos, Rita Maria Pina Tanner, Susanne Eva |
Palavras-chave: | Visão computacional Pescas Deteção Medição Classificação Teses de mestrado - 2025 |
Data de Defesa: | 2025 |
Resumo: | A importância socio-económica da pesca para os seres humanos é amplamente reconhecida em
todo o mundo, contribuindo com grandes receitas, proporcionando emprego a milhões de pessoas e
garantindo o fornecimento de fontes alimentares essenciais. O consumo de alimentos aquáticos tem
vindo a aumentar de forma constante desde a década de 60, com um aumento da sobrepesca, deixando
uma grande percentagem de unidades populacionais de peixes a serem exploradas de forma não
sustentável.
A sobrepesca é uma das principais ameaças aos ecossistemas marinhos, mas outros factores
como as alterações climáticas, a poluição, a destruição de habitats e a proliferação de espécies invasoras
também representam riscos significativos, ameaçando os ecossistemas marinhos e as suas comunidades
e populações.
Para evitar o declínio das populações de peixes, os países e organizações internacionais
começaram a desenvolver estratégias de gestão sustentável das pescas. Na União Europeia, a Política
Comum das Pescas (PCP) tem por objetivo assegurar uma pesca sustentável, juntamente com o
regulamento relativo às medidas técnicas, que estabelece regras sobre a atividade pesqueira, incluindo
especificações das artes de pesca e zonas protegidas à pratica desta atividade.
A gestão das pescas baseia-se em pareceres científicos, principalmente derivados de avaliações
das unidades populacionais de peixes que envolvem a recolha e análise de dados sobre o estado das
unidades populacionais. A avaliação depende de dados como a identificação da espécie e parâmetros
chave como o comprimento dos individuos, que são tradicionalmente realizados manualmente,
tornando-se um processo moroso e dispendioso. Para melhorar a eficiência, reduzir os erros e diminuir
os custos, estudos recentes têm se centrado na automatização destes processos.
Para substituir a recolha deste tipo de dados biológicos no contexto das pescas, e noutros
contextos, de uma forma manual, a fotografia e o vídeo tornaram-se ferramentas essenciais,
especialmente para estudos a longo prazo, gerando grandes quantidades de dados. No entanto, a análise
destes vastos conjuntos de dados tornou-se um desafio, levando à integração da visão computacional
(“computer vision”) - um domínio da Inteligência Artificial (IA) - para ajudar a automatizar e simplificar
o processo de análise, melhorando a velocidade e a consistência da interpretação dos dados na
investigação em biologia.
A visão computacional, permite que os computadores interpretem e analisem dados visuais, à
semelhança da forma como os seres humanos percepcionam o seu redor através da visão. Devido à
complexidade dos algoritmos utilizados no desenvolvimento da visão computacional, a aprendizagem
automática (“Machine Learning”) é incorporado nestes sistemas permitindo aos computadores melhorar
o desempenho ao longo do tempo através do reconhecimento de padrões. Deste forma, o computador è
capaz de lidar com grandes volumes de dados, criando modelos que podem classificar e prever
tendências com base em dados fornecidos, facilitando a adaptação de algoritmos a diferentes categorias
de objectos.
A aprendizagem profunda (“Deep Learning”), um subconjunto da aprendizagem automática,
envolve o treino de redes neuronais para reconhecer padrões e modelar relações em grandes conjuntos
de dados. Estas redes, inspiradas no cérebro humano, são constituídas por várias camadas em que os nós
estão ligados por ligações ponderadas, que influenciam a ativação de cada camada com base nos valores
de entrada. Na visão computacional, por exemplo, a intensidade da luz de um pixel serve de entrada
para a primeira camada e, através de camadas sucessivas, os objectos podem ser detectados. A eficiência
dos modelos de aprendizagem profunda depende da quantidade e diversidade de dados anotados
utilizados no treino inicial desses mesmos modelos, sendo que conjuntos de dados maiores e diversos
tendem a melhorar o desempenho. Embora a preparação dos dados para construir um modelo possa ser morosa, os benefícios a
longo prazo podem superar esse tempo inicial dispendido. Depois de o modelo ser treinado e atingir o
seu melhor desempenho, pode ser utilizado numa quantidade muito maior de dados. Os avanços na
Inteligência Artificial, na aprendizagem automática e, consequentemente, na aprendizagem profunda
permitiram a aplicação da visão computacional na automatização da recolha de dados em vários
domínios da biologia.
Estas técnicas têm vindo a ser progressivamente mais utilizadas na recolha de dados biológicos
sobre a pesca, com destaque para a determinação da espécie e a medição do comprimento dos indivíduos.
No entanto, continuam a existir desafios, como o desenvolvimento de algoritmos mais robustos para
lidar com a diversidade de espécies de peixes e melhorar a eficiência das medições, especialmente
quando se identificam várias espécies ao mesmo tempo ou se efectuam várias medições.
Desta forma, este estudo surge como uma contribuição relevante para compreender a eficiência
de modelos de visão computacional na deteção, classificação e medição de indivíduos de quatro espécies
de peixes importantes em termos de desembarques em Portugal Continental, besugo (Pagellus acarne),
faneca (Trisopterus luscus), pescada (Merluccius merluccius) e robalo (Dicentrarchus labrax), através
de imagens obtidas numa lota e armazenadas remotamente na plataforma da Fishmetrics. Nesta
plataforma, criada pela empresa Fishmetrics, é possível realizar medições em individuos de peixe
presentes em imagens, obtendo comprimentos reais, graças à calibração 3D desenvolvida.
Este estudo avalia o desempenho de dois tipos de modelos de visão computacional utilizando
um algoritmo pré-existente (YOLOv8): i) quatro modelos especificos, um para cada espécie; e ii) um
modelo multi-específico, para qualquer uma dessas quatro espécies. Para os modelos específicos de cada
espécie, este estudo avalia o desempenho na deteção de indivíduos, analisando os níveis de confiança
das detecções e o número máximo de indivíduos detectados numa imagem. Essas detecções são
utilizadas para extrair medidas de comprimento total dos indivíduos, que são depois comparadas com
medidas manuais, avaliando a precisão dos modelos na medição. Para o modelo multi-específico, este
estudo avalia o desempenho do modelo na deteção e medição de indivíduos, bem como na identificação
das espécies. A classificação da espécie efectuada pelo modelo é comparada com a classificação
originalmente dada pela lota ao indivíduo.
De acordo com os gráficos obtidos posteriormente ao treino, a evolução de diversas métricas
permitiram validar os modelos, estando aptos para serem testados. De acordo com os gráficos do valor
de F1, os modelos (especificos e multi-especifico) registaram niveis de confiança entre 0.40 e 0.50 para
os quais apresentam o valor máximo de F1, sendo estes os valores para os quais é esperado que os
modelos apresentem o seu melhor desempenho.
Na fase de teste, todos os modelos específicos treinados foram capazes de detetar, com niveis
de confiança entre 0.60 e 0.64, 40 a 50% de indivíduos por caixa, permitindo também a extração de
medições com uma diferença média da medida real de 1 cm. O modelo especifico do besugo obteve, em
geral, o melhor desempenho quando comparado com os modelos específicos das outras espécies,
possivelmente explicado pela maior número de imagens de treino.
O modelo multi-específico também foi capaz de detetar, com niveis de confiança médios para
cada espécie entre 0.58 e 0.69, 40 a 75% de indivíduos por caixa, sendo possivel extrair as medições do
comprimento total do corpo dos individuos com uma diferença média de 1cm da medida real.
Destacaram-se as deteções relativas ao robalo, apresentando a menor diferença média entre o número
de indivíduos detectados por caixa e o número de indivíduos contados visualmente, tendo sido capaz de
detetar em média 75% dos individuos. Esta diferença poderá ter-se devido a existência de um menor
número de individuos por caixa, nas amostras de robalo e também pelas carasteristicas dos individuos
desta espécie, que apresentam dimensões superiores aos individuos das outra espécies. O modelo multiespecífico foi também capaz de classificar as espécies dos indivíduos detetados, classificando
corretamente entre 70 a 99% das detecções de cada espécie. Apesar dos resultados, foi discutida a possivel influência de vários fatores no desempenho dos
modelos treinados. A qualidade das imagens pode ter um grande impacto nos modelos, começando logo
por facilitar o treino e, posteriormente, produzir modelos com melhor desempenho, se estas
apresentarem uma boa qualidade. As condições em que as imagens foram tiradas também podem
influenciar os resultados, tais como a iluminação, o ângulo da câmera, a sua distância ao objeto e ainda
o background das imagens. Para além destes fatores, as configurações para o treino do modelo, como o
tamanho dos lotes de processamento e o tipo de modelo pré-existente selecionado (neste estudo foi o
YOLOv8n), conjugado com as capacidades computacionais do computador podem afetar o posterior
desempenho dos modelos treinados.
Existem muito poucos estudos publicados sobre modelos de visão computacional aplicados à
aquisação de dados sobre peixes, pelo que é importante continuar esta investigação. Este grupo de seres
vivos é muito diversificado em termos de forma e cor, pelo que o estudo com várias espécies permitirá
melhorar o conhecimento sobre a adaptação de parâmetros mais indicada a modelos de visão
computacional para deteção, medição e classificação de peixes.
A adoção de modelos de visão computacional, como os desenvolvidos neste estudo, podem vir
a automatizar o processo de aquisição e análise de dados biológicos usados na avaliação de unidades
populacionais de pescas em Portugal, diminuindo o tempo dispensado e os recursos necessários,
aumentando ainda a quantidade e qualidade dos dados que podem ser analisados num curto espaço de
tempo. The socio-economic importance of fisheries is widely recognised around the world, along the urgent need for sustainable management to avoid overfishing. Countries and international organisations have therefore been developing sustainable fisheries management strategies, based on stock assessment and scientific advice. To achieve this it is necessary to collect and analyse biological data related to the state of stocks, including key variables such as body length of landed individuals. Traditionally, this variable has been collected manually, however to improve efficiency, reduce errors and lower costs, recent studies have focused on automating these processes using computer vision models. This study evaluates the performance of two types of models (species-specific and multi-specific) using a pre-existing algorithm (YOLOv8), in the detection, classification and measurement of individuals from four different species of fish, axillary seabream (Pagellus acarne), pouting (Trisopterus luscus), European hake (Merluccius merluccius) and European seabass (Dicentrarchus labrax). The analysis is based on images obtained from one Portuguese auction centre and stored remotely on the Fishmetrics platform. Both species-specific models and multi specific model detected 40 to 75% of individuals per box, with confidence levels ranging from 0.58 to 0.69, depending on the species. Model extracted length measurements showed an average difference from the real measurement of 1 cm. The multi-specific model was also able to correctly classify the species of the detected individual in 70 to 99% of total detections, depending on the species. The study discusses the possible influence of different parameters on model performance. Given that there is limited research on computer vision models applied to biological data on fishes in the context of fisheries management, further studies are of key importance. Further advancements in this research will allow the practical implementation of these models, enhancing the quantity and quality of collected data. |
Descrição: | Tese de Mestrado, Ecologia Marinha, 2025, Universidade de Lisboa, Faculdade de Ciências |
URI: | http://hdl.handle.net/10400.5/101133 |
Designação: | Mestrado em Ecologia Marinha |
Aparece nas colecções: | FC - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TM_Inês_Correia.pdf | 10,17 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.