Repository logo
 
datacite.subject.fosCiências Naturais::Ciências da Computação e da Informaçãopt_PT
dc.contributor.advisorBessani, Alysson Neves
dc.contributor.advisorFerreira, Pedro Miguel Frazão Fernandes
dc.contributor.authorAlves, Fernando Baptista Leal
dc.date.accessioned2025-02-18T15:34:48Z
dc.date.available2025-02-18T15:34:48Z
dc.date.issued2024-07-02
dc.date.submitted2023-10-30
dc.description.abstractCybersecurity is a topic of growing concern as the number and gravity of cyberattacks are continuously increasing. Receiving the latest updates, patches, and news is crucial to maintaining an IT infrastructure’s high-security level. An alternative to purchasing expensive security news feeds is to collect Open Source Intelligence: a wealth of knowledge published daily by users, security companies, researchers, and hackers, among others. In particular, Twitter has become an information hub for obtaining cutting-edge information about many subjects, including cybersecurity. This thesis is focused on the collection and processing of cybersecurity-related tweets. Firstly, we conducted a qualitative and quantitative study about the security data found on Twitter and compared it to databases that publish confirmed vulnerabilities or exploits. Our study shows that Twitter is a relevant cybersecurity source. The remainder of the work is about developing a framework for collecting, processing, and delivering security tweets. Its pipeline comprises text filtering, text feature extraction, a binary classifier, clustering, and Indicator of Compromise generation. We show how to obtain a tweet classifier model following tweet characteristics and machine learning best practices. Our clustering strategy adopts the k-means algorithm to an unknown number of clusters, and to cluster and update based on a stream of tweets instead of the classical batch operation. From the clusters we generate Indicators of Compromise, which are structured data formats used in cybersecurity; this step eases the integration of our tool with existing cybersecurity tools. Finally, we showcase one such integration with the Security Information and Event Management system of a nation-wide electrical utility company.pt_PT
dc.description.abstractA cibersegurança tem vindo a atrair cada vez mais as atenções devido ao crescimento contínuo do número e da gravidade dos ataques efectuados. Para proteger eficazmente um sistema informático é necessário receber continuamente notícias e eventos relacionadas com cibersegurança, incluíndos novas vulnerabilidades e ataques. Uma alternativa viável a subscrições pagas (dado que muitas têm preços elevados) é obter esta informação através de fontes abertas Open Source Intelligence [OSINT]), visto que especialistas em cibersegurança publicam diariamente vastos conteúdos sobre o tópico. O Twitter encontra-se em destaque como plataforma de OSINT por ser um agregador natural de conteúdos, incluíndo cibersegurança. Esta tese foca-se na recolha e processamento de tweets que falam sobre cibersegurança. Primeiro efetuámos um estudo qualitativo e quantitativo sobre as informacções de cibersegurança publicadas no Twitter, e comparamos estes resultados com as informações presentes em bases de dados dedicadas a armazenar vulnerabilidades e ataques; o nosso estudo mostra que o Twitter é uma fonte relevante e completa de informação sobre cibersegurança. O restante trabalho foi dedicado ao desenvolvimento de uma plataforma dedicada à recolha, processamento, e agregação de tweets sobre cibersegurança. A nossa plataforma é composta por fases de processamento de texto, conversão num´erica, classificação binária, agregação, e criação de indicadores de segurança (Indicators of Compromise [IoC]). Primeiro, mostramos como criar um modelo de classificação adequado para tweets usando boas práticas de aprendizagem automática. Depois, criámos uma nova estratégia de aplicação do algorítmo k-means de modo a não ser necessário definir previamente o n´umero de grupos a obter, ao mesmo tempo que a agregação é feita sobre um fluxo contíno de tweets e não sobre um conjunto estático. A partir destes grupos geramos IoCs para que a nossa plataforma possa facilmente alimentar outras ferramentas de ciberseguranc¸a. Por fim, demonstramos a integração da nossa plataforma com o sistema de gestão de eventos de cibersegurança de uma fornecedora eléctrica nacional.pt_PT
dc.description.sponsorshipH2020 DiSIEM (H2020-700692)pt_PT
dc.identifier.tid101567332pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.5/98529
dc.language.isoengpt_PT
dc.subjectOpen Source Intelligencept_PT
dc.subjectCybersecuritypt_PT
dc.subjectSecurity operations centrept_PT
dc.subjectTwitterpt_PT
dc.subjectcibersegurançapt_PT
dc.subjectCentro de operações de segurançapt_PT
dc.titleOSINTpt_PT
dc.title.alternativeBased Data-Driven Cybersecurity Discoverypt_PT
dc.typedoctoral thesis
dspace.entity.typePublication
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/Concurso para projetos conjuntos de investigação científica e desenvolvimento tecnológico entre equipas de investigação Portuguesas e Luxemburguesas (FCT-FNR) 2018/FCT-FNR%2F0002%2F2018/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Base/UIDB%2F00408%2F2020/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Programático/UIDP%2F00408%2F2020/PT
oaire.fundingStreamConcurso para projetos conjuntos de investigação científica e desenvolvimento tecnológico entre equipas de investigação Portuguesas e Luxemburguesas (FCT-FNR) 2018
oaire.fundingStreamConcurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017/2018) - Financiamento Base
oaire.fundingStreamConcurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017/2018) - Financiamento Programático
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspt_PT
rcaap.typedoctoralThesispt_PT
relation.isProjectOfPublication6d22bf7c-fcf6-40ba-adfe-7bff4ef4e0c5
relation.isProjectOfPublicationb772636b-907c-47d6-82ed-f4d9f69107f3
relation.isProjectOfPublicationb54ed187-079f-4130-ae95-a218fb9feb3f
relation.isProjectOfPublication.latestForDiscovery6d22bf7c-fcf6-40ba-adfe-7bff4ef4e0c5
thesis.degree.nameTese de doutoramento, Informática, Universidade de Lisboa, Faculdade de Ciências, 2024pt_PT

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
scnd990026354742081_td_Alves_ Fernando.pdf
Size:
2.01 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.2 KB
Format:
Item-specific license agreed upon to submission
Description: