Publication
OSINT
| datacite.subject.fos | Ciências Naturais::Ciências da Computação e da Informação | pt_PT |
| dc.contributor.advisor | Bessani, Alysson Neves | |
| dc.contributor.advisor | Ferreira, Pedro Miguel Frazão Fernandes | |
| dc.contributor.author | Alves, Fernando Baptista Leal | |
| dc.date.accessioned | 2025-02-18T15:34:48Z | |
| dc.date.available | 2025-02-18T15:34:48Z | |
| dc.date.issued | 2024-07-02 | |
| dc.date.submitted | 2023-10-30 | |
| dc.description.abstract | Cybersecurity is a topic of growing concern as the number and gravity of cyberattacks are continuously increasing. Receiving the latest updates, patches, and news is crucial to maintaining an IT infrastructure’s high-security level. An alternative to purchasing expensive security news feeds is to collect Open Source Intelligence: a wealth of knowledge published daily by users, security companies, researchers, and hackers, among others. In particular, Twitter has become an information hub for obtaining cutting-edge information about many subjects, including cybersecurity. This thesis is focused on the collection and processing of cybersecurity-related tweets. Firstly, we conducted a qualitative and quantitative study about the security data found on Twitter and compared it to databases that publish confirmed vulnerabilities or exploits. Our study shows that Twitter is a relevant cybersecurity source. The remainder of the work is about developing a framework for collecting, processing, and delivering security tweets. Its pipeline comprises text filtering, text feature extraction, a binary classifier, clustering, and Indicator of Compromise generation. We show how to obtain a tweet classifier model following tweet characteristics and machine learning best practices. Our clustering strategy adopts the k-means algorithm to an unknown number of clusters, and to cluster and update based on a stream of tweets instead of the classical batch operation. From the clusters we generate Indicators of Compromise, which are structured data formats used in cybersecurity; this step eases the integration of our tool with existing cybersecurity tools. Finally, we showcase one such integration with the Security Information and Event Management system of a nation-wide electrical utility company. | pt_PT |
| dc.description.abstract | A cibersegurança tem vindo a atrair cada vez mais as atenções devido ao crescimento contínuo do número e da gravidade dos ataques efectuados. Para proteger eficazmente um sistema informático é necessário receber continuamente notícias e eventos relacionadas com cibersegurança, incluíndos novas vulnerabilidades e ataques. Uma alternativa viável a subscrições pagas (dado que muitas têm preços elevados) é obter esta informação através de fontes abertas Open Source Intelligence [OSINT]), visto que especialistas em cibersegurança publicam diariamente vastos conteúdos sobre o tópico. O Twitter encontra-se em destaque como plataforma de OSINT por ser um agregador natural de conteúdos, incluíndo cibersegurança. Esta tese foca-se na recolha e processamento de tweets que falam sobre cibersegurança. Primeiro efetuámos um estudo qualitativo e quantitativo sobre as informacções de cibersegurança publicadas no Twitter, e comparamos estes resultados com as informações presentes em bases de dados dedicadas a armazenar vulnerabilidades e ataques; o nosso estudo mostra que o Twitter é uma fonte relevante e completa de informação sobre cibersegurança. O restante trabalho foi dedicado ao desenvolvimento de uma plataforma dedicada à recolha, processamento, e agregação de tweets sobre cibersegurança. A nossa plataforma é composta por fases de processamento de texto, conversão num´erica, classificação binária, agregação, e criação de indicadores de segurança (Indicators of Compromise [IoC]). Primeiro, mostramos como criar um modelo de classificação adequado para tweets usando boas práticas de aprendizagem automática. Depois, criámos uma nova estratégia de aplicação do algorítmo k-means de modo a não ser necessário definir previamente o n´umero de grupos a obter, ao mesmo tempo que a agregação é feita sobre um fluxo contíno de tweets e não sobre um conjunto estático. A partir destes grupos geramos IoCs para que a nossa plataforma possa facilmente alimentar outras ferramentas de ciberseguranc¸a. Por fim, demonstramos a integração da nossa plataforma com o sistema de gestão de eventos de cibersegurança de uma fornecedora eléctrica nacional. | pt_PT |
| dc.description.sponsorship | H2020 DiSIEM (H2020-700692) | pt_PT |
| dc.identifier.tid | 101567332 | pt_PT |
| dc.identifier.uri | http://hdl.handle.net/10400.5/98529 | |
| dc.language.iso | eng | pt_PT |
| dc.subject | Open Source Intelligence | pt_PT |
| dc.subject | Cybersecurity | pt_PT |
| dc.subject | Security operations centre | pt_PT |
| dc.subject | pt_PT | |
| dc.subject | cibersegurança | pt_PT |
| dc.subject | Centro de operações de segurança | pt_PT |
| dc.title | OSINT | pt_PT |
| dc.title.alternative | Based Data-Driven Cybersecurity Discovery | pt_PT |
| dc.type | doctoral thesis | |
| dspace.entity.type | Publication | |
| oaire.awardURI | info:eu-repo/grantAgreement/FCT/Concurso para projetos conjuntos de investigação científica e desenvolvimento tecnológico entre equipas de investigação Portuguesas e Luxemburguesas (FCT-FNR) 2018/FCT-FNR%2F0002%2F2018/PT | |
| oaire.awardURI | info:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Base/UIDB%2F00408%2F2020/PT | |
| oaire.awardURI | info:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Programático/UIDP%2F00408%2F2020/PT | |
| oaire.fundingStream | Concurso para projetos conjuntos de investigação científica e desenvolvimento tecnológico entre equipas de investigação Portuguesas e Luxemburguesas (FCT-FNR) 2018 | |
| oaire.fundingStream | Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017/2018) - Financiamento Base | |
| oaire.fundingStream | Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017/2018) - Financiamento Programático | |
| project.funder.identifier | http://doi.org/10.13039/501100001871 | |
| project.funder.identifier | http://doi.org/10.13039/501100001871 | |
| project.funder.identifier | http://doi.org/10.13039/501100001871 | |
| project.funder.name | Fundação para a Ciência e a Tecnologia | |
| project.funder.name | Fundação para a Ciência e a Tecnologia | |
| project.funder.name | Fundação para a Ciência e a Tecnologia | |
| rcaap.rights | openAccess | pt_PT |
| rcaap.type | doctoralThesis | pt_PT |
| relation.isProjectOfPublication | 6d22bf7c-fcf6-40ba-adfe-7bff4ef4e0c5 | |
| relation.isProjectOfPublication | b772636b-907c-47d6-82ed-f4d9f69107f3 | |
| relation.isProjectOfPublication | b54ed187-079f-4130-ae95-a218fb9feb3f | |
| relation.isProjectOfPublication.latestForDiscovery | 6d22bf7c-fcf6-40ba-adfe-7bff4ef4e0c5 | |
| thesis.degree.name | Tese de doutoramento, Informática, Universidade de Lisboa, Faculdade de Ciências, 2024 | pt_PT |
