Deep Neural Networks applications in experimental physics data analyses

Pires, João Pedro da Palma Martins

http://hdl.handle.net/10451/59184

Utilize este identificador para referenciar este registo.

Nome:	Descrição:	Tamanho:	Formato:
TM_João_Pires.pdf		14.24 MB	Adobe PDF	Ver/Abrir

Contacte-nos

Autores

Pires, João Pedro da Palma Martins

Orientador(es)

Santos, Helena de Fátima Nunes Casimiro dos

Resumo(s)

As redes neuronais (NNs) são amplamente utilizadas nas mais diversas áreas para fazer previsões e estudos, tendo por base um conjunto de dados que à partida parece aleatório. Estas previsões são úteis em diversas áreas, tal como a economia e finanças, em que se tenta, por exemplo, construir modelos para identificação de fraudes, e nas grandes indústrias, como a Amazon e a Google, em que se tentam fazer estudos relativamente aos itens preferenciais para os consumidores na esperança de se prever qual o produto mais desejado. Assim na área da investigação, tenta-se também aplicar NNs para retirar dados de interesse de uma dada amostra. Atualmente, no Large Hadron Colider (LHC) no CERN existem diversas investigações científicas na área da física de partículas que fazem uso de redes neuronais, mas uma das principais investigações está relacionada com o estudo do chamado Plasma de Quarks e Gluões (QGP) nas colisões de iões pesados, que têm lugar na Experiência ATLAS. Este plasma é formado nas estrelas de neutrões e em colisões altamente energéticas entre nucleões (protões e neutrões), no entanto, enquanto que no primeiro o QGP tem uma densidade incrivelmente elevada e uma baixa temperatura, no segundo não só tem uma grande densidade (estima-se pelo menos um fator de 10 superior à densidade nuclear) como também apresenta uma elevada temperatura, propriedades semelhantes ao que se pensa ter havido durante os primeiros momentos após o big bang, e como tal uma janela para o estudo das interações que poderão ter existido entre partões (quarks e gluões). Relativamente a estas partículas, diversas questões surgem associadas à sua interação, entre as quais, por exemplo, como é que os chuveiros de partões perdem a sua energia e torna-se crucial puder dar resposta a muitas destas questões. No entanto, devido ao muito reduzido tempo de vida e volume do QGP, torna-se impossível de medir diretamente as propriedades relativas a este estado da matéria e interação entre os partões, assim torna-se crucial a busca por um método de estudo indireto. Desta forma surge o método Hard Scattering Probing que faz uso de sprays de colimados partículas, ao qual se dá o nome de jatos de partículas, gerados através da fragmentação dos diversos quarks que se formam na consequência da interação com o QGP. Através da medição das propriedades associadas a estes jatos, é possível reconstruir as interações que ocorream durante o QGP. No entanto, dependendo do tipo de jato que é normalmente associado ao quark pai que o originou, devido ao diferente comportamento dos quarks, mostra-se que jatos de partículas formados pela fragmentação do quark bottom interagem menos com as partículas provenientes da chuva de partículas geradas e são os primeiros a ser gerados, imediatamente após a colisão, o que faz com que haja uma maior probabilidade das propriedades medidas no detetor estarem relacionadas com as do plasma. Assim, não só é necessário obter as propriedades dos jatos, como também é necessário identificar jatos de parículas resultantes da fragmentação do quark bottom (b-jets) dos restantes gerados da fragmentação de outros quarks. Ao longo dos anos, na Experiência ATLAS, foram sendo desenvolvidos diversos algoritmos com o objetivo de detetar jatos resultantes da fragmentação do quark bottom, os chamados algoritmos de btagging. Estes algoritmos baseavam-se nos mais diversos parâmetros medidos diretamente do detetor, sejam estes os parâmetros de impacto, o tempo médio de vida da partícula, ou a distância média de decaimento associado para construir algum tipo de variável discriminante capaz de diferenciar os jatos de partículas formados. Assim, de acordo com os parâmetros de estudo, foram surgindo diversos algoritmos como o Impact Parameter 2D (IP2D) e o Impact Parameter 3D (IP3D), que fazem uso dos parâmetros de impacto, e Secondary Vertex (SV1) e JetFitter que fazem uso das distâncias de decaimento. Pelo facto destas ferramentas utilizarem diferentes parâmetros apresentavam também diferentes eficiências e alcances que levavam a uma penalização na identificação de b-jatos numa perspetiva individualista. Desta forma começaram a surgir os primeiros algoritmos baseados em redes neuronais, os algoritmos de alto-nível, que inicialmente apenas correlacionavam as variáveis discriminantes construídas pelos algoritmos de baixo-nível, de uma forma bastante simplista, mas à medida que se foi aprofundando o desenvolvimento das redes neuronais, começaram a surgir diferentes NNs que, fazendo uso de diferentes métodos, permitiram um cada vez melhor desempenho no que toca ao b-tagging. Para colisões entre protões os algoritmos de alto-nível foram sendo cada vez mais aplicados e estudados, apresentando resultados bastante prometedores no que toca ao objetivo final que é a discriminação do jato originado pelo quark b, no entanto fica a faltar dar o grande passo que correponde a estudar o comportamento destes algoritmos quando submetidos a um ambiente bastante mais carregado, em partículas, como é o caso das colisões entre iões pesados. Neste tipo de colisões existe um maior número de nucleões envolvidos o que leva à criação de um QGP com um maior tempo de vida e volume. Desta forma os partões no QGP vão ter um maior número de interações que poderá ser reconstruído através dos jatos de partículas e possibilitará melhores conclusões. No entanto, em contrapartida, também haverá uma maior corrupção dos dados associada a particulas geradas antes da colisão (underlying event). Desta forma, para se puder analisar o comportamento dos algoritmos em iões pesados, este trabalho compromete-se a abordar dois tipos de algoritmos baseados em redes neuronais que fazem uso de diferentes propriedades e características associadas aos jatos de partículas, sejam estes algoritmos o Deep Learning 1 (DL1) e o Deep Impact Parameter Sets (DIPS). Tanto o DL1 como o DIPS são algoritmos que fazem uso de redes neuronais e constroem três probabilidades referentes ao jato resultar da fragmentação de um jato bottom, charm ou de sabores leves (b-, c- e u-jatos), mas o DL1 é considerado um algoritmo de alto-nível, fazendo uso de variáveis construídas por algoritmos de baixo-nível, onde o DIPS está incluído. Enquanto o DL1 faz uso das propriedades dos jatos, isto é, das propriedades associadas às partículas envolventes de um feixe colimado de partículas, o DIPS consegue trabalhar as características associadas a cada partícula individualmente. Deste modo, são esperadas uma complementaridade e uma dependência entre os dois. A grande mais valia de se usar o DIPS é que este permite uma comparação com o DL1 e permite retirar conclusões relativamente ao impacto do valor mínimo do momento transverso (pT ) nas partículas escolhido Ao longo desta dissertação, para além da observação dos resultados associados a colisões Pb+Pb e da comparação com os resultados em pp, também vai ser feita uma breve explicação do pré-processamento dos dados, onde as partículas resultantes de colisões pouco energéticas vão ser eliminadas e vai ser aplicado o chamado downsampling para retirar a dependência das propriedades cinemáticas (pT e η) do treino da rede neuronal. Pois no caso de não ser feito o downsampling os resultados seriam dependentes do número de jatos gerados, que muitas se torna impossível devido à probabilidade de acontecimento associada ao evento ser reduzida. Uma vez esclarecido o pré-processamento aplicado, é feita a análise detalhada referente à correlação entre as propriedades utilizadas durante o treino de ambos os algoritmos. Estas correlações vão ter um impacto direto no treino das redes neuronais, pois estas vão tirar vantagem das dependências de cada uma das variáveis em questão beneficiando ou prejudicando o desempenho dos algoritmos no que toca à identificação dos b-jets. Ainda como forma de identificar o impacto de cada uma das variáveis e/ou propriedades dos jatos de partículas no treino, utilizando a definição de discriminante de b-jatos utilizado amplamente em estudos associados a colisões pp, são construídos três novos discriminantes para identificarem o grau de fiabilidade na identificação de b-, c- e u-jatos. Ao fazer-se uso destes novos discriminantes é possível ver os gradientes dos discriminantes em ordem às propriedades e observar quais as propriedades que maior impactam positivamente e negativamente o desempenho da rede neuronal no que toca à identificação de b-jatos. Relativamente a esta questão é esperada também uma correlação entre os diversos gradientes e o desempenho dos algoritmos, pois como se pode imaginar uma correta identificação dos c-jatos e dos u-jatos vai provocar uma melhor identificação dos b-jatos. Adicionalmente, da diferença associada à amostra de pp e de Pb+Pb é feito um outro estudo, tanto para DL1 como para DIPS, associado à centralidade das colisões, que devido ao número de nucleões envolvidos é absurdo ser tratado em colisões pp, mas que em Pb+Pb tem todo o sentido ser abordado.

One of the head investigations at the LHC and ATLAS Experiment is related to the study of the Quark Gluon Plasma (QGP), formed in ultra-relativistic heavy-ion collisions. Due to its short lifetime and spatial limitation, the QGP properties are impossible to be measured directly, and therefore, indirect methods must be used. One method is related to the measured quantities of the collimated sprays of particles, socalled jets, generated immediately after the collision takes place. The particle shower develops in the QGP, so understanding the jet energy loss processes and the modification of the fragmentation functions is crucial to infer the properties of this state of matter. In particular, jets resulting from the bottom (b) quark fragmentation are expected to interact with the QGP differently from the other jets providing additional information about the nature of the QGP so identifying them is a must. Distinguishing bottom-jets from charm- and light-jets produced in proton-proton collisions is difficult, but the huge environment of Pb+Pb collisions makes the task particularly challenging. In the ATLAS Experiment the Neural Networks, such as the DL1 - Deep Learning 1, are the most promising tools to provide an efficient jet flavour discrimination and b-tagging.

Descrição

Tese de Mestrado, Engenharia Física, 2023, Universidade de Lisboa, Faculdade de Ciências

Palavras-chave

Experiência ATLAS b-tagging DL1 - Deep Learning 1 DIPS - Deep Impact Parameter Sets Pb+Pb collisions Teses de mestrado - 2023

URI

http://hdl.handle.net/10451/59184

Coleções

FC - Dissertações de Mestrado

Ver registo completo