Langlois, ThibaultDuarte, Eduardo José Ribeiro2013-10-092013-10-092012http://hdl.handle.net/10451/9329Tese de mestrado em Engenharia Informática, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2012Nos últimos anos, avanços tecnológicos a nível de compressão de áudio e redes de computadores tem solicitado um aumento gigante na disponibilidade e partilha de música digital. O objectivo fundamental deste projecto é desenvolver um protótipo, pelo qual a semelhança entre várias peças de áudio possa ser medida, exclusivamente, no conteúdo do áudio em si, isto é, a partir das suas propriedades e características mais básicas. Este protótipo irá analisar as características inerentes de cada peça de áudio e usar os dados provenientes dessa análise para comparar músicas, independentemente de qualquer metadata que possa existir. A base para essa comparação consiste numa impressão digital do áudio em si, que tem como objectivo gerar uma assinatura que identifica um pedaço de áudio. Esta assinatura, transforma o sinal de áudio numa sequência de vectores sendo esta sequência de vectores, um conjunto de características espectrais, representadas como: Zero-Crossings, Spectral Centroid, Rolloff, Flux e Mel-Frequency Cepstral Coeficientes (MFCC) do sinal de áudio. Mais especificamente, o sinal de áudio é convertido numa sequência de símbolos, que correspondem às características de uma peça de áudio. Esta “impressão digital” do áudio, não só identifica uma peça musical, mas também fornece informações sobre suas características musicais. Usando este protótipo, será possível uma selecção de filmes com base na semelhança entre as peças de áudio, ou seja, será possível exibir ao usuário uma série de filmes, que possuam sequências de áudio semelhante a um tipo de áudio escolhido pelo mesmo permitindo, por isso, pesquisar numa base de documentos de vídeo através, apenas, de peças de áudio. O trabalho insere-se numa das tarefas do projecto VIRUS (Video Information Retrieval Using Subtitles), financiado pela FCT, para a qual as técnicas foram, grande parte, já desenvolvidas.Over de last ten years, technological advances at the level of compression of audio and computer networks has prompted a huge increase in the availability and sharing of digital music. The main purpose of this project is to develop a prototype, for which the similarity between various pieces of audio can be measured, exclusively on the audio content itself, that is, from their most basic properties and characteristics. This prototype will analyze the inherent characteristics of each piece of audio and use the data from this analysis to compare music regardless, of any metadata that may exist. The basis for this comparison is a fingerprint of the audio itself, which aims to generate a signature that identifies the piece of audio. This signature, transform the audio signal is a sequence of vectors witch is, a set of spectral features, represented as: Zero-Crossings, Spectral Centroid, Rolloff, Flux and Mel-Frequency Cepstral Coefficients (MFCC) audio signal. More specifically, the audio signal is converted into a sequence of symbols that correspond to the characteristics of a piece of audio. This "fingerprint" of the audio, not only identifies a piece of music, but also provides information on its musical characteristics. Using this prototype, it’s possible to select a movie based on the similarity between pieces of audio specified by the user, or the user can a series of films that have audio similar to a type of audio selected by de user. Through this prototype is also possible to search in a database of video, by specifying only pieces of audio. The work is part of a project's tasks VIRUS (Video Information Retrieval Using Subtitles), funded by FCT, for which the techniques were largely already developed.porFilmeÁudioCaracterísticas espectraisSimilaridadePesquisaTeses de mestrado - 2012Onde é que eu já ouvi isto?master thesis