Inter-Document Similarity in Web Searches

Silva, Mário Gaspar daMartins, Bruno2009-02-102014-11-142009-02-102014-11-142004-10http://hdl.handle.net/10451/14045http://repositorio.ul.pt/handle/10455/3077Os serviços de pesquisa existentes actualmente na Web não se adequam a necessidades de informação vagas ou difíceis de expressar através de palavras chave. Esta dissertação investiga a possibilidade de usar técnicas de recuperação de informação baseadas na similaridade inter-documentos, medida através dos conteúdos textuais ou das ligações entre os mesmos. Ao contrário de aproximações de recuperação de informação tradicionais, as quais fazem o mapeamento entre documentos e palavras chave produzindo listas ordenadas de resultados, as técnicas baseadas na similaridade inter-documentos oferecem um melhor suporte para a visualização dos resultados, além de métodos alternativos de expressar necessidades de informação. Estendeu-se um motor de pesquisa, vocacionado para a Web portuguesa, com dois algoritmos que usam a similaridade inter-documentos: agrupamento automático de resultados e pesquisa de páginas relacionadas. O sistema foi avaliado com base num questionário a utilizadores, o qual mostrou que ambos os algoritmos são bem aceitesporRecuperação de Informação na WebAgrupamento Automático de DocumentosBuscas por SimilaridadeWeb-MiningInter-Document Similarity in Web Searchesmaster thesis