Autores
Orientador(es)
Resumo(s)
Neste relatorio técnico apresentam-se as directivas usadas na compilação dourada do HAREM, a primeira avaliação conjunta de sistemas de reconhecimento de entidades menciondas (REM) em português, organizada pela Linguateca.A coleccão dourada (dois conjuntos, de 129 e 128 textos de vários géneros literários) foi manualmente anotada com a identificação de nomes próprios e a sua classificação morfológica. Para o fazer. foi preciso primeiro chegar a um consenso e depois estudar os vários casos problemáticos que surgiram da análise dos próprios textos. O resultado desse refinamento das direectivas e de resolução (e subsequente documentação) dos casos que foram surgindo, encontra-se assim no presente documento. O relatório está dividido em duas partes: a que relata as decisões feitas quanto à identificação das EM, e a que trata da sua classificação morfológica. Visto que a motivação primordial do HAREM era uma análise semântica leve, implicando o reconhecimento das várias categorias distintas (na tarefa de classificação semântica), a questão da morfologia é descrita em relação a essas categorias de EM
Descrição
Palavras-chave
avaliação processamento computacional do português processamento de linguagem natural,
extracção de informação português avaliação conjunta rec
