Logo do repositório
 
A carregar...
Miniatura
Publicação

Directivas para identificação e classificação morfológica na coleccção dourada do HAREM

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
06-19.pdf69.44 KBAdobe PDF Ver/Abrir

Orientador(es)

Resumo(s)

Neste relatorio técnico apresentam-se as directivas usadas na compilação dourada do HAREM, a primeira avaliação conjunta de sistemas de reconhecimento de entidades menciondas (REM) em português, organizada pela Linguateca.A coleccão dourada (dois conjuntos, de 129 e 128 textos de vários géneros literários) foi manualmente anotada com a identificação de nomes próprios e a sua classificação morfológica. Para o fazer. foi preciso primeiro chegar a um consenso e depois estudar os vários casos problemáticos que surgiram da análise dos próprios textos. O resultado desse refinamento das direectivas e de resolução (e subsequente documentação) dos casos que foram surgindo, encontra-se assim no presente documento. O relatório está dividido em duas partes: a que relata as decisões feitas quanto à identificação das EM, e a que trata da sua classificação morfológica. Visto que a motivação primordial do HAREM era uma análise semântica leve, implicando o reconhecimento das várias categorias distintas (na tarefa de classificação semântica), a questão da morfologia é descrita em relação a essas categorias de EM

Descrição

Palavras-chave

avaliação processamento computacional do português processamento de linguagem natural, extracção de informação português avaliação conjunta rec

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

Fascículo

Editora

Department of Informatics, University of Lisbon

Licença CC