Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
http://tede.unifacs.br/tede/handle/tede/298
Tipo do documento: | Dissertação |
Título: | Extração de informações em formato texto, implicitamente anotadas pela semântica in loco, utilizando perfis adaptáveis ao domínio |
Autor: | Barreto Junior, Ederaldo Muniz |
Primeiro orientador: | Santanchè, André |
Primeiro membro da banca: | Claro, Daniela Barreiro |
Segundo membro da banca: | Carneiro, Glauco de Figueiredo |
Resumo: | Diariamente, uma quantidade significativa de conteúdo digital é produzida e uma grande parte dela é composta de informações que, de alguma forma, podem ser melhor estruturadas para facilitar seu inter-relacionamento e tratamento automatizado. Grande parte da informação armazenada nos repositórios digitais (e.g., a Web e as Bibliotecas Digitais) encontra-se na forma de documentos textuais. Considerando o imenso volume de informação disponível nesses repositórios, é muito importante a construção de ferramentas capazes de selecionar automaticamente apenas os dados de interesse de um usuário, facilitando assim o acesso e a manipulação dessas informações. Estudos no contexto de IE Information Extraction ou Extração de Informação procuram automatizar tarefas de busca e extração de informações dentro dos documentos e tratá-las de forma a apresentar algum tipo de conhecimento novo, relevante e útil para o usuário. Estudos relacionados com IE, no contexto abordado nesse trabalho, vêm sendo desenvolvidos desde 1987. Ainda persistem grandes desafios a serem resolvidos nessa área. As ferramentas de IE ainda são caras, seu desempenho e precisão ainda são relativamente baixos e principalmente são de difícil utilização e adaptação para novos contextos. Diante dessa realidade, esta dissertação apresenta uma proposta de anotação e IE baseada na nossa metodologia denominada Semântica In Loco, configurável de acordo com o domínio relativo do documento, através do conceito de perfis associado às ontologias. Tal proposta mostrou desempenho e precisão acima dos atuais padrões em alguns contextos. Ela é de fácil adaptação e voltada ao usuário final; foi validada através de uma ferramenta capaz de extrair e estruturar em uma ontologia (Research Card) dados relativos à fichamento bibliográfico. Tal ontologia explicita a semântica dos registros e é utilizada para a criação de uma base semanticamente inter-relacionada de referências e anotações. |
Palavras-chave: | Extração de informações Anotação semântica Ontologias |
Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | BR |
Instituição: | Universidade Salvador |
Sigla da instituição: | UNIFACS |
Departamento: | Sistemas e Computação |
Programa: | Programa de Pós-Graduação em Sistemas e Computação |
Citação: | BARRETO JUNIOR, Ederaldo Muniz. Extração de informações em formato texto, implicitamente anotadas pela semântica in loco, utilizando perfis adaptáveis ao domínio. 2012. 126 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2012. |
Tipo de acesso: | Acesso Aberto |
URI: | http://teste.tede.unifacs.br:8080/tede/handle/tede/298 |
Data de defesa: | 9-Abr-2012 |
Aparece nas coleções: | Sistemas e Computação |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
Dissertacao EDERALDO MUNIZ BARRETO JUNIOR.pdf | 2,68 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.