Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://tede.unifacs.br/tede/handle/tede/298
Tipo do documento: Dissertação
Título: Extração de informações em formato texto, implicitamente anotadas pela semântica in loco, utilizando perfis adaptáveis ao domínio
Autor: Barreto Junior, Ederaldo Muniz
Primeiro orientador: Santanchè, André
Primeiro membro da banca: Claro, Daniela Barreiro
Segundo membro da banca: Carneiro, Glauco de Figueiredo
Resumo: Diariamente, uma quantidade significativa de conteúdo digital é produzida e uma grande parte dela é composta de informações que, de alguma forma, podem ser melhor estruturadas para facilitar seu inter-relacionamento e tratamento automatizado. Grande parte da informação armazenada nos repositórios digitais (e.g., a Web e as Bibliotecas Digitais) encontra-se na forma de documentos textuais. Considerando o imenso volume de informação disponível nesses repositórios, é muito importante a construção de ferramentas capazes de selecionar automaticamente apenas os dados de interesse de um usuário, facilitando assim o acesso e a manipulação dessas informações. Estudos no contexto de IE Information Extraction ou Extração de Informação procuram automatizar tarefas de busca e extração de informações dentro dos documentos e tratá-las de forma a apresentar algum tipo de conhecimento novo, relevante e útil para o usuário. Estudos relacionados com IE, no contexto abordado nesse trabalho, vêm sendo desenvolvidos desde 1987. Ainda persistem grandes desafios a serem resolvidos nessa área. As ferramentas de IE ainda são caras, seu desempenho e precisão ainda são relativamente baixos e principalmente são de difícil utilização e adaptação para novos contextos. Diante dessa realidade, esta dissertação apresenta uma proposta de anotação e IE baseada na nossa metodologia denominada Semântica In Loco, configurável de acordo com o domínio relativo do documento, através do conceito de perfis associado às ontologias. Tal proposta mostrou desempenho e precisão acima dos atuais padrões em alguns contextos. Ela é de fácil adaptação e voltada ao usuário final; foi validada através de uma ferramenta capaz de extrair e estruturar em uma ontologia (Research Card) dados relativos à fichamento bibliográfico. Tal ontologia explicita a semântica dos registros e é utilizada para a criação de uma base semanticamente inter-relacionada de referências e anotações.
Palavras-chave: Extração de informações
Anotação semântica
Ontologias
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: BR
Instituição: Universidade Salvador
Sigla da instituição: UNIFACS
Departamento: Sistemas e Computação
Programa: Programa de Pós-Graduação em Sistemas e Computação
Citação: BARRETO JUNIOR, Ederaldo Muniz. Extração de informações em formato texto, implicitamente anotadas pela semântica in loco, utilizando perfis adaptáveis ao domínio. 2012. 126 f. Dissertação (Mestrado em Sistemas e Computação) - Universidade Salvador, Salvador, 2012.
Tipo de acesso: Acesso Aberto
URI: http://teste.tede.unifacs.br:8080/tede/handle/tede/298
Data de defesa: 9-Abr-2012
Aparece nas coleções:Sistemas e Computação

Arquivos associados a este item:
Arquivo TamanhoFormato 
Dissertacao EDERALDO MUNIZ BARRETO JUNIOR.pdf2,68 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.