@MASTERSTHESIS{ 2012:1211556547, title = {Extração de informações em formato texto, implicitamente anotadas pela semântica in loco, utilizando perfis adaptáveis ao domínio}, year = {2012}, url = "http://teste.tede.unifacs.br:8080/tede/handle/tede/298", abstract = "Diariamente, uma quantidade significativa de conteúdo digital é produzida e uma grande parte dela é composta de informações que, de alguma forma, podem ser melhor estruturadas para facilitar seu inter-relacionamento e tratamento automatizado. Grande parte da informação armazenada nos repositórios digitais (e.g., a Web e as Bibliotecas Digitais) encontra-se na forma de documentos textuais. Considerando o imenso volume de informação disponível nesses repositórios, é muito importante a construção de ferramentas capazes de selecionar automaticamente apenas os dados de interesse de um usuário, facilitando assim o acesso e a manipulação dessas informações. Estudos no contexto de IE Information Extraction ou Extração de Informação procuram automatizar tarefas de busca e extração de informações dentro dos documentos e tratá-las de forma a apresentar algum tipo de conhecimento novo, relevante e útil para o usuário. Estudos relacionados com IE, no contexto abordado nesse trabalho, vêm sendo desenvolvidos desde 1987. Ainda persistem grandes desafios a serem resolvidos nessa área. As ferramentas de IE ainda são caras, seu desempenho e precisão ainda são relativamente baixos e principalmente são de difícil utilização e adaptação para novos contextos. Diante dessa realidade, esta dissertação apresenta uma proposta de anotação e IE baseada na nossa metodologia denominada Semântica In Loco, configurável de acordo com o domínio relativo do documento, através do conceito de perfis associado às ontologias. Tal proposta mostrou desempenho e precisão acima dos atuais padrões em alguns contextos. Ela é de fácil adaptação e voltada ao usuário final; foi validada através de uma ferramenta capaz de extrair e estruturar em uma ontologia (Research Card) dados relativos à fichamento bibliográfico. Tal ontologia explicita a semântica dos registros e é utilizada para a criação de uma base semanticamente inter-relacionada de referências e anotações.", publisher = {Universidade Salvador}, scholl = {Programa de Pós-Graduação em Sistemas e Computação}, note = {Sistemas e Computação} }