Use este identificador para citar ou linkar para este item:
http://repositorio.unesc.net/handle/1/12435Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.contributor.advisor | Caldas, Paracelso de Oliveira | - |
| dc.contributor.author | Mauricio, Felipe Cogorni | - |
| dc.coverage.spatial | Universidade do Extremo Sul Catarinense | pt_BR |
| dc.date.accessioned | 2026-05-11T23:03:01Z | - |
| dc.date.available | 2026-05-11T23:03:01Z | - |
| dc.date.created | 2011-07 | - |
| dc.identifier.uri | http://repositorio.unesc.net/handle/1/12435 | - |
| dc.description | Trabalho de Conclusão de Curso apresentado para obtenção do Grau de Bacharel em Ciência da Computação da Universidade do Extremo Sul Catarinense. | pt_BR |
| dc.description.abstract | A internet hoje é o local que mais se acessa para a realização de pesquisas, porém devido a falta de padronização na construção de sites, especificamente nas páginas HTML, existe uma perda bastante significativa de dados que poderiam ser melhores aproveitados, são os casos dos dados não estruturados em páginas HTML. Para poder utilizar esses dados de uma forma relevante existem técnicas que auxiliam na sua extração. Dentre as técnicas disponíveis, estão as de Processamento de Linguagem Natural, probabilidades e árvores de decisão. Com isso esta pesquisa fundamentou-se na implementação de um protótipo que utiliza de uma ferramenta chamada TreeTagger que implementa essas técnicas, para ajudar na tarefa de extração dos dados de maneira contextualizada e para armazená-los em um banco de dados, facilitando assim a sua manipulação e obtenção de resultados mais relevantes. Para a contextualização é usada a frase de busca feita por um usuário em uma ferramenta de busca na web, no intuito de comparação da frase com o conteúdo na página HTML. Durante a pesquisa, foram realizados alguns testes no protótipo implementado, a fim de verificar os resultados obtidos pelo protótipo e comprovar o êxito nos objetivos do trabalho. | pt_BR |
| dc.language.iso | pt_BR | pt_BR |
| dc.subject | Pesquisas na internet | pt_BR |
| dc.subject | Páginas HTML | pt_BR |
| dc.subject | Banco de dados | pt_BR |
| dc.title | Análise de técnicas de extração de dados não estruturados em páginas HTML para utilização no armazenamento e manipulação em banco de dados objeto relacional | pt_BR |
| dc.type | Trabalho de Conclusão de Curso - TCC | pt_BR |
| Aparece nas coleções: | Trabalho de Conclusão de Curso (COM) | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Felipe Cogorni Mauricio.pdf | 3,1 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.