Gerenciador de Anotações em Documentos

Da AMADIS

Revisão das 01h03min de 1 de Setembro de 2006 por James (discussão | contribs)
(dif) ← Revisão anterior | Revisão actual (dif) | Revisão seguinte → (dif)

Índice

Gerência de Anotações em Documentos

Este artigo descreve a ferramenta web para gerência de anotações em documentos, que está agregada aos recursos tecnológicos disponíveis para ambientes virtuais de aprendizagem.

A natureza digital de documentos HTML abre novas possibilidades para a construção de ferramentas de apoio à organização e recuperação da informação, que podem modificar e melhorar significativamente a velocidade e a qualidade com que podemos realizar operações cognitivas. As velhas pastas, os fichários, as indexações manuais, cedem espaço para a construção de verdadeiras redes de informação. A construção manual dessas ferramentas usando software de autoria convencional é maçante e redutora, o que tem incentivado a invenção de novas ferramentas, tais como: NVivo, Sabia e CmapTools.

Este trabalho propõe uma ferramenta para organizar as informações às quais os usuários têm acesso durante o processo de navegação pelos documentos do ambiente. A ferramenta consiste em um anotador web, que permite ao usuário selecionar e registrar trechos de texto dos documentos que ele julgar interessantes ou relevantes para serem recuperados posteriormente. A concepção e desenvolvimento desta ferramenta se realizam no contexto do Ambiente para Aprendizagem a Distância baseado na Pedagogia de Projetos de Aprendizagem (AMADIS), um software livre desenvolvido com o apoio financeiro da FINEP.


Anotações em Documentos em Ambientes Virtuais de Aprendizagem

Em ambientes virtuais de aprendizagem, a maioria das informações está sob a forma de texto, contida em documentos, fóruns, sessões de chats, mensagens de e-mails etc. e não apresenta qualquer tipo de estruturação especial com relação ao conteúdo do texto. Assim, tem-se uma coleção de informações possivelmente úteis, mas carentes de maior facilidade de acesso e recuperação.

Para que esses ambientes obtenham sucesso, é preciso que eles forneçam mais do que apenas ferramentas de comunicação, como e-mail, fóruns de discussão e programas de chat. É necessário prover aos aprendizes recursos que possibilitem a organização e a manipulação das mensagens recebidas, de modo que eles possam encontrar conteúdos específicos e redigir mensagens de forma a expressar melhor suas idéias [Guizzardi 2001].

Segundo [Goulart 2001], no processo de construção de conhecimento dos aprendizes, não basta ler documentos e textos selecionados. Para que se possa extrair conhecimento é necessário que as leituras sejam acompanhadas de registros e de percepções referentes ao que se procura. Para [Terra Jr 1999], armazenar textos e recuperá-los, de acordo com os seus conteúdos, é uma função importante em ambientes que precisam lidar com grande quantidade de informações, como é o caso dos ambientes educacionais.

Novas abordagens educacionais, como é o caso do uso de webfólios na avaliação cooperativa. A incorporação dos portfólios aos ambientes virtuais de aprendizagem, contendo registros das trajetórias, processos e produtos das aprendizagens abre novas perspectivas para avaliação da qualidade do processo de aprendizagem. Se por um lado a telemática viabiliza essas novas possibilidades de avaliação, ao facilitar a publicação dos vários elementos produzidos e ao facilitar a interação entre os agentes, por outro, ela precisa oferecer ferramentas que auxiliem na tarefa de organização da informação. É importante considerar que o acompanhamento dos diversos percursos e produtos gerados com a utilização de diferentes ferramentas, constitui-se em um dificultador para os diversos agentes envolvidos nos processos de avaliação.

As novas práticas educacionais requerem o aporte de novas metodologias de investigação sobre os efeitos do uso dos diferentes recursos tecnológicos nas aprendizagens. Essas metodologias, baseadas em abordagens de pesquisa qualitativa, visam estudar processos cognitivos e sócio-afetivos que são ativados em situações de interação grupal. Para tal, necessitam de aportes tecnológicos que permitam a organização de diferentes categorizações dos documentos e materiais produzidos pelos sujeitos, ao mesmo tempo em que permitem a recuperação do contexto original em que o dado foi gerado, já que mantém a sua vinculação com o documento original.

Diante desse quadro, é preciso buscar alternativas para contornar o problema organizacional das informações textuais em ambientes virtuais de aprendizagem. A alternativa proposta neste trabalho é uma ferramenta de gerência de anotação para lidar com a carga de informações textuais presente nesses ambientes.

Proposta de um Anotador para WEB

A proposta que fazemos neste trabalho é de uma ferramenta de anotação para a Web. Propomos utilizar o anotador no contexto da web por vários motivos. Primeiro, porque a ferramenta deve ser acoplada a ambientes virtuais de aprendizagem que, em geral, são baseados na web. Segundo, pela facilidade de uso e acesso por meio de navegadores disponíveis nas máquinas dos usuários, dispensando a instalação e aprendizado de novos programas. Por fim, cabe ressaltar o potencial colaborativo que a web proporciona ao trabalho em grupo, especialmente no que se refere à aprendizagem.

Quanto à ferramenta de anotação, a web exponencializa sua funcionalidade em anotação colaborativa. A ferramenta proposta deve dar suporte ao trabalho de professores e alunos. Por um lado facilitará aos alunos a criação de redes, individuais e coletivas, de significados sobre seus documentos, por outro facilitará o acesso do professor a essas redes e lhe dará meios para o registro de feedbacks.

O elemento central da abordagem é autoria de uma árvore de categorização, que será construída durante a navegação em documentos. Cada novo trecho relevante de um documento poderá ser inserido na rede, associado a um nó existente ou a um novo nó, que será criado no exato momento em que se fizer necessário. Um esboço dessa árvore é ilustrado na Figura 1. A essas categorias poderemos associar expressões lógicas que facilitem a identificação de trechos relevantes em novos documentos. A ferramenta disporá ainda de uma indexação sintática automática e facilidades de busca.

Figura 1. Esboço da Árvore de Categorização

A indexação automática possuirá recursos interativos que permitirão o refinamento dos termos relevantes e a criação de uma rede de sinônimos. As próximas duas subseções descrevem, respectivamente, os casos de uso desejáveis em uma ferramenta de anotações de textos em documentos e uma arquitetura geral proposta para uma ferramenta de web desse tipo.

Casos de Uso de um Anotador Web

As funcionalidades desejáveis em uma ferramenta de anotações web num ambiente virtual de aprendizagem e os papéis desempenhados por seus utilizadores são mostrados na diagrama de casos de uso na Figura 2. Nela são mostrados três atores no diagrama: usuário, aluno e professor. O usuário é o caso mais genérico e mais limitado, em termos de funcionalidades, de um utilizador da ferramenta. Aluno e professor são especializações do usuário genérico. Ao usuário é permitido fazer anotações nas páginas web do ambiente quando ele navega por elas por meio de um browser web. O que será anotado ou não pelo usuário dependerá exclusivamente de seu julgamento sobre a relevância ou interesse pelo texto do documento sob observação. Caso se interesse por algum trecho do texto, o usuário pode selecioná-lo e invocar a ferramenta de gerência de anotação, a partir da própria página, para a edição e registro de suas anotações.

Para cada anotação feita, será possível classificá-la como individual ou coletiva. A anotação individual é aquela visível apenas pelo seu usuário criador e pelo professor responsável por ele. Por outro lado, a anotação coletiva é aquela que pode ser vista e modificada por um grupo de usuários. Esta última permite a anotação colaborativa e, por conseguinte, apóia o trabalho e a aprendizagem colaborativos. A anotação adicionada à sua base de anotações pode ser classificada em um assunto previamente definido, ou pode ser necessário criar/editar um novo assunto para a nova anotação. Para tanto, será possível invocar a gerência de assuntos tanto no momento que se faz uma anotação quanto em um estágio anterior a ela.

Figura 2. Diagrama de Casos de Uso de um Anotador em Documentos Web

O usuário pode navegar em uma lista de anotações previamente feitas por ele mesmo ou pelo grupo que detém a anotação (no caso da anotação coletiva) e recuperar os textos anotados, assim como outras informações a respeito da anotação. Para cada anotação dessa lista, o usuário terá a opção de editar suas informações complementares, excluí-la ou recuperar os documentos originais, onde a anotação foi feita. Nesta última opção, o documento recuperado deverá exibir um destaque visual no trecho anotado, assim como exibir o comentário adicional feito pelo usuário quando fez a anotação. Ainda com relação à lista de anotações feitas por um usuário ou grupo de usuários, será permitido selecionar um subconjunto da lista de anotações, usando um critério qualquer (por exemplo, selecionar por assunto) e gerar um documento formado apenas por aquelas anotações selecionadas da lista. Isto permitirá a geração de um documento contendo textos importantes, previamente anotados, a respeito de um determinado tema.

O professor possuirá, além de todas as atribuições de um usuário normal, a capacidade de navegar pelas anotações de seus alunos. Ou seja, ele poderá navegar em anotações que não foram feitas por ele, diferentemente do aluno, que apenas poderá navegar em suas próprias anotações ou nas anotações coletivas dos grupos a que participa. Assim, o professor terá em suas mãos mais um mecanismo de acompanhamento do processo de aprendizagem dos seus alunos.

Outro recurso importante em uma ferramenta de anotação, que tenha como objetivo a organização e recuperação de informações, é a utilização de um índice remissivo contendo todas as palavras-chaves encontradas nos textos anotados. Cada palavra-chave do índice deverá referenciar suas ocorrências nos textos anotados. O processo para gerar o conjunto das palavras-chave do índice remissivo deverá ser completamente automático. Métodos para indexação automática de texto são detalhados em [Baeza-Yates 1999].

Devido ao fato do escopo de aplicação da ferramenta ser dado por um ambiente virtual de aprendizagem, novos documentos poderão ser adicionados (possivelmente por um usuário) ao conjunto de informações textuais disponíveis no ambiente. Desde que os novos documentos sejam acessíveis a um determinado usuário, a ferramenta de anotação lhe permitirá fazer anotações também nos documentos novos incluídos no ambiente.

Em se tratando de uma ferramenta de gerência de anotações para a web, o estado do negócio corresponde às informações sobre as anotações, como por exemplo, a identificação do usuário que fez a anotação, a data em que foi anotada, a URL do documento de onde a anotação foi obtida, algum comentário sobre o texto anotado, uma identificação do assunto tratado pelo texto, além do próprio texto anotado.

Arquitetura da proposta

Por se tratar de uma ferramenta que trabalha na web, dentro do escopo de um ambiente virtual de aprendizagem, sua arquitetura geral para anotar textos de documentos web segue as definições dos sistemas web tradicionais, baseada na abordagem clienteservidor. Uma ilustração dessa arquitetura geral é mostrada na Figura 3, adaptada de [Conallen 2003]. Na máquina cliente, é usado um navegador web (browser) que é o responsável por todas as interações do usuário com o ambiente de aprendizagem e, conseqüentemente, com a ferramenta de gerência das anotações feitas nos documentos do ambiente. É a partir do browser que o usuário pode ler e navegar nos documentos que ele tem acesso no contexto do ambiente, tais como fóruns, e-mails, chats, páginas HTML em geral e, opcionalmente, anotar trechos de textos que ele julgar importantes nesses mesmos documentos.

O navegador obtém as páginas web através de solicitações ao servidor web, além de enviar informações que devam se tornar persistentes no servidor, usando o protocolo HTTP. As páginas web retornadas contêm scripts, como por exemplo, códigos JavaScript, que são executados no próprio browser do cliente, acessando a interface do Modelo de Objetos do Documento (DOM) do navegador web. Esses scripts, em geral, têm o objetivo de dar um caráter mais dinâmico às páginas web e agregar mais facilidades de interação com o usuário. No caso do anotador, são esses scripts que permitem identificar o trecho de texto, selecionado pelo usuário, a ser anotado, além de buscar e destacar visualmente os trechos já anotados nos documentos.

Figura 3. Arquitetura Geral de um Anotador em Documentos Web

Na máquina servidora, há um servidor web que responde às solicitações dos clientes, enviando-lhes páginas web. Essas páginas podem ser estáticas – que contêm apenas texto, sem nenhum processamento – ou dinâmicas – que são geradas por algum processamento no servidor. O elemento responsável por gerar as páginas dinâmicas é o servidor de aplicação que tem acesso ao sistema de arquivos do servidor e ao servidor de banco de dados. É por meio deste último elemento que é possível armazenar o estado do negócio e mantê-lo persistente.

Um Protótipo de Anotador Web

Neste projeto foi desenvolvido um protótipo de uma ferramenta para a gerência de anotações na web. O desenvolvimento do protótipo seguiu a arquitetura geral proposta na seção 4.2 buscando contemplar os casos de uso levantados na seção 4.1. No cliente, os scripts usados nas páginas são códigos JavaScript, acessando a interface do Modelo de Objetos do Documento (DOM) do navegador. Buscamos minimizar as diversas incompatibilidades entre as versões de JavaScript suportadas pelos principais navegadores web (Microsoft Internet Explorer, NetScape, Mozilla, Opera, Konqueror etc.).

O objetivo de se usar scripts no cliente é minimizar tanto a sobrecarga de processamento no servidor quanto à taxa de utilização da banda passante da rede. No protótipo da ferramenta proposta, os scripts são usados principalmente na tarefa de selecionar, buscar e destacar o texto dos documentos. Assim, as alterações visuais ocorridas nos documentos no processo de anotar são percebidas apenas no cliente. No servidor, o documento mantém sua visualização original e apenas as informações das anotações são armazenadas no servidor de banco de dados.

As tecnologias escolhidas para o servidor foram o servidor de banco de dados MySQL, o servidor de aplicação Tomcat, utilizando tecnologia JSP/Servlet e o servidor web Apache. Essas escolhas foram feitas seguindo os critérios previamente definidos na construção do ambiente virtual de aprendizagem AMADIS [Basso 2004], para o qual esta ferramenta foi inicialmente planejada. A Figura 4 ilustra a arquitetura específica do servidor de aplicação usado neste protótipo.

Figura 4. Arquitetura do Servidor de Aplicação usada no Protótipo

Esta arquitetura é basicamente uma arquitetura Model-View-Controller (MVC), que separa a geração de conteúdo da apresentação de conteúdo. Uma arquitetura desse tipo é indicada pela presença de um servlet controlador entre o browser cliente as páginas JSP (que apresentam o conteúdo). O servlet controlador despacha solicitações HTTP para as correspondentes páginas JSP de apresentação. Neste modelo, as partes de apresentação (páginas JSP) são isoladas umas das outras. Os aplicativos que seguem esta arquitetura são mais flexíveis e mais fáceis de manter e de estender, pois os elementos de visão não referenciam diretamente uns aos outros. O servlet controlador desta arquitetura oferece um único ponto de controle para segurança e registro e, com freqüência, encapsula a entrada de dados em um formulário que pode ser usado na ponta do modelo MVC [Kurniavan 2002].

Apresentamos, a seguir, algumas telas do protótipo. A Figura 5 mostra o procedimento de fazer uma anotação em um documento. O usuário seleciona um trecho do texto do documento, depois invoca a janela de adicionar a anotação. Na janela, ele define algumas informações complementares (assunto e comentário) e submete a anotação. Na Figura 6 está representado o procedimento de navegar na lista de anotações. O usuário invoca a janela contendo a lista de anotações. Nela, ele pode filtrar as anotações por assunto, selecionar algumas para exclusão ou para gerar um documento contendo o texto das anotações selecionadas. É possível ainda recuperar o documento originalmente anotado com a anotação visualmente destacada nele. A recuperação de um documento anotado é mostrada na Figura 7.


Figura 5. Procedimento de Anotar em um Documento


Figura 6. Procedimento de Navegar na Lista de Anotações


Figura 7. Recuperação de um Documento Anotado


As possibilidades futuras de incremento funcional dessa ferramenta são diversas. Dentre elas, podemos citar a criação de uma visualização dinâmica dos assuntos anotados, tal como um grafo, onde os nodos representem os assuntos anotados e as arestas representem a similaridade entre os assuntos, segundo um limite mínimo aceitável. Outra possibilidade de incrementar as funcionalidades da ferramenta proposta é pelo uso de técnicas para recuperar anotações similares a uma dada anotação. Ainda com relação à recuperação de informação, técnicas baseadas na indexação automática de assuntos poderiam ser um recurso extra para sugerir ao usuário em que assunto classificar uma nova anotação. Assim, o usuário teria à disposição um recurso inteligente para auxiliá-lo na gerência dos assuntos e anotações.

Ressaltamos, por fim, a importância e a capacidade de uma ferramenta de anotação como um elemento de apoio ao processo de revisão bibliográfica e escrita de trabalhos científicos, ao processo colaborativo de construção e revisão de documentos ou no acompanhamento da aprendizagem do aluno.

Referências

Baeza-Yates, R.; Ribeiro-Neto, B.; (1999) “Modern Information Retrieval”, Addison Wesley, 1st Edition.

Basso, M. V.; Nevado, R. A.; Fagundes, L. C.; Bitencourt, J.; Menezes, C. S.; (2004) “AMADIS – Um Ambiente Integrado de Apoio à Pedagogia de Projetos de Aprendizagem”, XV Simpósio Brasileiro de Informática na Educação.

CmapTools (2004) http://cmap.ihmc.us/download/index.php. Conallen, J.; (2003) “Desenvolvendo Aplicações Web com UML”, Editora Campus, 2ª Edição.

Goulart A.; (2001) “Um Ambiente Cooperativo para Apoio à Revisão Bibliográfica”, Dissertação de Mestrado, UFES.

Guizzardi, R.; Menezes, C. S.; (2001) “Aplicando técnicas de Recuperação de Informações para facilitar a interação em ambientes cooperativos: uma abordagem multiagentes”, Anais do XII Simpósio Brasileiro de Informática na Educação.

Kurniawan, B.; (2002) “Java para a Web com Servlets, JSP e EJB”, Editora Ciência Moderna Ltda, 1ª Edição.

QRS International Pty Ltd.; (2002) “Getting Started In NVivo”, http://www.qsrinternational.com/products/productoverview/Getting%20Started%20in%20NVivo.pdf.

Ferramentas pessoais
Parceiros
















SourceForge.net Logo

Supported by Cenqua