Blog Arquivar

A digitalização de documentos

Segundo Baldam, a digitalização consiste na conversão de documentos em papel físico, microfilme, microficha, jaqueta ou cartão janela para uma imagem digital através de um equipamento denominado “scanner”.

Esta nova tecnologia possibilita o armazenamento de grandes volumes de documentos em algum meio magnético, digital, óptico, etc. Geralmente CD-R (em um CD-R cabem aproximadamente 15.000 páginas), ocupando assim menos espaço do que ocupavam antes. Além da redução do espaço físico, essa nova tecnologia possibilita o armazenamento de documentos com segurança e a recuperação dos mesmos de forma rápida e eficiente.

Etapas do processo de digitalização:

Preparação: os documentos, muitas vezes, precisam ser restaurados pela forma imprópria de armazenamento ou pelo constante manuseio do papel. Mesmo não havendo este trabalho de restauração é necessário que todos os “clips”, grampos, cola ou qualquer elemento que prejudique sua passagem no scanner, sejam retirados. O processo de preparação para microformas consiste na organização dos mesmos, na seqüência definida pelo cliente para digitalização.

Digitalização: imagem digital, disponibilizando para uma posterior pesquisa de forma rápida e objetiva.

Indexação: para obter-se as imagens dos documentos digitalizados de maneira rápida e precisa, será desenvolvido um software que, através de índices pré-definidos pelo cliente, possibilitará a recuperação das mesmas.

Manutenção/Inspeção: todas as imagens geradas a partir do processo de digitalização serão revisadas, a fim de se verificar se as mesmas estão de acordo com as especificações técnicas determinadas pelo projeto. Todo o trabalho realizado é gravado em algum meio magnético ou óptico, ficando disponível para consulta e impressão. Hoje, o meio de armazenamento mais utilizado é o CD-R pelo seu baixo custo, por sua rapidez de acesso à informação e por manter a integridade dos dados por um tempo incomparável a qualquer meio magnético.

Vantagens deste sistema:

  • diferente dos documentos em papel, que só podem ser examinados em um só lugar por vez, as imagens eletrônicas podem ser acessadas simultaneamente por várias pessoas ou estações de trabalho;
  • segurança e agilidade na pesquisa de informações;
  • espaço reduzido de armazenamento e economia de espaço físico. Um CD-ROM de 650 Mb pode armazenar aproximadamente 20 mil páginas de documento, padrão A4, preto e branco, ou o equivalente a 10 rolos de microfilme;
  • a imagem eletrônica pode ser re-convertida ao papel com boa qualidade, utilizando-se as impressoras.

Formatos de Arquivos mais aplicáveis

Os formatos nativamente digitais mais comuns usados para grande produção de documentos ou objetos em GED são:

  • TIFF (Tagged Image File Format) – é o padrão de fato usado na indústria de GED. Embora existam dezenas (para não dizer centenas) de tipos de TIFF é o realmente adotado na grande maioria das aplicações. Permite alto nível de compactação e arquivos multipaginados.
  • JPEG (Joint Photographic Experts Group) – é mais utilizado para imagens em tons de cinza e coloridas. Não permite arquivos multipaginados.
  • PDF (Portable Document Format) – formato originalmente desenvolvido pelo Adobe, permite arquivos multipaginados. Possibilita combinar diferentes tipos de compressão de dados e diferentes fontes de imagens. Permite ainda adicionar índices ao documento, além de uma série de outras interessantes características. Muito utilizado na Internet, tem sido amplamente usado em aplicações de GED.
  • BITMAP (Binary Mapping Photographic) e GIF (Graphics Interchange Format) – são outros formatos nativamente digitais, também muito utilizados na produção de documentos em gerenciamento eletrônico de documentos.

Meios de Armazenamento

O GED pode ser armazenado usando alguns meios, como:

  • CD-ROM – os CDs são universais e largamente utilizados. A capacidade de cada CD é de 650 MB, e pode ser utilizado individualmente, em torres de CD ou Jukebox;
  • Discos Óticos – são largamente utilizados para o arquivamento de documentos, imagens e relatórios. A capacidade atual de cada mídia é de 5.2 GB e é mais utilizada em Jukebox a um baixo custo;
  • DVD – são também mídias com alto poder de armazenamento. O DVD é uma evolução do formato de CD-ROM com alta capacidade;
  • Jukebox – são equipamentos que permitem armazenar “near-line” muitos discos em seus slots e quando uma informação é solicitada, o disco é conduzido por um braço mecânico para um drive para a leitura ou gravação. As jukebox podem ser utilizadas com Discos Ópticos, DVDs ou CDs;
  • Fitas – ainda são o meio mais barato e mais utilizado para armazenamento da informação, sendo largamente utilizadas como backup de segurança. Suas informações não estão à disposição “On-Line” do software de gerenciamento de imagens e documentos, podendo ser recuperadas através da utilização de software auxiliar.