Segundo Baldam, a digitalização de documentos consiste na conversão de documentos em papel físico, microfilme, microficha, jaqueta ou cartão janela para uma imagem digital através de um equipamento denominado “scanner”.
Esta tecnologia possibilita o armazenamento de grandes volumes de documentos em algum meio magnético, digital, óptico, etc. Geralmente CD-R (em um CD-R cabem aproximadamente 15.000 páginas), ocupando assim menos espaço do que ocupavam antes. Além da redução do espaço físico, essa tecnologia possibilita o armazenamento de documentos com segurança e a recuperação dos mesmos de forma rápida e eficiente.
Etapas do processo de digitalização de documentos:
Preparação: os documentos, muitas vezes, precisam ser restaurados pela forma imprópria de armazenamento ou pelo constante manuseio do papel. Mesmo não havendo este trabalho de restauração é necessário que todos os “clips”, grampos, cola ou qualquer elemento que prejudique sua passagem no scanner, sejam retirados. O processo de preparação para microformas consiste na organização dos mesmos, na sequência definida pelo cliente para digitalização de documentos.
Digitalização: imagem digital, disponibilizando para uma posterior pesquisa de forma rápida e objetiva.
Indexação: para obter-se as imagens dos documentos digitalizados de maneira rápida e precisa, será desenvolvido um software que, através de índices pré-definidos pelo cliente, possibilitará a recuperação das mesmas.
Manutenção/Inspeção: todas as imagens geradas a partir do processo de digitalização de documentos serão revisadas, a fim de se verificar se as mesmas estão de acordo com as especificações técnicas determinadas pelo projeto. Todo o trabalho realizado é gravado em algum meio magnético ou óptico, ficando disponível para consulta e impressão. Hoje, o meio de armazenamento mais utilizado é o CD-R pelo seu baixo custo, por sua rapidez de acesso à informação e por manter a integridade dos dados por um tempo incomparável a qualquer meio magnético.
Vantagens deste sistema de digitalização de documentos:
- diferente dos documentos em papel, que só podem ser examinados em um só lugar por vez, as imagens eletrônicas podem ser acessadas simultaneamente por várias pessoas ou estações de trabalho;
- segurança e agilidade na pesquisa de informações;
- espaço reduzido de armazenamento e economia de espaço físico. Um CD-ROM de 650 Mb pode armazenar aproximadamente 20 mil páginas de documento, padrão A4, preto e branco, ou o equivalente a 10 rolos de microfilme;
- a imagem eletrônica pode ser reconvertida ao papel com boa qualidade, utilizando-se as impressoras.
Formatos de Arquivos mais aplicáveis
Os formatos nativamente digitais mais comuns usados para grande produção de documentos ou objetos em GED são:
- TIFF (Tagged Image File Format) – é o padrão de fato usado na indústria de GED. Embora existam dezenas (para não dizer centenas) de tipos de TIFF é o realmente adotado na grande maioria das aplicações. Permite alto nível de compactação e arquivos multipaginados.
- JPEG (Joint Photographic Experts Group) – é mais utilizado para imagens em tons de cinza e coloridas. Não permite arquivos multipaginados.
- PDF (Portable Document Format) – formato originalmente desenvolvido pelo Adobe, permite arquivos multipaginados. Possibilita combinar diferentes tipos de compressão de dados e diferentes fontes de imagens. Permite ainda adicionar índices ao documento, além de uma série de outras interessantes características. Muito utilizado na Internet, tem sido amplamente usado em aplicações de GED.
- BITMAP (Binary Mapping Photographic) e GIF (Graphics Interchange Format) – são outros formatos nativamente digitais, também muito utilizados na produção de documentos em gerenciamento eletrônico de documentos.
Meios de Armazenamento
O GED pode ser armazenado usando alguns meios, como:
- CD-ROM – os CDs são universais e largamente utilizados. A capacidade de cada CD é de 650 MB, e pode ser utilizado individualmente, em torres de CD ou Jukebox;
- Discos Óticos – são largamente utilizados para o arquivamento de documentos, imagens e relatórios. A capacidade atual de cada mídia é de 5.2 GB e é mais utilizada em Jukebox a um baixo custo;
- DVD – são também mídias com alto poder de armazenamento. O DVD é uma evolução do formato de CD-ROM com alta capacidade;
- Jukebox – são equipamentos que permitem armazenar “near-line” muitos discos em seus slots e quando uma informação é solicitada, o disco é conduzido por um braço mecânico para um drive para a leitura ou gravação. As jukebox podem ser utilizadas com Discos Ópticos, DVDs ou CDs;
- Fitas – são utilizadas como backup de segurança. Suas informações não estão à disposição “On-Line” do software de gerenciamento de imagens e documentos, podendo ser recuperadas através da utilização de software auxiliar.