Digitalização de livros

A Digitalização de livros é um processo pelo qual se capturam as imagens das página de um livro em papel, com recurso a um digitalizador que as convertem em formatos digitais. É uma técnica habitualmente utilizada por bibliotecas digitais, como o Google Book Search, o Projeto Gutenberg, o Distributed Proofreaders, ou a Biblioteca Nacional Digital.

Um digitalizador de livros - Internet Archive

Geralmente, após a digitalização das páginas, estas são submetidas a um reconhecimento óptico de caracteres (OCR) através do qual se geram documentos de texto (em formato TXT, RTF, PDF, ou outros) para facilitar a busca de conteúdos e a leitura em computadores e PDA.

O processo de digitalização pode ser manual, automático (ou robotizado) ou parcialmente automático. Um protótipo de um scanner-robô, pesquisado pela empresa austríaca Treventus venceu na Cebit 2007, o Grande Prêmio" do European Information and Communication Technology Award.[1].

Existem grupos especializados de digitalização de livros, tanto empresarias, quanto amadores que se dedicam a construção de seus próprios digitalizadores de livros artesanais.[2]

Digitalização destrutiva editar

Neste tipo de digitalização, a lombada do livro é cortada fora, transformando o livro numa pilha de papéis que é rapidamente digitalizada por um digitalizador comum, com ganhos de qualidade e rapidez em relação ao processo com um livro inteiro.

Digitalização não destrutiva editar

 
Um exemplo de um digitalizador de livros artesanal, onde a força da gravidade ajuda a achatar as páginas do livro.

Este tipo de digitalização evita a destruição do livro, com digitalizadores específicos para livros que evitam áreas escuras e minimizam os riscos de o livro ser danificado ou a imagem digitalizada ficar distorcida.[3] Estes tipos de digitalizadores também procuram estender a área útil do digitalizador o mais próximo possível da borda, para assim permitir que o livro possa ficar com um dos lados suspensos, enquanto a página de interesse é digitalizada.

Pesquisadores da Universidade de Tóquio criaram um digitalizador de livros experimental [4] que inclui um digitalizador de superfície tridimensional e que possibilita que imagens de uma superfície curva sejam planificadas através de software, possibilitando digitalizar imagens tão rápidas quanto o operador possa virar as páginas do livro - por volta de 200 páginas por minuto.

Equipamentos para a digitalização de livros editar

No mercado diversos modelos competem pelo melhor desempenho no que se refere à digitalização de documentos e livros. A agilidade, design e principalmente a facilidade do uso do aparelho são fatores que determinam a escolha desse ou daquele equipamento. Na digitalização de livros em especial, destacam-se no mercado os produtos da marca Joyusing. Esses dispositivos utilizam recursos ópticos poderosos e resoluções de imagem que garantem um arquivo de boa qualidade e altamente legível. Além disso, contam com o recurso de OCR que permite o reconhecimento de caracteres, o que transforma as páginas dos livros digitalizados em páginas com conteúdo pesquisável.

Referências

  1. Conrad Gruber: Nie mehr Umblättern – Treventus: Erfolgsstory mit Scanroboter. Em: MONITOR online. Junho 2006. (em alemão)
  2. «Página do DIY Book Scanner (Faça Você Mesmo seu Digitalizador de Livros)» (em inglês) 
  3. «Vectorscan, manual de digitalização de livros.» (PDF) 
  4. «"Superfast Scanner Lets You Digitize Book By Flipping Pages", IEEE Spectrum, March 17, 2010» (em inglês) 

Ver também editar

  Este artigo sobre informática é um esboço. Você pode ajudar a Wikipédia expandindo-o.