Como copiar um texto de um PDF




Vira e mexe alguém me pergunta sobre como copiar um texto de um PDF que não permite selecionar o seu conteúdo. Eu sempre respondo a mesma coisa: Não dá para fazer…. sem o programa correto. Normalmente, quando um PDF contém um texto e ele foi gerado da maneira correta, qualquer um é capaz de selecionar o texto nele contido, porém existem diversos geradores de PDF que convertem o texto em imagem, tornando o arquivo maior e impossível de copiar.

A única solução possível nestes casos é reclamar um pouco e ter o programa certo instalado no computador para ajudar na tarefa de converter a imagem em texto novamente. Tenho certeza de que devem existir centenas de programas que conseguem fazer isto, mas eu apenas recomendo um. É o programa pai, ou mãe, de todos os PDF. Adobe Acrobat. Não confunda o nome. O Adobe Acrobar Reader, apenas lê PDF e eu me refiro ao programa da Adobe que é capaz de gerá-los. Dentro de suas entranhas e nos seus vastos menus cheios de opções que grande parte de seus usuários jamais navega e uso, existe uma opção bem legal que é OCR.

Pra quem não viveu a chegada e evolução dos scanners enquanto dispositivos independentes pode não saber o que é OCR. OCR é o reconhecimento de imagens de texto e convertê-los para texto de verdade. Durante minha puberdade, fiz muito este tipo de atividade. Pega um livro ou revista colocava no scanner e digitalizava o texto para algum trabalho de escola. Depois de muito trabalho consertando os erros finalmente um digno trabalho de copy & paste artesanal do mundo analógico para o digital. Hoje em dia não há mais grande necessidade deste tipo de atividade, pois boa parte dos documentos já nascem digitais.

NewImage

Enfim, OCR é agora uma função que alguns programas de PDF e imagens em geral acabam oferecendo e dentro do Acrobat ele é o caboclo capaz de salvar um na hora de pegar um PDF e convertê-lo para texto. O chato neste caso é que o Acrobat é um programa pago e caro apenas para aqueles que querem fazer uso desta função. A alternativa não é pirataria, pois isto é um crime nefasto. Você deveria usar o PDF OCR X. Ele é grátis, mas limitado. Talvez esta limitação não seja problema para você, mas a versão paga não é nada de outro mundo e cabe muito bem no seu bolso custando 30 dólares.

Português é uma das línguas suportadas apesar do programa ser em inglês. Eu achei que ele era exclusivo para Mac, mas ele é para Windows também.




Leia Também


Deixe uma resposta

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

%d blogueiros gostam disto: