Ir ao conteúdo

Posts recomendados

Postado

Os testes está danificando as letras que são em escritas a mão, á alguma script ou programa que aplique o OCR leve sem danificar as letras que são escritas a mão?

 

tornando o PDF pesquisavel.

  • Membro VIP
Postado

Qual ferramenta você está tentando usar?

 

Geralmente falamos em OCR para o reconhecimento de caracteres em "tipos de fonte" conhecidos: Arial, Times New Roman. O software deve permitir que marquemos regiões para a varredura, e desprezemos outras.

 

Eu sei que também existe o reconhecimento de letra manuscrita. Mas ele requer "aprendizado de máquina" específico para o reconhecimento da letra da pessoa.

Postado

@alexandre.mbm Exato!

tranquilo de achar o software para varredura em todo PDF, porém não é isso que procuro já que o reconhecimento acaba danificando em vez de ajudar, procuro algo que reconheça somente paginas digitalizadas e não faça varredura em todo PDF,  porém são muitas paginas e a ferramenta teria que ser executada em LOTE.

  • Confuso 1
  • Membro VIP
Postado
1 hora atrás, Loclyh disse:

tornando o PDF pesquisavel

 

15 minutos atrás, Loclyh disse:

procuro algo que reconheça somente paginas digitalizadas

 

Não estou lhe entendendo. Pois os arquivos PDF contendo textos eletrônicos já tem esses textos pesquisáveis.

 

Eu achava que você queria extrair do documento as "fotos de texto", e aplicar OCR nelas. Mas sem ter de lidar com arquivos de imagem intermediários. Eu não tenho experiência com software leitor que faça essa "abertura OCR" de forma transparente ao usuário.

 

Por isso volto a lhe perguntar:

 

O que exatamente você tem experimentado?

Postado

ex:@alexandre.mbm   
em 50 PDF, onde se encontra textos inseridos por digitação e também com escrita manual nessa paginas.
o OCR , vindo do adobe, do wondershare, pdf manchine, eles destorce as escrita em caneta. deixando pdf inutilizavel.

  • Membro VIP
Postado

Não tenho conhecimento da existência de conversão OCR para manuscritos. Pode ser que exista, algum projeto inusitado, em testes.

 

Em se tratando de reconhecimento de algo escrito à caneta, eu só sei do que vemos em dispositivos móveis e mesas digitalizadoras. O reconhecimento é "por caractere", não é cursivo.

 

Eu suspeito que indexadores de arquivos nos sistemas operacionais já são capazes de adentrar PDF contexto texto eletrônico.

  • Obrigado 1

Crie uma conta ou entre para comentar

Você precisa ser um usuário para fazer um comentário

Criar uma conta

Crie uma nova conta em nossa comunidade. É fácil!

Crie uma nova conta

Entrar

Já tem uma conta? Faça o login.

Entrar agora

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...