Ir ao conteúdo

Posts recomendados

Postado

Os testes está danificando as letras que são em escritas a mão, á alguma script ou programa que aplique o OCR leve sem danificar as letras que são escritas a mão?

 

tornando o PDF pesquisavel.

  • Membro VIP
Postado

Qual ferramenta você está tentando usar?

 

Geralmente falamos em OCR para o reconhecimento de caracteres em "tipos de fonte" conhecidos: Arial, Times New Roman. O software deve permitir que marquemos regiões para a varredura, e desprezemos outras.

 

Eu sei que também existe o reconhecimento de letra manuscrita. Mas ele requer "aprendizado de máquina" específico para o reconhecimento da letra da pessoa.

Postado

@alexandre.mbm Exato!

tranquilo de achar o software para varredura em todo PDF, porém não é isso que procuro já que o reconhecimento acaba danificando em vez de ajudar, procuro algo que reconheça somente paginas digitalizadas e não faça varredura em todo PDF,  porém são muitas paginas e a ferramenta teria que ser executada em LOTE.

  • Confuso 1
  • Membro VIP
Postado
  Em 29/11/2020 às 03:17, Loclyh disse:

tornando o PDF pesquisavel

Expandir  

 

  Em 29/11/2020 às 04:20, Loclyh disse:

procuro algo que reconheça somente paginas digitalizadas

Expandir  

 

Não estou lhe entendendo. Pois os arquivos PDF contendo textos eletrônicos já tem esses textos pesquisáveis.

 

Eu achava que você queria extrair do documento as "fotos de texto", e aplicar OCR nelas. Mas sem ter de lidar com arquivos de imagem intermediários. Eu não tenho experiência com software leitor que faça essa "abertura OCR" de forma transparente ao usuário.

 

Por isso volto a lhe perguntar:

 

O que exatamente você tem experimentado?

Postado

ex:@alexandre.mbm   
em 50 PDF, onde se encontra textos inseridos por digitação e também com escrita manual nessa paginas.
o OCR , vindo do adobe, do wondershare, pdf manchine, eles destorce as escrita em caneta. deixando pdf inutilizavel.

  • Membro VIP
Postado

Não tenho conhecimento da existência de conversão OCR para manuscritos. Pode ser que exista, algum projeto inusitado, em testes.

 

Em se tratando de reconhecimento de algo escrito à caneta, eu só sei do que vemos em dispositivos móveis e mesas digitalizadoras. O reconhecimento é "por caractere", não é cursivo.

 

Eu suspeito que indexadores de arquivos nos sistemas operacionais já são capazes de adentrar PDF contexto texto eletrônico.

  • Obrigado 1

Crie uma conta ou entre para comentar

Você precisa ser um usuário para fazer um comentário

Criar uma conta

Crie uma nova conta em nossa comunidade. É fácil!

Crie uma nova conta

Entrar

Já tem uma conta? Faça o login.

Entrar agora

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Mostrar mais  

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

Mostrar mais  
×
×
  • Criar novo...

LANÇAMENTO!

eletronica2025-popup.jpg


CLIQUE AQUI E BAIXE AGORA MESMO!