Ir ao conteúdo
  • Cadastre-se

Meio de aplicar OCR em PDF 1 a1 ou LOTE


Loclyh

Posts recomendados

  • Membro VIP

Qual ferramenta você está tentando usar?

 

Geralmente falamos em OCR para o reconhecimento de caracteres em "tipos de fonte" conhecidos: Arial, Times New Roman. O software deve permitir que marquemos regiões para a varredura, e desprezemos outras.

 

Eu sei que também existe o reconhecimento de letra manuscrita. Mas ele requer "aprendizado de máquina" específico para o reconhecimento da letra da pessoa.

Link para o comentário
Compartilhar em outros sites

@alexandre.mbm Exato!

tranquilo de achar o software para varredura em todo PDF, porém não é isso que procuro já que o reconhecimento acaba danificando em vez de ajudar, procuro algo que reconheça somente paginas digitalizadas e não faça varredura em todo PDF,  porém são muitas paginas e a ferramenta teria que ser executada em LOTE.

  • Confuso 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
1 hora atrás, Loclyh disse:

tornando o PDF pesquisavel

 

15 minutos atrás, Loclyh disse:

procuro algo que reconheça somente paginas digitalizadas

 

Não estou lhe entendendo. Pois os arquivos PDF contendo textos eletrônicos já tem esses textos pesquisáveis.

 

Eu achava que você queria extrair do documento as "fotos de texto", e aplicar OCR nelas. Mas sem ter de lidar com arquivos de imagem intermediários. Eu não tenho experiência com software leitor que faça essa "abertura OCR" de forma transparente ao usuário.

 

Por isso volto a lhe perguntar:

 

O que exatamente você tem experimentado?

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Não tenho conhecimento da existência de conversão OCR para manuscritos. Pode ser que exista, algum projeto inusitado, em testes.

 

Em se tratando de reconhecimento de algo escrito à caneta, eu só sei do que vemos em dispositivos móveis e mesas digitalizadoras. O reconhecimento é "por caractere", não é cursivo.

 

Eu suspeito que indexadores de arquivos nos sistemas operacionais já são capazes de adentrar PDF contexto texto eletrônico.

  • Obrigado 1
Link para o comentário
Compartilhar em outros sites

Crie uma conta ou entre para comentar

Você precisa ser um usuário para fazer um comentário

Criar uma conta

Crie uma nova conta em nossa comunidade. É fácil!

Crie uma nova conta

Entrar

Já tem uma conta? Faça o login.

Entrar agora

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...