Ir ao conteúdo
  • Cadastre-se

Python Extraindo informações especificas de um arquivo PDF e mandando para uma planilha


Posts recomendados

testDoc.pdfOla, estou com um projeto onde preciso puxar informações de um PDF e envia-los para uma planilha, porém fiquei preso na parte de localizar a informação:

from typing import Text
import PyPDF2
pdfFile = open('testDoc.pdf', 'rb')
#fazendo com que o programa consiga ler um arquivo em PDF
dados = PyPDF2.PdfFileReader(pdfFile)
pag1 = dados.getPage(0)
Text = pag1.extractText()
print(Text)
print('ola')
#transformando o pdf em um arquivo .txt
txtFile = open('testDoc2.txt', 'w')
txtFile.write(Text)
x = Text.find('cnpj')
print(x)

(anexei o documento que o programa esta lendo)

preciso que depois que ele encontre a palavra "CNPJ" escreva os números ao lado e depois o salve.

 

Obrigado

Link para o comentário
Compartilhar em outros sites

Crie uma conta ou entre para comentar

Você precisa ser um usuário para fazer um comentário

Criar uma conta

Crie uma nova conta em nossa comunidade. É fácil!

Crie uma nova conta

Entrar

Já tem uma conta? Faça o login.

Entrar agora

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

 

GRÁTIS: ebook Redes Wi-Fi – 2ª Edição

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!