Ir ao conteúdo
  • Cadastre-se

Python Python - Procurar a mesma palavra várias vezes em string e retornar o índice


Ir à solução Resolvido por Crafteribanez,

Posts recomendados

Boa tarde

 

Estou tentando no Python => Google Colab o seguinte procedimento sem êxito.

Encontrar todas as ocorrências de um texto e localizar o índice de cada ocorrência.

Pretendo exportar os resultados obtidos para um arquivo externo.

 

Código até o momento:

from google.colab import files

arquivo = files.upload()



pip install pdfminer.six



from pdfminer.high_level import extract_text

texto = extract_text('dopa.pdf')

print(texto)



print("Termo Aditivo " + str(texto.count('EXTRATO DE TERMO ADITIVO')))

 

Este código me retorna a quantidade de ocorrências, porém precisaria encontrar os índices das 4 ocorrências para poder extrair as strings.

Depois do texto, sempre tem o número do aditivo, é o que me interessa;

 

Aceito sugestões.

Grato.

 

 

 

 

 

 

 

 

Link para o comentário
Compartilhar em outros sites

O python já disponibiliza várias formas de tratar texto, aqui as anotações de um antigo professor meu:
 

min()			#ele encontra a letra com menor código da tabela ascii (você pode comprovar usando ord()), lembre que caracteres invisiveis também existem!
max()			#obvio.
index()			#ele vai procurar o que você colocar em index no texto e devolver seu índice.
center()			#tenta centralizar uma string em um print ou em uma variável.
.startswith()		#devolve true se a string começar com o parâmetro inserido.
.endswith()		#devolve true ou false, verifica se a string termina com uma string ou parte dela desejada.
.find()			#é igual ao index(), mas é feito exatamente para strings, find() acha  algo e diz onde se encontra(em qual índice), ele só mostra o primeiro. (use o in se quiser só confirmar algo)
rfind()			#mesmo que o find mas busca a partir do fim.
.isalnum()			#verifica se existe apenas alfanumericos(não confunda com "é tudo numero" kkk) não possui parâmetros.
.isalpha()			#verifica se tem só caracteres alfabéticos.
isdigit()			#verifica se tem só números.
islower()			#verifica se tem só letras minúsculas.
.isspace()			#verifica se o caractere é um espaço.
.upper()			#método que faz a string ficar totalmente em maiuscula.
.replace			#listas do tipo string são imutaiveis, então  para mudar algo dentro dela você deve por listastring.replace("texto","por_texto")
.capitalize()		#joga toda a string para minúsculo, mas deixa a primeira em maiúsculo.
.title()			#coloca a inicial das palavras em maiusculo e o resto em minúsculo.
lstrip() 			#método devolve uma cadeia recém-criada formada a partir da original, removendo todos os principais espaços em branco.
			#se por uma string como parâmetro do lstrip ele vai remover isso se tiver no início e se repetir-se no início.
.strip()			#remove espaços inúteis  na string.
.rstrip()			#remove espaços inúteis somente da direita. De maneira análoga, o lstrip() remove da esqueda.
.split()			# divide o texto pelas palavras separadas por espaço em uma lista. se quiser mudar o separador basta adicionar parâmetros: .split("separador",quantidade_splitada)
.join()			#use para juntar elementos e objetos.
.swapcase()		#reverte maiusculo e minusculo da string.

para ter mais liberdade, inclusive quando for estudar outras linguagens, recomendo estudar expressões regulares e fazer isso da forma correta.

o modulo de regex do python se chama re, basta importar e em 5 min você entende a documentação. (mesmo entendendo pega bastante porrada da sintaxe no início)

Link para o comentário
Compartilhar em outros sites

Crie uma conta ou entre para comentar

Você precisa ser um usuário para fazer um comentário

Criar uma conta

Crie uma nova conta em nossa comunidade. É fácil!

Crie uma nova conta

Entrar

Já tem uma conta? Faça o login.

Entrar agora

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

 

GRÁTIS: ebook Redes Wi-Fi – 2ª Edição

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!