Olá!
Estou desenvolvendo uma planilha em que preciso extrair dados de arquivos pdfs(convertidos para excel)2.700 arquivos.
Esses arquivos são boletins de ocorrências de acidentes de transito.
De cada arquivo, preciso apenas dos dados Nº da ocorrência, data do fato, Nome da Vítima, cpf da vítima e telefone, porém, esses dados estão contidos na mesma coluna e preciso que ele identifique os, após a célula, em que for identificado Qualificação(ões): VÍTIMA / COMUNICANTE, Qualificação(ões): VÍTIMA / ENVOLVIDO , Qualificação(ões): VÍTIMA ou Qualificação(ões): VÍTIMA COMUNICANTE.
Consegui identificar alguns dados usando ÍNDICE + CORRESP, porém, as informações de CPF e TELEFONE, além de estarem vinculadas a cada nome e Cpf diferentes(NOME: DANIELLY MENDES DE SOUZ)(NOME: RICHARD LIRA TEXEIRA)(CPF: 9XX31904134)(TELEFONE CELULAR: (XX) 9800-5201) não tem um padrão de sequencia de linhas, após o nome o que impossibilita o retorno correto.
Por isso, imagino que apenas o vba pode fazer este processo com mais agilidade e eficiencia, porém, não sei desenvolver, ja procurei informação em tudo que é canto, mais não consigo desenvolver o código.
Me ajudem por favor!
As fórmulas que utilizei até agora estão na planilha em anexo.
Pasta1.xlsx