Ir ao conteúdo
  • Cadastre-se

Excel extrair dados para o excel


Posts recomendados

olá!

 

amigos, por favor:

1) estou com dificuldades para extrair dados de um arquivo .pdf para um planilha excel. os arquivos pdf não são tabelas e não são imagens. são textos, na verdade, cadernos de questões de provas.. já tentei os conversores on line e eles colocam longas colunas sem separar os textos em cada célula.

a ideia é extrair essas questões e as opções de resposta do arquivo pdf e colocar cada item desses em uma célula individual da planilha.

é possível?

 

2) outra dúvida é quanto à extração de textos de arquivos .doc para o excel. por exemplo, tenho duas palavras que possuem entre elas uma quebra de linha (parágrafo ou quebra de linha manual):

linha 1 ==> teste

linha 2 ==> testado

se eu copiar essa sequência, incluindo a quebra de linha, e colá-la no excel, as duas palavras ocuparão duas células na planilha, correto?

célula 1 ==> teste

célula 2 ==> testado

existe uma maneira de que essas duas palavras fiquem na mesma célula incluindo a quebra de linha?

mesma célula ==> teste

                                testado

 

3) última dúvida. no word, o caractere para marca de parágrafo é ^p, para quebra de linha manual é ^l, e assim por diante, correto? se eu tenho um texto no qual as quebras de linha são todas manuais, ou seja, ^l, e quiser substituí-las por marca de parágrafo (^p), entro em CTRL+U e escrevo em localizar ^l e em substituir por colocar ^p. todas as quebras de linhas manuais serão substituídas por marcas de parágrafos.

agora, a dúvida no excel...

a quebra de linha no excel é ALT+ENTER, correto? mas qual é esse caractere? por exemplo, se eu quiser substituir nos textos das células todos os espaços por quebras de linhas, coloco em localizar o caractere do espaço, mas em substituir por qual caractere representa a quebra de linha?

para inserir uma quebra de linha dentro da célula do excel basta clicar ALT+ENTER, correto? mas qual é esse caractere?

 

obrigado!

 

Link para o comentário
Compartilhar em outros sites

Boa noite, colega @-=|zami|=-

 

8 horas atrás, -=|zami|=- disse:

1) estou com dificuldades para extrair dados de um arquivo .pdf para um planilha excel...e colocar cada item desses em uma célula individual da planilha. é possível?

 

Provavelmente seja possível, mas sem ver seu pdf fica difícil avaliar. Anexe seu pdf e seu arquivo Excel de como ficariam distribuídos no final os conteúdos pelas células no final para termos uma ideia.

 

8 horas atrás, -=|zami|=- disse:

2) outra dúvida é..., por exemplo, tenho duas palavras que possuem entre elas uma quebra de linha (parágrafo ou quebra de linha manual)...

...existe uma maneira de que essas duas palavras fiquem na mesma célula incluindo a quebra de linha?

mesma célula ==> teste

                                testado

 

Use um artifício:

  1. no arquivo original no Word, substitua o caractere de marca de parágrafo (pé-de-mosca) ou de quebra de linha manual por um caractere especial qualquer (um captcha) que dificilmente ocorreria no texto, por exemplo, o caractere "§" (pode até ser uma combinação de mais de um caracter complexo).
  2. Copie o texto e cole no Excel
  3. No Excel, dê CTRL+U pra abrir o diálogo Localizar e Substituir:
    • em Localizar, insira o(s) caractere(s) especial(is) que você usou no passo anterior
    • em Substituir, use CTRL + J ou, alternativamente, segure a tecla ALT e, sem soltá-la, digite 010 do teclado numérico.
      Obs.: nesse passo, visualmente você não perceberá que existe um caractere ali na caixa, porque ele é invisível, mas estará lá.
8 horas atrás, -=|zami|=- disse:

3) ...agora, a dúvida no excel...a quebra de linha no excel é ALT+ENTER, correto? mas qual é esse caractere? por exemplo, se eu quiser substituir nos textos das células todos os espaços por quebras de linhas, coloco em localizar o caractere do espaço, mas em substituir por qual caractere representa a quebra de linha?

 

Já respondido no item anterior: CTRL + J ou ALT + 010

 

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Bom dia, @-=|zami|=-

 

Qual a versão de seu Office?

São vários arquivos pdf desses ou é apenas esse? Se forem vários, todos terão a mesma estrutura?

Se não forem muitos, eu sugeriria uma metodologia parcialmente manual, usando Localizar/Substituir no Word usando coringas, pois é mais avançado que no Excel, além do que o Word permite converter pdf em doc diretamente. Nesse caso não seria necessário usar VBA.

De qualquer forma, dá um trabalhinho razoável...

Link para o comentário
Compartilhar em outros sites

@Edson Luiz Branco  Obrigado!

 

office 2010 e a estrutura de todos os documentos é mais ou menos a mesma.

mas, sem problemas. com o word estou conseguindo progredir.

tenho algumas dúvidas, se puder me ajudar:

1) não consegui abrir o pdf diretamente no word. os caracteres ficaram incompreensíveis, mesmo alterando as codificações. tenho usado conversores on line e editado o arquivo no word.

2) conhece algum editor de pdf, mesmo pago, que permita realizar o mesmo trabalho edição feito com o word?

 

obrigado!

Link para o comentário
Compartilhar em outros sites

13 horas atrás, -=|zami|=- disse:

...office 2010...

1)... no word. os caracteres ficaram incompreensíveis...

 

A importação/conversão nativa pelo Word de documentos pdf's só teve início na versão 2013, infelizmente não faz parte de sua versão. Fiz essa importação aqui com esse pdf que você mandou no meu que é 2016 e ficou ótimo, sem nenhum caractere estranho. Inclusive as quebras de linha ficaram corretas, com o texto fluindo de uma linha pra outra sem as quebras que ocorrem ao se copiar em outro programa e colar como texto. Além disso, cabeçalhos e rodapés também são considerados como tais e não como parte do texto central.

Depois disso, o trabalho é só o de eliminar figuras e quebras de sessão e fazer substituições usando coringas que chega no resultado tabular que você deseja.

 

14 horas atrás, -=|zami|=- disse:

2) conhece algum editor de pdf, mesmo pago, que permita realizar o mesmo trabalho edição feito com o word?

 

 

O melhor que eu já trabalhei foi, sem dúvida, o próprio Adobe Acrobat Pro (não o Reader) e não é free mas se não me engano tem versão de avaliação.

Outro pago que considero bom é o PDFElement Pro, também tem versão de avaliação.

Um que é gratuito e bem simplório mas que tem muita utilidade num caso específico é o "Tabula": quando seu pdf tem uma tabela mas os outros extratores não reconhecem muito bem aqueles dados como tabela, o aplicativo Tabula geralmente reconhece. Ele é online, apesar de ter um instalador.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Crie uma conta ou entre para comentar

Você precisa ser um usuário para fazer um comentário

Criar uma conta

Crie uma nova conta em nossa comunidade. É fácil!

Crie uma nova conta

Entrar

Já tem uma conta? Faça o login.

Entrar agora

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...