Ir ao conteúdo

Posts recomendados

Postado
1 hora atrás, vangodp disse:

É um tema bem extenso mas o que você anda buscando é um "HTML parser for C++ languaje", basicamente é um abalizador de código. Toda pagina web não e mais que um documento de texto, porém html tem as tais etiquetas que dificultam a extração de um texto em concreto, por exemplo, podemos querer a palavra ou frase que se encontra entre 2 etiquetas(tag) <etiqueta>"Alo mundo!"<\etiqueta>, a solução fácil, mais nem tanto, é usar strstr() que busca um string, por exemplo você pode buscar a etiqueta de abertura<etiqueta> e si ela existir ler tudo o que estiver até a etiqueta de fechamento <\etiqueta>, isso é exatamente o que faz um parser por nós, é especificar a etiqueta, nível de profundidade a buscar etc etc, a biblioteca faz tudo isso por você e muito mais. Não é nada fácil, eu nem tenho muita ideia de como funciona isso pois posso até estar falando bobagem, mas sem duvida o que você está buscando é isso, um html parser(analizador html) para c/c++. faça uso de google pois tem muito tema por aí rolando, sobre tudo se souber inglês.

Existem parsers para muitos outros linguagens, incluindo o próprio C, também C++, java, xml, arquivos ini......
Aprenda regex também, C++11 ja traz incluido regex.

Algumas bibliotecas que você deveria investigar são tinyXML, libtidy, curl entre outras, existem varias.

Sinto não dar uma resposta mais direta ao problema mas muitas vezes com dar a ponta di fio você será capaz de desenrolar o tema sem problemas. ;)

E se talvez baixar e converter tudo para string e filtrar ? a saida.

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

LANÇAMENTO!

eletronica2025-popup.jpg


CLIQUE AQUI E BAIXE AGORA MESMO!