Boa noite, tudo joia?
Então, sou bem novata na área de programação, e estou tendo dificuldades em uma questão.
Objetivo: a partir de uma URL obtenha o trecho de texto contido no nível mais profundo da estrutura HTML de seu conteúdo usando Java JDK17.
Não pode usar bibliotecas e frameworks externos ao JDK. Também não é permitido o uso de packages e classes nativos do JDK relacionados à manipulação de HTML, XML ou DOM
Estou tento dificuldades para dar inicio, queria algumas dicas de como achar conteúdo sobre html + java, e também queria um norte para começar o meu código.
Desde já, obrigada a todos!
Por enquanto, consegui ler e imprimir o conteúdo de uma url. Mas ainda preciso fazer a lógica de pegar o o trecho de texto do nivel mais profundo, alguma dica pessoal?
Aqui o código:
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
public class teste {
public static void main(String[] args) {
try {
URL obj = new URL("https://www.google.com/");
HttpURLConnection con = (HttpURLConnection) obj.openConnection();
con.setRequestMethod("GET");
BufferedReader in = new BufferedReader(
new InputStreamReader(
obj.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
} catch (IOException e) {
System.out.println("Erro de leitura");
}
}
}