使用jsoup解析html的table中的文本信息實(shí)例
jsoup是一個(gè)非常好用的html解析工具。使用時(shí)需要下載相應(yīng)的jar包。
下面就是我使用jsoup解析html的表格的java源代碼。
親測(cè)可用!
public void parse(){
String htmlStr = "<table id=kbtable >"
+ "<tr> "
+ "<td width=123>"
+ "<div id=12>這里是要獲取的數(shù)據(jù)1</div>"
+ "<div id=13>這里是要獲取的數(shù)據(jù)2</div>"
+ "</td>"
+ "<td width=123>"
+ "<div id=12>這里是要獲取的數(shù)據(jù)3</div>"
+ "<div id=13>這里是要獲取的數(shù)據(jù)4</div>"
+ "</td> "
+ "</tr>"
+ "</table>";
Document doc = Jsoup.parse(htmlStr);
// 根據(jù)id獲取table
Element table = doc.getElementById("kbtable");
// 使用選擇器選擇該table內(nèi)所有的<tr> <tr/>
Elements trs = table.select("tr");
//遍歷該表格內(nèi)的所有的<tr> <tr/>
for (int i = 0; i < trs.size(); ++i) {
// 獲取一個(gè)tr
Element tr = trs.get(i);
// 獲取該行的所有td節(jié)點(diǎn)
Elements tds = tr.select("td");
// 選擇某一個(gè)td節(jié)點(diǎn)
for (int j = 0; j < tds.size(); ++j) {
Element td = tds.get(j);
// 獲取td節(jié)點(diǎn)的所有div
Elements divs = td.select("div");
// 選擇一個(gè)div
for (int k = 0; k < divs.size(); k++) {
Element div = divs.get(k);
//獲取文本信息
String text = div.text();
//輸出到控制臺(tái)
System.out.println(text);
}
}
}
}
以上這篇使用jsoup解析html的table中的文本信息實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Java Springboot之Spring家族的技術(shù)體系
今天帶大家來學(xué)習(xí)Spring家族的技術(shù)體系,文中有非常詳細(xì)的圖文介紹及代碼示例,對(duì)正在學(xué)習(xí)java的小伙伴們很有幫助,需要的朋友可以參考下2021-05-05
java通過jacob實(shí)現(xiàn)office在線預(yù)覽功能
這篇文章主要為大家詳細(xì)介紹了java通過jacob實(shí)現(xiàn)office在線預(yù)覽功能,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-08-08
Java使用組件編寫窗口實(shí)現(xiàn)網(wǎng)上文件下載
這篇文章主要為大家詳細(xì)介紹了Java使用組件編寫窗口實(shí)現(xiàn)網(wǎng)上文件下載的相關(guān)資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-02-02
Spring RestTemplate使用方法示例總結(jié)
這篇文章主要介紹了Spring RestTemplate使用方法示例總結(jié),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),感興趣的朋友一起看看吧2025-04-04
java如何通過Kerberos認(rèn)證方式連接hive
該文主要介紹了如何在數(shù)據(jù)源管理功能中適配不同數(shù)據(jù)源(如MySQL、PostgreSQL和Hive),特別是如何在SpringBoot3框架下通過Kerberos認(rèn)證與Hive進(jìn)行安全交互,文章詳細(xì)描述了Kerberos認(rèn)證過程,包括配置krb5.conf和keytab文件、處理Hadoop和Hive版本兼容性問題2025-02-02
IDEA啟動(dòng)tomcat項(xiàng)目報(bào)錯(cuò)53820 socket closed問題及解決
IDEA啟動(dòng)Tomcat項(xiàng)目時(shí)報(bào)錯(cuò),原因是IDEA關(guān)閉時(shí)Tomcat未正常關(guān)閉,導(dǎo)致端口被占用,解決方法是通過任務(wù)管理器關(guān)閉占用高內(nèi)存的Java進(jìn)程,通常是IDEA進(jìn)程下面的,或者使用命令行找到PID并強(qiáng)制終止進(jìn)程2024-12-12

