Java輕量級類隔離框架 SOFAArk Project v2.3.042.5MB / 01-19
SpringBlade微服務開發(fā)平臺 v4.4.0197KB / 01-30
Diboot輕代碼開發(fā)平臺 v2.11.01.3MB / 07-20
RuoYi-activiti工作流平臺源碼 v4.124.79MB / 07-19
RuoYi若依權限管理系統(tǒng) v4.7.94.12MB / 06-28
Java Struts2漏洞復現工具98KB / 06-26
java操作excel的jar包(jxl.jar包 源碼)610KB / 06-26
springboot整合QuartJob實現定時器實時管理源代碼29KB / 06-26
SOFABoot開源框架 v3.24.0587KB / 08-31
基于SSM的應急資源管理系統(tǒng)源碼 v1.080.7MB / 05-25
-
Pinpoint應用性能管理工具 v3.0.2 java源碼 / 18.8MB
-
Presto大數據查詢引擎 v0.292 java源碼 / 10.89MB
-
Spring Boot應用開發(fā)框架 v3.4.4 java源碼 / 5.6MB
-
Spring Boot應用開發(fā)框架 v3.3.10 java源碼 / 6.0MB
-
Zotero文獻管理工具 v7.0.15 java源碼 / 6.8MB
-
Logstash日志管理系統(tǒng) v8.17.4 java源碼 / 18.9MB
-
Mybatis增強工具包(Mybatis plus) v3.5.11 java源碼 / 8.35MB
-
Mall4j商城系統(tǒng) v3.4 java源碼 / 14.2MB
-
Exchangis輕量級數據交換平臺 v1.1.7 java源碼 / 14.2MB
-
ReactNative移動開發(fā)工具 v0.78.1 java源碼 / 12.3MB
詳情介紹
jsoup是一款Java的HTML解析器,可直接解析某個URL地址、HTML文本內容。它提供了一套非常省力的API,可通過DOM,CSS以及類似于JQuery的操作方法來取出和操作數據。
jsoup的主要功能如下:
從一個URL,文件或字符串中解析HTML;
使用DOM或CSS選擇器來查找、取出數據;
可操作HTML元素、屬性、文本;
jsoup是基于MIT協(xié)議發(fā)布的,可放心使用于商業(yè)項目。
更新日志
更改
增加了對 http/2 請求的支持 Jsoup.connect(),當在 Java 11+ 上運行時,通過 Java HttpClient 實現。#2257.
在這個版本的jsoup中,默認是通過HttpUrlConnection實現來發(fā)送請求:使用 System.setProperty("jsoup.useHttpClient", "true");來改為通過HttpClient發(fā)送請求,這將啟用http/2支持(如果可用)。這將在jsoup的以后版本中成為默認設置,所以現在是一個驗證的好時機。
如果你在部署中重新打包jsoup jar(即創(chuàng)建一個遮罩 jar 或胖 jar),請確保將其指定為 Multi-Release JAR。
如果 HttpClient 在您的 JRE 中不可用,請求將繼續(xù)通過 HttpURLConnection 進行 (在 http/1.1 模式下)。
將最低 Android API 級別驗證從 10 更新到 21。與之前的 jsoup 版本一樣,Android 開發(fā)者需要啟用核心庫 desugaring。最低 Java 版本仍然是 Java 8。 #2173
移除了之前已棄用的類:org.jsoup.UncheckedIOException (用java.io.UncheckedIOException替換); 將之前已棄用的方法Element Element#forEach(Consumer) 移動到 void Element#forEach(Consumer())。#2246
已棄用方法Document#updateMetaCharsetElement(boolean)和Document#updateMetaCharsetElement(),因為該設置沒有效果。當Document#charset(Charset)被調用時,文檔的meta charset或XML編碼指令總是會被設置。#2247
改進
當使用一個Safelist來清理HTML并保持相對鏈接時,isValid()方法現在會認為這些鏈接有效。此外,強制屬性rel=nofollow只有在安全列表中配置時才會添加到外部鏈接。#2245
添加了 Element#selectStream(String query) 和 Element#selectStream(Evaluator) 方法,這些方法返回一個 Stream 匹配元素的列表。元素在找到時會被評估并返回,且流可以提前終止。#2092
Element 對象現在實現了 Iterable,使它們能夠在增強的 for 循環(huán)中使用。
增加了從 Reader解析片段的支持 Parser#parseFragmentInput(Reader, Element, String)。#1177
重新引入 CLI 可執(zhí)行文件示例,在 jsoup-examples.jar。 #1702
通過更好地平衡查詢計劃器中祖先評估器的成本函數,優(yōu)化了選擇器的性能,如#id .class(和其他類似的后代查詢)提高了約4.6倍。#2254
移除了用于<isindex>標簽的遺留解析規(guī)則,這些規(guī)則會自動創(chuàng)建一個帶有標簽的form元素。這不再在規(guī)范中。
添加了 Elements.selectFirst(String cssQuery) 和 Elements.expectFirst(String cssQuery),以從 Elements 列表中選擇第一個匹配的元素。 #2263
在使用XML解析器解析時,XML聲明和處理指令是直接處理的,而不是通過HTML解析器的假注釋處理程序。非文檔類型聲明的序列化不再以虛假的!。#2275
在將解析的HTML轉換為XML或W3C DOM時,包含<的元素名稱被規(guī)范為_,以確保有效的XML。例如,<foo<bar>變成<foo_bar>,因為XML不允許<在元素名稱中,但HTML5允許。#2276
實現了當前規(guī)范的HTML5采用機構算法。這處理了錯誤嵌套的格式/結構元素。#2278
錯誤修復
如果一個元素的屬性名中包含 ;,則無法轉換為 W3C DOM 元素,因此后續(xù)的 XPath 查詢可能會忽略該元素?,F在,屬性名被更完全地 標準化。#2244
為了兼容性,將文檔類型名稱的內部屬性鍵恢復為“name”。#2241
在Connection中,跳過沒有名字的Cookies,而不是拋出驗證異常。#2242
在運行于 JDK 1.8 時,錯誤java.lang.NoSuchMethodError: java.nio.ByteBuffer.flip()Ljava/nio/ByteBuffer; 可能在從 URL 解析后調用Response#body()且緩沖區(qū)大小被超過時拋出。#2250
為了向后兼容,允許null InputStream 輸入到Jsoup.parse(InputStream stream, ...),通過返回一個空的Document。#2252
一個 template 標簽包含一個 li 在一個打開的 li 標簽內,會被解析錯誤,因為它沒有被識別為一個 “特殊” 標簽(具有額外的處理規(guī)則)。另外,將 SVG 和 MathML 命名空間標簽添加到特殊標簽列表中。#2258
一個 template 標簽包含一個 button 在一個打開的 button 標簽內,解析會不正確,因為“在按鈕作用域”檢查沒有意識到 template 元素。修正了其他實例,包括 MathML 和 SVG 元素。#2271
一個:nth-child選擇器的步長為負且沒有數字,例如:nth-child(-n+2),會被解析為一個正步長,因此不會如預期那樣匹配。#1147
調用 doc.charset(charset) 在一個空的XML文檔上會拋出一個 IndexOutOfBoundsException. #2266
修復了在重用嵌套時的內存泄漏StructuralEvaluator(例如,選擇器祖先鏈如A B C)通過確保緩存重置調用傳遞到內部成員。#2277
對doc.clone().append(html)的并發(fā)調用不被支持。當克隆一個文檔時,它的Parser沒有被克隆,而是原始解析器的淺拷貝。#2281
下載地址
人氣源碼
相關文章
-
Java輕量級類隔離框架 SOFAArk Project v2.3.0SOFAArk 是一款基于 Java 實現的動態(tài)熱部署和輕量級類隔離框架,由螞蟻集團開源貢獻,主要提供應用模塊的動態(tài)熱部署和類隔離能力。歡迎需要的朋友下載使用...
-
SpringBlade微服務開發(fā)平臺 v4.4.0SpringBlade 是一個由商業(yè)級項目升級優(yōu)化而來的SpringCloud分布式微服務架構、SpringBoot單體式微服務架構并存的綜合型項目,采用Java8 API重構了業(yè)務代碼,完全遵循阿里巴...
-
Diboot輕代碼開發(fā)平臺 v2.11.0Diboot輕代碼開發(fā)平臺是一個面向開發(fā)人員的低代碼開發(fā)平臺,將重復性的工作自動化,提高質量、效率、可維護性...
-
RuoYi-activiti工作流平臺源碼 v4.1RuoYi-activiti是一款以若依開源權限管理系統(tǒng)為基礎開發(fā)平臺并集成了activiti框架完成的工作流系統(tǒng),旨在打造集流程設計、流程部署、流程執(zhí)行、任務辦理、流程監(jiān)控于一體的...
-
RuoYi若依權限管理系統(tǒng) v4.7.9RuoYi若依權限管理系統(tǒng)是一個基于SpringBoot的權限管理系統(tǒng),代碼易讀易懂、界面簡潔美觀, 核心技術采用Spring、MyBatis、Shiro沒有任何其它重度依賴,喜歡的朋友快來下載...
-
Java Struts2漏洞復現工具今天給大家分享Java Struts2漏洞復現工具,喜歡的朋友快來下載體驗吧...
-
java操作excel的jar包(jxl.jar包 源碼)jxl.jar是通過java操作excel表格的工具類庫,能夠修飾單元格屬性,是由java語言開發(fā)而成的,接下來通過本文給大家介紹java操作excel的jar包(jxl.jar包 源碼),喜歡的朋友快...
-
springboot整合QuartJob實現定時器實時管理源代碼Quartz是一個完全由java編寫的開源作業(yè)調度框架,形式簡易,功能強大,,下面給大家分享springboot整合QuartJob實現定時器實時管理源代碼,感興趣的朋友快來下載體驗吧...
-
SOFABoot開源框架 v3.24.0SOFABoot 是螞蟻集團開源的基于 Spring Boot 的研發(fā)框架,它在 Spring Boot 的基礎上,提供了諸如 Readiness Check,上下文隔離,類隔離,日志空間隔離等等能力...
-
基于SSM的應急資源管理系統(tǒng)源碼 v1.0應急資源管理系統(tǒng)用的是是比較流行的SSM和前端JSP技術,用它來創(chuàng)建使用腳本語言,結合HTML代碼來制作動態(tài) 網頁,歡迎需要的朋友下載使用...
下載聲明
☉ 解壓密碼:www.dhdzp.com 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復,謝謝!
☉ 下載本站資源,如果服務器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學習研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的jsoup HTML解析器 v1.20.1資源來源互聯網,版權歸該下載資源的合法擁有者所有。










