xml 的特殊字符的處理方法
遇到這一方面的問題是因為我試圖把一個對象序列化之后存貯到xml文件中,然后從xml文件中讀取字符串,并反序列化對象(hadoop mapreduce程序中通過JobConf向tasktracker傳送對象)。
有關序列化:
當我把序列化之后的數(shù)據(jù)直接存在xml中后,在解析xml時遇到解析錯誤,原因是有非法字符。在詳細閱讀xml的說明之后才發(fā)現(xiàn):< > ' " &是不允許作為xml的PCDATA的。要使用這幾個字符,必須要把他們替換為內(nèi)建實體:
實體引用 字符
< <
> >
& &
" "
' '
所以,最直接的方法就是自己控制,在寫入xml文件時把特殊字符轉(zhuǎn)為實體引用,在讀取的時候,再轉(zhuǎn)回來。當然還有另外一個方法就是不把字符串當PCDATA,而是當成CDATA來使用(沒有測試)。
用實體引用的方法太麻煩,而我的應用xml的格式不能自己規(guī)定,所以只好尋找另外的方法:BASE64編碼。這是一種常用在網(wǎng)絡傳輸數(shù)據(jù)的編碼方式。把存在這些非法字符的字符編碼成base64編碼,就不會有這些字符了。最重要的是java api中提供了這種編碼的編碼器和解碼器,位于sun.misc的BASE64Encoder和BASE64Decoder。這樣就可以把序列化之后得到的字節(jié)流轉(zhuǎn)化成字符串了。并且也可以存貯在xml文件中。
不過這兩個類并不是sun的開放api,編譯會有警告。
相關文章
java常見報錯:Array?Out?of?Bounds兩種解決辦法
這篇文章主要給大家介紹了關于java報錯Array?Out?of?Bounds的兩種解決辦法,Array out of bounds錯誤表示你嘗試訪問數(shù)組中不存在的索引,即索引小于零或者大于等于數(shù)組的大小,文中通過代碼將解決的辦法介紹的非常詳細,需要的朋友可以參考下2024-08-08
JDK1.7 Paths,Files類實現(xiàn)文件夾的復制與刪除的實例
下面小編就為大家分享一篇JDK1.7 Paths,Files類實現(xiàn)文件夾的復制與刪除的實例,具有很好的參考價值,希望對大家有所幫助。以前跟隨小編過來看看吧2017-11-11
springboot中使用Feign整合nacos,gateway進行微服務之間的調(diào)用方法
這篇文章主要介紹了springboot中使用Feign整合nacos,gateway進行微服務之間的調(diào)用方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-03-03
springboot~ObjectMapper~dto到entity的自動賦值
這篇文章主要介紹了springboot~ObjectMapper~dto到entity的自動賦值,本文分三種情況給大家介紹,需要的朋友可以參考下2018-08-08
java selenium教程環(huán)境搭建基于Maven
本文主要介紹Java selenium 環(huán)境的安裝,這里介紹了基于Maven的環(huán)境搭建,有需要的小伙伴可以參考下2016-08-08

