Java使用Apache POI庫讀取Excel表格文檔的示例
Apache POI 是用Java編寫的免費開源的跨平臺的 Java API,Apache POI提供API給Java程式對Microsoft Office格式檔案讀和寫的功能。
項目下載頁:http://poi.apache.org/download.html
Apache POI 是創(chuàng)建和維護(hù)操作各種符合Office Open XML(OOXML)標(biāo)準(zhǔn)和微軟的OLE 2復(fù)合文檔格式(OLE2)的Java API。用它可以使用Java讀取和創(chuàng)建,修改MS Excel文件.而且,還可以使用Java讀取和創(chuàng)建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解決方案。
- HSSF - 提供讀寫Microsoft Excel XLS格式檔案的功能。
- XSSF - 提供讀寫Microsoft Excel OOXML XLSX格式檔案的功能。
- HWPF - 提供讀寫Microsoft Word DOC格式檔案的功能。
- HSLF - 提供讀寫Microsoft PowerPoint格式檔案的功能。
- HDGF - 提供讀Microsoft Visio格式檔案的功能。
- HPBF - 提供讀Microsoft Publisher格式檔案的功能。
- HSMF - 提供讀Microsoft Outlook格式檔案的功能。
讀取Excel文檔示例
我們使用POI中的HSSFWorkbook來讀取Excel數(shù)據(jù)。
public void test(File file) throws IOException {
InputStream inp = new FileInputStream(file);
HSSFWorkbook workbook = new HSSFWorkbook(inp);
// workbook...遍歷操作
}
上邊代碼,讀取Excel2003(xls)的文件沒問題,但是一旦讀取的是Excel2007(xlsx)的文件,就會報異常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)”
查閱了資料,Excel2007版本的Excel文件需要使用XSSFWorkbook來讀取,如下:
public void test(File file) throws IOException {
InputStream inp = new FileInputStream(file);
XSSFWorkbook workbook = new XSSFWorkbook(inp);
// workbook...遍歷操作
}
注意:XSSFWorkbook需要額外導(dǎo)入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。
這樣,Excel2007的導(dǎo)入沒問題了,但是導(dǎo)入Excel2003又報異常。
所以,在導(dǎo)入Excel的時候,盡量能判斷導(dǎo)入Excel的版本,調(diào)用不同的方法。
我想到過使用文件后綴名來判斷類型,但是如果有人將xlsx的后綴改為xls時,如果使用xlsx的函數(shù)來讀取,結(jié)果是報錯;雖然后綴名對了,但是文件內(nèi)容編碼等都不對。
最后,推薦使用poi-ooxml中的WorkbookFactory.create(inputStream)來創(chuàng)建Workbook,因為HSSFWorkbook和XSSFWorkbook都實現(xiàn)了Workbook接口。代碼如下:
Workbook wb = WorkbookFactory.create(is);
可想而知,在WorkbookFactory.create()函數(shù)中,肯定有做過對文件類型的判斷,一起來看一下源碼是如何判斷的:
/**
* Creates the appropriate HSSFWorkbook / XSSFWorkbook from
* the given InputStream.
* Your input stream MUST either support mark/reset, or
* be wrapped as a {@link PushbackInputStream}!
*/
public static Workbook create(InputStream inp) throws IOException, InvalidFormatException {
// If clearly doesn't do mark/reset, wrap up
if(! inp.markSupported()) {
inp = new PushbackInputStream(inp, 8);
}
if(POIFSFileSystem.hasPOIFSHeader(inp)) {
return new HSSFWorkbook(inp);
}
if(POIXMLDocument.hasOOXMLHeader(inp)) {
return new XSSFWorkbook(OPCPackage.open(inp));
}
throw new IllegalArgumentException("Your InputStream was neither an OLE2 stream, nor an OOXML stream");
}
可以看到,有根據(jù)文件類型來分別創(chuàng)建合適的Workbook對象。是根據(jù)文件的頭部信息去比對進(jìn)行判斷的,此時,就算改了后綴名,還是一樣通不過。
相關(guān)文章
Java整型數(shù)與網(wǎng)絡(luò)字節(jié)序byte[]數(shù)組轉(zhuǎn)換關(guān)系詳解
這篇文章主要介紹了Java整型數(shù)與網(wǎng)絡(luò)字節(jié)序byte[]數(shù)組轉(zhuǎn)換關(guān)系,結(jié)合實例形式歸納整理了java整型數(shù)和網(wǎng)絡(luò)字節(jié)序的byte[]之間轉(zhuǎn)換的各種情況,需要的朋友可以參考下2017-08-08
SpringBoot?整合?ElasticSearch操作各種高級查詢搜索
這篇文章主要介紹了SpringBoot?整合?ES?進(jìn)行各種高級查詢搜索的實踐記錄,本文主要圍繞?SpringBoot?整合?ElasticSearch?進(jìn)行各種高級查詢的介紹,需要的朋友可以參考下2022-06-06
Java使用RandomAccessFile類對文件進(jìn)行讀寫
本篇文章主要介紹了Java使用RandomAccessFile類對文件進(jìn)行讀寫,詳細(xì)的介紹了RandomAccessFile類的使用技巧和實例應(yīng)用,有興趣的可以了解一下2017-04-04

