關于使用OpenCsv導入大數(shù)據(jù)量報錯的問題
導入100W的Csv數(shù)據(jù),使用OpenCsv解析工具解析Csv,發(fā)現(xiàn)報錯
報錯內(nèi)容
com.opencsv.exceptions.CsvMalformedLineException: Unterminated quoted field at end of CSV line. Beginning of lost text: [XXXXX...]
at com.opencsv.CSVReader.readNext(CSVReader.java:355) ~[opencsv-4.6.jar!/:na]
解析代碼
CSVParser csvParser = new CSVParserBuilder().build();
try (CSVReader readerCsv = new CSVReaderBuilder(new InputStreamReader(csv)).withCSVParser(csvParser).build()) {
String[] lines;
while ((lines = readerCsv.readNext()) != null) {
doRead(lines);
}
} catch (CsvValidationException e) {
throw new IOException(e);
}
報錯位置發(fā)生在英文逗號處,一開始懷疑是英文逗號解析問題
Csv 文本報錯位置
"2018-04-28 00:40:43","xxx,XXXXX"
去掉當前位置英文逗號導入仍舊失敗
后來查看源碼發(fā)現(xiàn)默認的 CSVParser 會對反斜杠""進行處理

這導致了解析Csv邏輯與源文件不同
后來使用了 RFC4180Parser 問題解決
RFC4180Parser rfc4180Parser = new RFC4180ParserBuilder().build();
try (CSVReader readerCsv = new CSVReaderBuilder(new InputStreamReader(csv)).withCSVParser(rfc4180Parser).build()) {
String[] lines;
while ((lines = readerCsv.readNext()) != null) {
doRead(lines);
}
} catch (CsvValidationException e) {
throw new IOException(e);
}
參考文檔:(RFC4180標準文檔)https://datatracker.ietf.org/doc/html/rfc4180
到此這篇關于使用OpenCsv導入大數(shù)據(jù)量報錯的問題 的文章就介紹到這了,更多相關OpenCsv導入大數(shù)據(jù)量報錯內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python導入csv文件出現(xiàn)SyntaxError問題分析
這篇文章主要介紹了python導入csv文件出現(xiàn)SyntaxError問題分析,同時涉及python導入csv文件的三種方法,具有一定借鑒價值,需要的朋友可以參考下。2017-12-12
Python數(shù)據(jù)分析與處理(一)--北京高考分數(shù)線統(tǒng)計分析
這篇文章主要介紹了Python數(shù)據(jù)分析與處理北京高考分數(shù)線統(tǒng)計分析,文章問繞Python數(shù)據(jù)分析與處理相關資料的介紹,展開對北京高考分數(shù)線統(tǒng)計分析,需要的小伙伴可以參考一下2021-12-12
使用Python編程分析火爆全網(wǎng)的魷魚游戲豆瓣影評
本文來為大家介紹如何使用Python爬取影評的操作,主要是爬取《魷魚游戲》在豆瓣上的一些影評,對數(shù)據(jù)做一些簡單的分析,用數(shù)據(jù)的角度重新審視下這部劇,有需要的朋友可以借鑒參考下2021-10-10

