Python3讀取UTF-8文件及統(tǒng)計文件行數的方法
更新時間:2015年05月22日 12:12:34 作者:皮蛋
這篇文章主要介紹了Python3讀取UTF-8文件及統(tǒng)計文件行數的方法,涉及Python讀取指定編碼文件的相關技巧,需要的朋友可以參考下
本文實例講述了Python3讀取UTF-8文件及統(tǒng)計文件行數的方法。分享給大家供大家參考。具體實現方法如下:
'''''
Created on Dec 21, 2012
Python 讀取UTF-8文件
統(tǒng)計文件的行數目
@author: liury_lab
'''
# -*- coding: utf-8 -*-
import codecs
# 對較小的文件,最簡單的方法是將文件讀入一個行列表中,
# 然后計算列表的長度即可
count = len(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8').readlines())
print(count)
# 對較大的文件,可循環(huán)計數
count = -1
for count, line in enumerate(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8')):
pass
count += 1
print(count)
# 對于像windows結束標記有'\n'的,還可以有如下辦法:
count = 0
the_file = codecs.open('d:/FreakOut.cpp', 'rb', 'utf-8')
while (True):
buffer = the_file.read(8192*1024)
if not buffer:
break
count += buffer.count('\n')
count += 1
the_file.close()
print(count)
希望本文所述對大家的Python程序設計有所幫助。
相關文章
python datatable庫大型數據集和多核數據處理使用探索
這篇文章主要介紹了python datatable庫大型數據集和多核數據處理使用探索,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-01-01
Pycharm配置導入torch報錯Traceback的問題及解決
這篇文章主要介紹了Pycharm配置導入torch報錯Traceback的問題及解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-12-12
Django1.7+python 2.78+pycharm配置mysql數據庫教程
原本感覺在Django1.7+python 2.78+pycharm環(huán)境下配置mysql數據庫是件很容易的事情,結果具體操作的時候才發(fā)現,問題還是挺多的,這里記錄一下最終的配置結果,給需要的小伙伴參考下吧2014-11-11
如何用Python Beautiful?Soup解析HTML內容
Beautiful Soup是一種Python的解析庫,主要用于解析和處理HTML/XML內容,詳細介紹Beautiful Soup的使用方式和應用場景,本文給大家介紹的非常詳細,需要的朋友可以參考下2023-05-05

