Python?查看數(shù)據(jù)類型與格式
Python查看數(shù)據(jù)類型與格式
一般我們拿到一個數(shù)據(jù),會先看一下這個數(shù)據(jù)有多少行多少列,各個字段是什么,數(shù)據(jù)格式類型是什么。在開始講數(shù)據(jù)格式前,需要先梳理一下各個數(shù)據(jù)類型。
我們常使用的庫一般是numpy和pandas,Numpy下的核心是數(shù)組(array,ndarray),Pandas下的核心是數(shù)據(jù)框(Series,DataFrame)
先隨機(jī)創(chuàng)一點數(shù)據(jù)用來測試
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randint(5,10,size=(10,2)),columns=['a','b']) Array=np.random.randint(5,10,size=(10,2)) #假設(shè)我們不知道df和Array是什么數(shù)據(jù)類型
查看現(xiàn)有的數(shù)據(jù)是數(shù)據(jù)框類型還是數(shù)組矩陣類型
語法:type(XXX),適用于tuple/list/array/ndarray/Series/Dataframe
print(type(df)) #輸出 class 'pandas.core.frame.DataFrame'這是DataFrame類型的數(shù)據(jù) print(type(Array)) #輸出class 'numpy.ndarray'這是多維數(shù)組 print(type(tuple(Array))) #輸出'tuple'這是元組 print(type(list(df['a']))) #輸出'class list'這是一個list類型
查看數(shù)據(jù)格式是字符串還是數(shù)字格式
這里需要區(qū)分一下Numpy和Pandas的查看方式略有不同,一個是dtype,一個是dtypes
print(Array.dtype) #輸出int64 print(df.dtypes) #輸出Df下所有列的數(shù)據(jù)格式 a:int64,b:int64
Python數(shù)據(jù)類型bytes
1 bytes類型的特性
Python 3.x之后,Python自帶字符默認(rèn)使用utf-8格式編碼和顯示
- Python默認(rèn)字符串string數(shù)據(jù)類型是utf-8顯示形式的序列
- bytes數(shù)據(jù)類型是utf-8格式的二進(jìn)制形式的不可變序列
- bytearray數(shù)據(jù)類型是utf-8格式的二進(jìn)制形式的可變序列
1.1 ASCII表

2 bytes類型創(chuàng)建與轉(zhuǎn)化
2.1 bytes類型與數(shù)字
數(shù)字類型并不是字符串,無法直接生成對應(yīng)的bytes類
Python對數(shù)字類型定義了特殊意義
① 當(dāng)入?yún)閿?shù)字時,表示創(chuàng)建nul(\x00)的向量
byte_str = bytes(10) print(byte_str) >>> b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'
② 當(dāng)入?yún)閿?shù)字的序列時,直接轉(zhuǎn)為bytes的序列,且對應(yīng)值相同,將數(shù)字序列直接寫入底層應(yīng)該使用這種方法
byte_str = bytes([1, 10, 0xF]) print(byte_str) >>> b'\x00\x10\x0f'
③ 當(dāng)二進(jìn)制數(shù)據(jù)在[33, 126]區(qū)間時,屬于ASCII表上可顯示字符范圍,會直接顯示對應(yīng)的字符
數(shù)字直接使用bytes創(chuàng)建
byte_str = bytes([33, 48, 126]) print(byte_str) >>> b'!0~'
2.2 bytes類型與ASCII字符
2.2.1 創(chuàng)建bytes數(shù)據(jù)
① 使用b''創(chuàng)建
byte_str = b'Python' print(byte_str) >>> b'Python'
② 使用bytes()創(chuàng)建不可變序列
byte_str = bytes('Python', encoding='utf-8')
print(byte_str)
>>> b'Python'③ 使用bytearray()創(chuàng)建可變序列
byte_str = bytearray('Python', encoding='utf-8')
print(byte_str)
>>> bytearray(b'Python')2.2.2 還原bytes數(shù)據(jù)
① 使用bytes.decode()還原不可變序列
byte_str = bytes('Python', encoding='utf-8')
utf_str = bytes.decode(byte_str)
print(utf_str)
>>> 'Python'② 使用bytearray.decode()還原可變序列
byte_str = bytearray('Python', encoding='utf-8')
utf_str = bytearray.decode(byte_str)
print(utf_str)
>>> 'Python'2.3 bytes類型與漢字
在UTF-8中,每個漢字用3個Byte表示
byte_str = bytes('我是', encoding='utf-8')
print(byte_str)
>>> b'\xe6\x88\x91\xe6\x98\xaf'還原:
byte_str = b'\xe6\x88\x91\xe6\x98\xaf' utf_str = bytes.decode(byte_str) print(utf_str) >>> '我是'
3 bytes類型切片迭代
① 通過bytes[index]方式返回的是底層int類型
byte_str = b'a' print(type(byte_str[0])) print(byte_str[0]) >>> <class 'int'> >>> 97
byte_str = b'abc' print(type(byte_str[2])) print(byte_str[2]) >>> <class 'int'> >>> 99
② 通過for ... in bytes方式返回的是底層int類型
byte_str = b'abc' for byte in byte_str: ? ? print(type(byte)) ? ? print(byte) ? ?? >>> <class 'int'> >>> 97 >>> <class 'int'> >>> 98 >>> <class 'int'> >>> 99
③ 通過bytes[start:end]方式返回的是底層bytes類型
byte_str = b'a' print(type(byte_str[:])) print(byte_str[:]) >>> <class 'bytes'> >>> b'a'
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
windows下python安裝paramiko模塊和pycrypto模塊(簡單三步)
這篇文章主要給大家介紹了通過簡單的三個步驟在windows下python中安裝paramiko模塊和pycrypto模塊的相關(guān)資料,文中安裝的步驟,簡單而且又易于大家理解,需要的朋友們下面跟著小編一起來學(xué)習(xí)學(xué)習(xí)吧。2017-07-07
在dataframe兩列日期相減并且得到具體的月數(shù)實例
今天小編就為大家分享一篇在dataframe兩列日期相減并且得到具體的月數(shù)實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07
Python實現(xiàn)url長短鏈接的轉(zhuǎn)換
短鏈接,通俗來說,就是將長的URL網(wǎng)址,通過程序計算等方式,轉(zhuǎn)換為簡短的網(wǎng)址字符串。本文將用Python語言實現(xiàn)這一效果,需要的可以參考一下2022-11-11

