keras分類模型中的輸入數(shù)據(jù)與標(biāo)簽的維度實(shí)例

更新時(shí)間：2020年07月03日 09:44:03 作者：xytywh

這篇文章主要介紹了keras分類模型中的輸入數(shù)據(jù)與標(biāo)簽的維度實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

在《python深度學(xué)習(xí)》這本書中。

一、21頁(yè)mnist十分類

導(dǎo)入數(shù)據(jù)集
from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

初始數(shù)據(jù)維度：
>>> train_images.shape
(60000, 28, 28)
>>> len(train_labels)
60000
>>> train_labels
array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

數(shù)據(jù)預(yù)處理：
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype('float32') / 255
train_labels = to_categorical(train_labels)
  
之后：
print(train_images, type(train_images), train_images.shape, train_images.dtype)
print(train_labels, type(train_labels), train_labels.shape, train_labels.dtype)
結(jié)果：
[[0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]] <class 'numpy.ndarray'> (60000, 784) float32
[[0. 0. 0. ... 0. 0. 0.]
 [1. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 1. 0.]] <class 'numpy.ndarray'> (60000, 10) float32

二、51頁(yè)IMDB二分類

導(dǎo)入數(shù)據(jù)：

from keras.datasets import imdb (train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)

參數(shù) num_words=10000 的意思是僅保留訓(xùn)練數(shù)據(jù)中前 10 000 個(gè)最常出現(xiàn)的單詞。

train_data和test_data都是numpy.ndarray類型，都是一維的（共25000個(gè)元素，相當(dāng)于25000個(gè)list），其中每個(gè)list代表一條評(píng)論，每個(gè)list中的每個(gè)元素的值范圍在0-9999 ，代表10000個(gè)最常見單詞的每個(gè)單詞的索引，每個(gè)list長(zhǎng)度不一，因?yàn)槊織l評(píng)論的長(zhǎng)度不一，例如train_data中的list最短的為11，最長(zhǎng)的為189。

train_labels和test_labels都是含25000個(gè)元素（元素的值要不0或者1，代表兩類）的list。

數(shù)據(jù)預(yù)處理：

# 將整數(shù)序列編碼為二進(jìn)制矩陣
def vectorize_sequences(sequences, dimension=10000):
 # Create an all-zero matrix of shape (len(sequences), dimension)
 results = np.zeros((len(sequences), dimension))
 for i, sequence in enumerate(sequences):
  results[i, sequence] = 1. # set specific indices of results[i] to 1s
 return results


x_train = vectorize_sequences(train_data)
x_test = vectorize_sequences(test_data)

第一種方式：shape為(25000,)
y_train = np.asarray(train_labels).astype('float32') #就用這種方式就行了
y_test = np.asarray(test_labels).astype('float32')
第二種方式：shape為(25000,1)
y_train = np.asarray(train_labels).astype('float32').reshape(25000, 1)
y_test = np.asarray(test_labels).astype('float32').reshape(25000, 1)
第三種方式：shape為(25000,2)
y_train = to_categorical(train_labels) #變成one-hot向量
y_test = to_categorical(test_labels)

第三種方式，相當(dāng)于把二分類看成了多分類，所以網(wǎng)絡(luò)的結(jié)構(gòu)同時(shí)需要更改，

最后輸出的維度：1->2

最后的激活函數(shù)：sigmoid->softmax

損失函數(shù)：binary_crossentropy->categorical_crossentropy

預(yù)處理之后，train_data和test_data變成了shape為（25000,10000），dtype為float32的ndarray（one-hot向量），train_labels和test_labels變成了shape為（25000，）的一維ndarray，或者（25000,1）的二維ndarray，或者shape為（25000,2）的one-hot向量。

注：

1.sigmoid對(duì)應(yīng)binary_crossentropy，softmax對(duì)應(yīng)categorical_crossentropy

2.網(wǎng)絡(luò)的所有輸入和目標(biāo)都必須是浮點(diǎn)數(shù)張量

補(bǔ)充知識(shí)：keras輸入數(shù)據(jù)的方法：model.fit和model.fit_generator

1.第一種，普通的不用數(shù)據(jù)增強(qiáng)的

from keras.datasets import mnist,cifar10，cifar100
(X_train, y_train), (X_valid, Y_valid) = cifar10.load_data() 
model.fit(X_train, Y_train, batch_size=batch_size, nb_epoch=nb_epoch, shuffle=True,
    verbose=1, validation_data=(X_valid, Y_valid), )

2.第二種，帶數(shù)據(jù)增強(qiáng)的 ImageDataGenerator，可以旋轉(zhuǎn)角度、平移等操作。

from keras.preprocessing.image import ImageDataGenerator
(trainX, trainY), (testX, testY) = cifar100.load_data()
trainX = trainX.astype('float32')
testX = testX.astype('float32')
trainX /= 255.
testX /= 255.
Y_train = np_utils.to_categorical(trainY, nb_classes)
Y_test = np_utils.to_categorical(testY, nb_classes)
generator = ImageDataGenerator(rotation_range=15,
        width_shift_range=5./32,
        height_shift_range=5./32)
generator.fit(trainX, seed=0)
model.fit_generator(generator.flow(trainX, Y_train, batch_size=batch_size),
     steps_per_epoch=len(trainX) // batch_size, epochs=nb_epoch,
     callbacks=callbacks,
     validation_data=(testX, Y_test),
     validation_steps=testX.shape[0] // batch_size, verbose=1)

以上這篇keras分類模型中的輸入數(shù)據(jù)與標(biāo)簽的維度實(shí)例就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章: