pytorch geometric的GNN、GCN的節(jié)點分類方式

更新時間：2022年12月17日 09:49:06 作者：zhangztSky

這篇文章主要介紹了pytorch geometric的GNN、GCN的節(jié)點分類方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教

pytorch geometric的GNN、GCN節(jié)點分類

# -*- coding: utf-8 -*-

import os
import torch
import torch.nn.functional as F
import torch.nn as nn
from torch_geometric.datasets import Planetoid
import torch_geometric.nn as pyg_nn
import torch_geometric.transforms as T


# load dataset
def get_data(folder="node_classify/cora", data_name="cora"):
    # dataset = Planetoid(root=folder, name=data_name)
    dataset = Planetoid(root=folder, name=data_name,
                        transform=T.NormalizeFeatures())
    return dataset


# create the graph cnn model
class GraphCNN(nn.Module):
    def __init__(self, in_c, hid_c, out_c):
        super(GraphCNN, self).__init__()
        self.conv1 = pyg_nn.GCNConv(in_channels=in_c, out_channels=hid_c)
        self.conv2 = pyg_nn.GCNConv(in_channels=hid_c, out_channels=out_c)

    def forward(self, data):
        # data.x data.edge_index
        x = data.x  # [N, C]
        edge_index = data.edge_index  # [2 ,E]

        hid = self.conv1(x=x, edge_index=edge_index)  # [N, D]
        hid = F.relu(hid)

        out = self.conv2(x=hid, edge_index=edge_index)  # [N, out_c]

        out = F.log_softmax(out, dim=1)  # [N, out_c]

        return out


class OwnGCN(nn.Module):
    def __init__(self, in_c, hid_c, out_c):
        super(OwnGCN, self).__init__()
        self.in_ = pyg_nn.SGConv(in_c, hid_c, K=2)

        self.conv1 = pyg_nn.APPNP(K=2, alpha=0.1)
        self.conv2 = pyg_nn.APPNP(K=2, alpha=0.1)

        self.out_ = pyg_nn.SGConv(hid_c, out_c, K=2)

    def forward(self, data):
        x, edge_index = data.x, data.edge_index

        x = self.in_(x, edge_index)
        x = F.dropout(x, p=0.1, training=self.training)

        x = F.relu(self.conv1(x, edge_index))
        x = F.dropout(x, p=0.1, training=self.training)

        x = F.relu(self.conv2(x, edge_index))
        x = F.dropout(x, p=0.1, training=self.training)

        x = self.out_(x, edge_index)

        return F.log_softmax(x, dim=1)


# todo list
class YourOwnGCN(nn.Module):
    pass


def analysis_data(dataset):
    print("Basic Info:      ", dataset[0])
    print("# Nodes:         ", dataset[0].num_nodes)
    print("# Features:      ", dataset[0].num_features)
    print("# Edges:         ", dataset[0].num_edges)
    print("# Classes:       ", dataset.num_classes)
    print("# Train samples: ", dataset[0].train_mask.sum().item())
    print("# Valid samples: ", dataset[0].val_mask.sum().item())
    print("# Test samples:  ", dataset[0].test_mask.sum().item())
    print("Undirected:      ", dataset[0].is_undirected())


def main():
    os.environ["CUDA_VISIBLE_DEVICES"] = "0"
    cora_dataset = get_data()

    # todo list
    # my_net = GraphCNN(in_c=cora_dataset.num_features, hid_c=150, out_c=cora_dataset.num_classes)
    my_net = OwnGCN(in_c=cora_dataset.num_features, hid_c=300, out_c=cora_dataset.num_classes)

    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

    my_net = my_net.to(device)
    data = cora_dataset[0].to(device)

    optimizer = torch.optim.Adam(my_net.parameters(), lr=1e-2, weight_decay=1e-3)
    """
    # model train
    my_net.train()
    for epoch in range(500):
        optimizer.zero_grad()

        output = my_net(data)
        loss = F.nll_loss(output[data.train_mask], data.y[data.train_mask])
        loss.backward()
        optimizer.step()

        _, prediction = output.max(dim=1)

        valid_correct = prediction[data.val_mask].eq(data.y[data.val_mask]).sum().item()
        valid_number = data.val_mask.sum().item()

        valid_acc = valid_correct / valid_number
        print("Epoch: {:03d}".format(epoch + 1), "Loss: {:.04f}".format(loss.item()),
              "Valid Accuracy:: {:.4f}".format(valid_acc))
    """

    # model test
    my_net = torch.load("node_classify/best.pth")
    my_net.eval()

    _, prediction = my_net(data).max(dim=1)

    target = data.y

    test_correct = prediction[data.test_mask].eq(target[data.test_mask]).sum().item()
    test_number = data.test_mask.sum().item()

    train_correct = prediction[data.train_mask].eq(target[data.train_mask]).sum().item()
    train_number = data.train_mask.sum().item()

    print("==" * 20)

    print("Accuracy of Train Samples: {:.04f}".format(train_correct / train_number))

    print("Accuracy of Test  Samples: {:.04f}".format(test_correct / test_number))


def test_main():
    os.environ["CUDA_VISIBLE_DEVICES"] = "0"

    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

    cora_dataset = get_data()
    data = cora_dataset[0].to(device)

    my_net = torch.load("node_classify/best.pth")

    my_net.eval()
    _, prediction = my_net(data).max(dim=1)

    target = data.y

    test_correct = prediction[data.test_mask].eq(target[data.test_mask]).sum().item()
    test_number = data.test_mask.sum().item()

    train_correct = prediction[data.train_mask].eq(target[data.train_mask]).sum().item()
    train_number = data.train_mask.sum().item()

    print("==" * 20)

    print("Accuracy of Train Samples: {:.04f}".format(train_correct / train_number))

    print("Accuracy of Test  Samples: {:.04f}".format(test_correct / test_number))


if __name__ == '__main__':
    test_main()
    # main()
    # dataset = get_data()
    # analysis_data(dataset)

pytorch下GCN代碼解讀

def main():
    print("hello world")
main()

import os.path as osp
import argparse

import torch
import torch.nn.functional as F
from torch_geometric.datasets import Planetoid
import torch_geometric.transforms as T
from torch_geometric.nn import GCNConv, ChebConv  # noqa

#GCN用于提取圖的特征參數然后用于分類

#數據集初始化部分
parser = argparse.ArgumentParser()
parser.add_argument('--use_gdc', action='store_true',
                    help='Use GDC preprocessing.')
args = parser.parse_args()#是否使用GDC優(yōu)化
dataset = 'CiteSeer'#訓練用的數據集
path = osp.join(osp.dirname(osp.realpath(__file__)), '..', 'data', dataset)#數據集存放位置
dataset = Planetoid(path, dataset, transform=T.NormalizeFeatures())#數據初始化類，其dataset的基類是一個torch.utils.data.Dataset對象
data = dataset[0]#只有一個圖作為訓練數據
#print(data)

#預處理和模型定義
if args.use_gdc:
    gdc = T.GDC(self_loop_weight=1, normalization_in='sym',
                normalization_out='col',
                diffusion_kwargs=dict(method='ppr', alpha=0.05),
                sparsification_kwargs=dict(method='topk', k=128,
                                           dim=0), exact=True)
    data = gdc(data)#圖擴散卷積用于預處理

#搭建模型
class Net(torch.nn.Module):
    #放置參數層(一般為可學習層，不可學習層也可放置，若不放置，則在forward中用functional實現)
    def __init__(self):
        super(Net, self).__init__()#在不覆蓋Module的Init函數的情況下設置Net的init函數
        self.conv1 = GCNConv(dataset.num_features, 16, cached=True,
                             normalize=not args.use_gdc)#第一層GCN卷積運算輸入特征向量大小為num_features輸出大小為16
        #GCNConv的def init需要in_channel和out_channel(卷積核的數量)的參數，并對in_channel和out_channel調用linear函數，而該函數的作用為構建全連接層
        self.conv2 = GCNConv(16, dataset.num_classes, cached=True,
                             normalize=not args.use_gdc)#第二層GCN卷積運算輸入為16(第一層的輸出)輸出為num_class
        # self.conv1 = ChebConv(data.num_features, 16, K=2)
        # self.conv2 = ChebConv(16, data.num_features, K=2)

    #實現模型的功能各個層之間的連接關系(具體實現)
    def forward(self):
        x, edge_index, edge_weight = data.x, data.edge_index, data.edge_attr#賦值data.x特征向量edge_index圖的形狀，edge_attr權重矩陣
        x = F.relu(self.conv1(x, edge_index, edge_weight))#第一層用非線性激活函數relu
        #x,edge_index,edge_weight特征矩陣，鄰接矩陣，權重矩陣組成GCN核心公式
        x = F.dropout(x, training=self.training)#用dropout函數防止過擬合
        x = self.conv2(x, edge_index, edge_weight)#第二層輸出
        return F.log_softmax(x, dim=1)#log_softmax激活函數用于最后一層返回分類結果
#Z=log_softmax(A*RELU(A*X*W0)*W1)A連接關系X特征矩陣W參數矩陣
#得到Z后即可用于分類
#softmax(dim=1)行和為1再取log  x為節(jié)點的embedding

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')#指定設備
model, data = Net().to(device), data.to(device)#copy model,data到device上

#優(yōu)化算法
optimizer = torch.optim.Adam([
    dict(params=model.conv1.parameters(), weight_decay=5e-4),#權重衰減避免過擬合
    dict(params=model.conv2.parameters(), weight_decay=0)#需要優(yōu)化的參數
], lr=0.01)  # Only perform weight-decay on first convolution.
#lr步長因子或者是學習率

#模型訓練
def train():
    model.train()#設置成train模式
    optimizer.zero_grad()#清空所有被優(yōu)化的變量的梯度
    F.nll_loss(model()[data.train_mask], data.y[data.train_mask]).backward()#損失函數訓練參數用于節(jié)點分類
    optimizer.step()#步長
     
@torch.no_grad()#不需要計算梯度，也不進行反向傳播

#測試
def test():
    model.eval()#設置成evaluation模式
    logits, accs = model(), []
    for _, mask in data('train_mask', 'val_mask', 'test_mask'):#mask矩陣，掩膜作用與之相應的部分不會被更新
        pred = logits[mask].max(1)[1]#mask對應點的輸出向量最大值并取序號1
        acc = pred.eq(data.y[mask]).sum().item() / mask.sum().item()#判斷是否相等計算準確度
        accs.append(acc)
    return accs

best_val_acc = test_acc = 0

#執(zhí)行
for epoch in range(1, 201):
    train()
    train_acc, val_acc, tmp_test_acc = test()#訓練準確率，實際輸入的準確率，測試準確率
    if val_acc > best_val_acc:
        best_val_acc = val_acc
        test_acc = tmp_test_acc
    log = 'Epoch: {:03d}, Train: {:.4f}, Val: {:.4f}, Test: {:.4f}'#類型及保留位數
    print(log.format(epoch, train_acc, best_val_acc, test_acc))#輸出格式化函數'''

總結

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python找出9個連續(xù)的空閑端口
這篇文章主要介紹了Python找出9個連續(xù)的空閑端口的方法，感興趣的小伙伴們可以參考一下
2016-02-02
Numpy截取指定范圍內的數據方法
今天小編就為大家分享一篇Numpy截取指定范圍內的數據方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-11-11
Python pass語句作用和Python assert斷言函數的用法
這篇文章主要介紹了Python pass語句作用和Python assert斷言函數的用法,文章內容介紹詳細具有一定的參考價值，需要的小伙伴可以參考一下，希望對你有所幫助
2022-03-03
python實現的按要求生成手機號功能示例
這篇文章主要介紹了python實現的按要求生成手機號功能,涉及Python流程控制、隨機數操作及數學運算相關實現技巧,需要的朋友可以參考下
2019-10-10
python中對信號的處理詳解
這篇文章主要給大家介紹了關于python中對信號處理的相關資料, 計算機借助信號來接收和發(fā)送各種命令,操作系統(tǒng)針對其編程要接收或生成的每種命令列出了至少一個信號,需要的朋友可以參考下
2021-07-07
Django靜態(tài)文件加載失敗解決方案
這篇文章主要介紹了Django靜態(tài)文件加載失敗解決方案,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-08-08
Python實現設計模式之單例模式詳解
這篇文章主要介紹了Python實現設計模式之單例模式詳解,設計模式是指軟件設計問題的推薦方案,設計模式一般是描述如何組織代碼和使用最佳實踐來解決常見的設計問題,需謹記一點:設計模式是高層次的方案,并不關注具體的實現細節(jié),比如算法和數據結構,需要的朋友可以參考下
2023-09-09
python?包之?re?正則匹配教程分享
這篇文章主要介紹了python?包之?re?正則匹配教程分享，文章基于python?包?re的相關資料展開貴主題的詳細介紹，需要的小伙伴可以參考一下
2022-04-04
python機器學習理論與實戰(zhàn)(四）邏輯回歸
這篇文章主要為大家詳細介紹了python機器學習理論與實戰(zhàn)第四篇，邏輯回歸的相關資料，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-01-01
一文帶你搞懂Python上下文管理器
這篇文章主要為大家介紹了Python上下文管理器，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2021-12-12