ChatGPT平替-ChatGLM環(huán)境搭建與部署運行效果

更新時間：2023年05月05日 12:02:21 作者：Coding的葉子

這篇文章主要介紹了ChatGPT平替-ChatGLM環(huán)境搭建與部署運行,本節(jié)將介紹環(huán)境搭建與基本部署效果，結合實例代碼給大家介紹的非常詳細，需要的朋友可以參考下

ChatGLM-6B 是清華大學團隊推出的一個開源的、支持中英雙語的對話語言模型，基于General Language Model (GLM) 架構，具有62億參數(shù)。結合模型量化技術，用戶可以在消費級的顯卡上進行本地部署（INT4 量化級別下最低只需6GB 顯存）。ChatGLM-6B使用了與ChatGPT 相似的技術，針對中文問答和對話進行了優(yōu)化。經(jīng)過約1T標識符的中英雙語訓練，輔以監(jiān)督微調(diào)、反饋自助、人類反饋強化學習等技術的加持，62億參數(shù)的ChatGLM-6B已經(jīng)能生成相當符合人類偏好的回答。

本節(jié)將介紹環(huán)境搭建與基本部署效果，后續(xù)博文將介紹多用戶調(diào)用部署和模型微調(diào)方法。具體更新請參考《Python從零開始進行AIGC大模型訓練與推理》，地址為“參考資料”。

1 環(huán)境搭建

顯卡驅動、CUDA、CUDNN、Docker、Python等環(huán)境搭建請參考本專欄另一篇博文《Docker AIGC等大模型深度學習環(huán)境搭建（完整詳細版）》，地址為“http://www.dhdzp.com/article/283300.htm”。

1.1 Git lfs安裝

相比于常規(guī)Git，Git Large File Storage (LFS) 主要是用于大文件操作。GitHub的工程一般會有存儲容量限制，因而很多模型文件由于超出容量限制而被作者存儲在類似百度網(wǎng)盤和谷歌網(wǎng)盤上。很多自然語言處理（NLP）、人工智能生成內(nèi)容（AIGC）、計算機視覺（CV）等大模型可在huggingface網(wǎng)站進行下載，其工程比較完整，同時包括模型文件和程序。ChatGLM-6B的Huggingface網(wǎng)站地址為“https://huggingface.co/THUDM/chatglm-6b”。Git lfs更適合這類大文件的上傳更新與下載。

Git lfs安裝命令如下所示：

apt-get update
apt-get install git curl -y#如果已安裝curl，這一步可跳過。
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | bash
apt-get install git-lfs

安裝完成之后，輸入“git lfs env”查看安裝結果，如果提示錯誤“Error: Failed to call git rev-parse --git-dir: exit status 128”，那么需要輸入如下命令。

git init
git lfs install

輸入“git lfs env”的結果如下圖所示。

圖1 git lfs安裝環(huán)境查看結果

1.2 創(chuàng)建Python環(huán)境

這里使用conda創(chuàng)建一個Python 3.9環(huán)境，命令如下所示。

conda create -n chatglm python=3.9 -y
conda activate chatglm

如果conda命令提示錯誤“CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'.”，完整錯誤如下所示，那么可嘗試輸入指令“/bin/bash”解決。這種錯誤主要出現(xiàn)在使用Jupyter Notebook終端。

圖2 conda環(huán)境激活錯誤

1.3 ChatGLM-6B環(huán)境安裝

ChatGLM-6B的Github官方工程地址為“https://github.com/THUDM/ChatGLM-6B”。其環(huán)境安裝命令如下所示：

git clone https://github.com/THUDM/ChatGLM-6B.git
cd ChatGLM-6B
conda activate chatglm
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

2 模型運行

2.1 cli_demo.py

在步驟1.3安裝完成之后，可直接運行cli_demo.py啟動對話程序（python cli_demo.py），如下所示。

圖3 cli_demo.py運行示意圖

2.2 api.py

該文件基于fastapi.py編寫了一個http接口，默認端口號為8000。在服務器上運行該程序后（python api.py），我們即可通過http post調(diào)用模型接口。post數(shù)據(jù)包含prompt和history兩個參數(shù)。Prompt是輸入的問題內(nèi)容。History是歷史問答組成的列表，主要用于進行連續(xù)對話。模型占用顯存大小與prompt和history的字數(shù)之和直接相關。因而，使用時最好對history的內(nèi)容長度進行控制。

Linux可直接用curl進行http請求，格式如下所示。

curl -X POST "http://127.0.0.1:8000" \
     -H 'Content-Type: application/json' \
     -d '{"prompt": "你好", "history": []}'

我們也可以通過Python程序進行http post請求，如下所示。

import json
import requests
headers = {'Content-Type': 'application/json'}
url = 'http://127.0.0.1:8000'
data = {'prompt': '你好', 'history': []}
data = json.dumps(data)
reponse = requests.post(url=url, data=data, headers=headers)
print(reponse .text)

http請求返回的內(nèi)容包括response、history、status和time，其中response存儲了直接結果，如下所示。

{"response":"你好！我是人工智能助手 ChatGLM-6B，很高興見到你，歡迎問我任何問題。","history":[["你好","你好！我是人工智能助手 ChatGLM-6B，很高興見到你，歡迎問我任何問題。"]],"status":200,"time":"2023-04-25 00:10:40"}

目前，多個用戶調(diào)用該api時，將排隊獲取結果，即模型一次只能處理一個請求，多用戶將根據(jù)調(diào)用先后順序來獲取結果。另一方面，api接口當前不支持流式輸出，回答內(nèi)容較多時等待時間較長。下一篇博文將介紹如何實現(xiàn)多用戶同時調(diào)用以及采用流式輸出，預計本周更新。

2.3 web_demo.py

該程序是基于gradio編寫的web服務器，并提供前端訪問頁面，可通過瀏覽器進行訪問。程序第一次運行前需要通過pip安裝gradio，即“pip install gradio”。

程序會運行（python web_demo.py）一個Web Server，并輸出地址，默認端口號為7860，如“http://127.0.0.1:7860”。在瀏覽器中打開輸出的地址即可使用。最新版Demo實現(xiàn)了打字機效果，速度體驗大大提升。注意，由于國內(nèi)Gradio的網(wǎng)絡訪問較為緩慢，啟用demo.queue().launch(share=True, inbrowser=True) 時所有網(wǎng)絡會經(jīng)過Gradio服務器轉發(fā)，導致打字機體驗大幅下降，現(xiàn)在默認啟動方式已經(jīng)改為share=False，如有需要公網(wǎng)訪問的需求，可以重新修改為share=True 啟動。該程序說明來源于ChatGLM-6B官方介紹。

改變端口號的方法為：

demo.queue().launch(share=False, inbrowser=True, server_name='0.0.0.0', server_port=8900)

同樣地，該程序不支持多用戶同時訪問。下一篇博文將介紹如何實現(xiàn)多用戶同時調(diào)用，預計本周更新。

運行后頁面如下圖所示。頁面中的temperature主要用于設置答案的隨機程度。如果其設置為1，那么相同問題每次得到答案都是完全一樣的。

圖4 web_demo.py的前端頁面示意圖

2.4 web_demo2.py

web_demo.py與web_demo2.py基本一樣，都是運行帶前端頁面的web服務器。區(qū)別在于前者基于gradio開發(fā)，而后者基于streamlit開發(fā)。同樣地，我們需要通過如下命令安裝streamlit。

pip install streamlit -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install streamlit-chat -i https://pypi.tuna.tsinghua.edu.cn/simple

web_demo2.py的運行方式為“streamlit run web_demo2.py --server.port 5900”，運行后頁面如下圖所示。

圖5 web_demo2.py前端頁面運行結果示意圖

3 模型本地部署

以上各個程序在加載模型時的關鍵程序如下：

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()

"THUDM/chatglm-6b"表示模型路徑。程序會優(yōu)先在本地搜索該路徑，如果該路徑不存在，那么程序將自動去huggingface網(wǎng)站進行搜索進行下載。這導致每次啟動程序時，會花費較長時間來下載并加載模型。

我們可以通過git將模型下載到本地，下載命令為“git clone THUDM/chatglm-6b · Hugging Face”。假設我們在當前工程下執(zhí)行該命令，那么文件夾下增加一個名稱為chatglm-6b的文件夾，文件夾存儲了下載的模型相關文件。相應地，我們需要按照如下方式替換模型加載程序中的模型路徑。

tokenizer = AutoTokenizer.from_pretrained("chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("chatglm-6b", trust_remote_code=True).half().cuda()

ChatGLM-6B提供多種量化精度模型，不同精度所需顯存不同，如下所示。但是，在連續(xù)問答過程中，顯存會隨著歷史信息增加而增加，因此需要注意控制程序中的history。

各個模型下載路徑如下所示，使用時需要按照上述方法替換模型加載程序中的模型路徑。

git clone THUDM/chatglm-6b · https://huggingface.co/THUDM/chatglm-6b
git clone THUDM/chatglm-6b-int8 ·https://huggingface.co/THUDM/chatglm-6b-int8
git clone THUDM/chatglm-6b-int4 ·https://huggingface.co/THUDM/chatglm-6b-int4
git clone THUDM/chatglm-6b-int4 ·https://huggingface.co/THUDM/chatglm-6b-int4-qe

下一節(jié)將重點介紹ChatGLM的多用戶調(diào)用方式，包括http、websocket和前端頁面等。

到此這篇關于ChatGPT平替-ChatGLM環(huán)境搭建與部署運行的文章就介紹到這了,更多相關ChatGLM環(huán)境搭建與部署內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

kali虛擬機破解root密碼的步驟
這篇文章主要介紹了kali虛擬機破解root密碼的步驟,本文通過圖文并茂的形式給大家介紹的非常詳細,感興趣的朋友一起看看吧
2025-04-04
完美解決瀏覽器Flash插件過期不能用問題
這篇文章主要介紹了完美解決瀏覽器Flash插件過期不能用問題
2021-02-02
對于組件庫的思考及技術梳理詳解
這篇文章主要為大家介紹了對于組件庫的思考及技術梳理詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-02-02
Viso 2019 下載與激活方法
Visio 是一款專門繪制流程示意圖工具，由于很多剛入職的小白沒有安裝過visio，今天小編抽空給大家分享下Viso 2019 下載與激活方法，感興趣的朋友一起看看吧
2023-02-02
JAVA IDEA入門使用手冊(新手小白必備)
IDEA的每一個方面都是為了最大限度地提高開發(fā)人員的工作效率而設計的，本文主要介紹了JAVA IDEA入門使用手冊，幫助新手更好的入門，感興趣的可以了解一下
2021-05-05
VSCode遠程連接其他主機的WSL2的問題
這篇文章主要介紹了VSCode遠程連接其他主機的WSL2的問題，在 Windows 10 上開啟 SSH Server 服務,設置 SSH 連接使用的默認 Shell，本文給大家介紹的非常詳細，需要的朋友參考下吧
2021-07-07
計算機科學中32個常用的基礎算法
這篇文章主要介紹了計算機科學中32個常用的基礎算法,也是計算機科學中最重要的算法,需要的朋友可以參考下
2014-06-06
DeepSeek R1 Ollama本地化部署全攻略
本文主要介紹了DeepSeek R1 Ollama本地化部署全攻略,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
2025-03-03
羊了個羊破解方法(嘎嘎猛已入羊群n次)
這篇文章主要介紹了羊了個羊破解（嘎嘎猛，已入羊群n次）,經(jīng)本人測試找到的未修復的bug:?一旦通關一次后，后續(xù)入羊群不再需要循環(huán)浪費時間淦帝，只需要點換裝點擊新皮膚，點確定即可嘎嘎增加入群次數(shù),需要的朋友可以參考下
2022-09-09
eBay 打造基于 Apache Druid 的大數(shù)據(jù)實時監(jiān)控系統(tǒng)
Apache Druid 是一個用于大數(shù)據(jù)實時查詢和分析的高容錯、高性能開源分布式時序數(shù)據(jù)庫系統(tǒng)，旨在快速處理大規(guī)模的數(shù)據(jù)，并能夠實現(xiàn)快速查詢和分析。這篇文章主要介紹了eBay 如何打造基于 Apache Druid 的大數(shù)據(jù)實時監(jiān)控系統(tǒng)？需要的朋友可以參考下
2019-06-06