AI 學習紀錄 – 百川 130 億開源聊天模型

瀏覽數: 844

前幾天研究的 ChatGLM2-6B，雖然不錯，但感覺出錯機率也不小，是屬於 better than nothing 的那種。他們其實還有12B的模型，但沒開放出來。不死心的情況下，逛來逛去讓我發現了這個百川模型(Baichuang2)。

才沒幾天前 (9月6日) 他們發佈了2代版本，剛好就讓我遇上了，感覺13B的版本比起來強大不少。不過 13B 的記憶體吃的很兇，所以連我的 RTX4090 都要降級才能跑

官方的說法是 4bits 只會影響準確率 1~2%。我是使用8bit，大致感覺 ok，明顯比 chatGLM2-6B好。

基本環境安裝

一些基本的環境 (如 anaconda、共用 script) 的設定，已經寫在【共同操作】這篇文章裡，請先看一下，確保所以指令可以正確運作。

建立 conda env

由於每個專案的相依性都不同，這裡會為每個案子都建立環境。

源碼下載與安裝環境

安裝下面套件。

下載模型

下載完，可以把 .git 刪除，結省一些空間

將模型轉化為8bit

由於 13B 所需的記憶體為 26G，已超過 RTX4090。所以需要將其降為 8bit 精度，以節省記憶體。具體的轉換腳本如下，若有需要4bit的版本，官方也有提供直接下載

轉換後將 token 相關檔案複製過去

執行 Baichuan2-13B-Chat-int8 模型

修改 web_demo.py，將模型都改成 “Baichuan2-13B-Chat-int8”, 最後執行 streamlit run web_demo.py 就可以了

輸出繁體中文

由於是大陸訓練的模型，輸出都是簡體中文。可以透過 opencc 的即時轉換，將其改為繁體。修改的 diff 如下

固定簡中的部份，可參考共同操作內的 zhTW.sh 文件，做轉換。

結語

所謂的大力出奇蹟，沒有任何理由，參數比較多效果就比較好。

月半人的家

AI 學習紀錄 – 百川 130 億開源聊天模型

基本環境安裝

建立 conda env

源碼下載與安裝環境

下載模型

將模型轉化為8bit

執行 Baichuan2-13B-Chat-int8 模型

輸出繁體中文

結語

About The Author

kebi

Leave a Reply(Name請以user_開頭，否則會被判定會垃圾息)

感謝您寶貴意見！

基本環境安裝

建立 conda env

源碼下載與安裝環境

下載模型

將模型轉化為8bit

執行 Baichuan2-13B-Chat-int8 模型

輸出繁體中文

結語

分享本文

相關文章:

About The Author

kebi

Leave a Reply(Name請以user_開頭，否則會被判定會垃圾息)

感謝您寶貴意見！