Ollama 的 generate/tags/chat API 範例

瀏覽數: 555

最近的幾篇文章都是用 chatGPT 先幫我寫一些，我自己再改一下，雖然感覺比較沒有人味，但也真的省了不少事。因為本意不在拚點擊，而是自己做紀錄，所以也只好請大家見諒了。

之前大部份的AI文章都是自己呼 transformer 或 pytorch 來使用 LLM，但這樣其實有點難用又煩鎖。所幸後來有 Ollama 這種東西，整合了很多 LLM，並提供統一的介面來給我們呼叫，省去很多對 LLM 細節的瞭解。

本文就紀錄最常用的3個 API

Generate: 單純的一問一答
Tags: 列出所有可用的 LLM
Chat: 聊天，可以有多輪的問答。至於可不可以用 Chat 替代 Generate，我也不是很確定差在哪，可能要試試。但之前提到的探索 AI 中 Chain of Thought (CoT) 的力量，用的是 Generate 而非 Chat。我猜 Generate 可以對比較長的 Prompt 提供較好的回應吧。

API: http://localhost:11434/api/generate

這個範例是問「誰是張居正，用500字來介紹生平」，然後要求 LLM 假裝自己是全能之神的角度來回答這個問題。

API: http://localhost:11434/api/chat

chat 的重點就是呼叫 API 時，要帶入一個叫 messages 的 list. 每個 list element 都是一個 dict，分別有2個key

所以這就是把過往的聊天紀錄都丟給 ollama，一般最後應該是一個 role 為 user 的 element，然後 API 會回應一個 role 為 assistant 的 content。

這個例子是一個 CLI 模式下的聊天程式，你打一句，AI 回一句。

這3個例子都是用串流模式來完成的，這樣使用起來會比較友善。說要用自動產生也忘了，可能是水太多了。

月半人的家