🖥️

The Walking Fish的程式小站

這裡是步行魚的程式小站我會在這裡發一些程式相關文章

Llama 3 正式推出！免費線上、本機使用教學｜堪稱目前最強開源語言模型！？性能比肩 Claude 3｜【Llama 3】

Meta 最近正式推出新一代的開源語言模型 - Llama 3。在推出前，Llama 3 備受市場期待，今天就讓我們來看看 Llama 3 相較於 Llama 2 有哪些不同之處，以及現在我們如何免費使用 Llama 3 模型。

4 月 18 日，Meta 正式發表了新一代的開源語言模型 - Llama 3。在推出前，Llama 3 備受市場期待，今天就讓我們來看看 Llama 3 相較於 Llama 2 有哪些不同之處，以及現在我們如何免費使用 Llama 3 模型。

Llama 3 官網:
https://llama.meta.com/llama3/

Llama 3官網

Llama 3 系列規模與表現

根據Meta公布的資料，Llama 3 系列包含 8B、70B 和 400B 參數的版本，其中 400B 版本仍在訓練中。值得一提的是，Llama 3 最小的模型參數量並非常見的 7B，而是稍大的 8B 參數。

8B與70B模型測試 400B模型測試

就表現而言，根據 Meta 官方數據，Llama 3 70B 參數的模型在多項測試中超越 Claude 3 Sonnet、Gemini 1.5 等知名模型。Meta 也針對寫成式、數學推理、尋求建議等 12 個項目進行人工評估，最終 Llama 3 70B 參數模型在與 Mistral Medium、Claude 3 Sonnet、Llama 2 和 GPT-3.5 的比較中獲得全面勝利。

人工評估結果

令人驚喜的是，即使是最小的 8B 參數模型，在測試資料集上的表現也已與 Llama 2 70B 參數的模型不相上下。這次 Llama 3 的進步可說是相當巨大，同時也反映出 Meta 投入的龐大資源:兩個擁有 24000 個 H100 GPU 的叢集，以及 15 兆個 TOKENS 的訓練資料(Llama 2 僅使用約 2 兆個 TOKENS)。

Llama 3 8B 模型的測試結果與 Llama 2 的對比

Llama 3 的模型架構改變

在模型架構上，Llama 3 與 Llama 2 基本架構相同，最大的不同是採用了新的 Tokenizer，增大了詞彙表，理論上可以增強模型的多語言能力。但與之相對的是，模型大小也會增加，這也解釋了為什麼 Llama 3 最小的模型就是 8B 參數。

Meta 官方部落格上的架構改變介紹

免費使用 Llama 3 的途徑

由於 Llama 3 是開源模型，我們可以選擇在自己的電腦上運行，或使用一些網站提供的線上服務。以下我會分別跟大家介紹我推薦的方式。

線上使用

線上使用的部分，我個人推薦使用 HuggingFace 的 HuggingChat 上免費使用 Llama 3 70B 參數的模型，HuggingChat 提供了方便使用的聊天介面，有歷史紀錄、網路搜尋、自定 Assistant 等功能。我之前就有介紹過有興趣的可以去看一下。

HuggingChat 介面

第一次執行的時候，可以自行選擇是否登入，不登入也一樣可以免費使用模型，只是比較容易達到使用上限。同時 Assistant 等功能也會無法使用，大家可以自行取捨。

可以自行選擇是否登入HuggingFace帳號

進到對話頁面裡，我們只需要點擊畫面中間偏左上角的設定按鈕，就可以打開設定頁面，在左側選擇 Llama 3 70B 模型。

點齒輪開啟設定

選擇模型後按 Activate

選擇模型後按 Activate

這樣就可以開始對話了

對話測試

(P.S.Meta 官網的 Meta AI 雖然已採用 Llama 3，但目前只開放美國、澳洲、加拿大等國家使用。) 目前台灣尚不可使用 Meta AI

本機使用

如果想在自己的電腦上執行 Llama 3，我個人推薦使用 LM Studio 這個工具。它提供了方便的模型下載介面和對話視窗，並使用 llama.cpp 來運行模型，因此即使沒有獨立顯卡，只要記憶體足夠也能跑語言模型。(以前我也有介紹過，有興趣可以去看看這篇文章)

LM Studio 官網:
https://lmstudio.ai/

LM Studio官網

在下載並安裝完 LM Studio 後，在程式中搜尋 Llama 3 就可以看到 Llama 3 的 GGUF 檔

搜尋 Llama 3

接著要下載的模型，基本上一般家用電腦應該只跑得動 8B 參數。至於 8B 參數模型點進去後，裡面有多個可以下載的模型檔案，個人建議是 Q4_K_M 的版本，這個版本是性能與大小較平衡的版本，硬體配置好的話也可選擇 Q5、Q6 或 Q8 版本。

下載的版本建議選 Q4_K_M，如果電腦硬體更好可以選Q5、Q6 或 Q8

下載完成後，在聊天頁面載入模型即可開始與 Llama 3 對話。

進入聊天頁面，並點擊上方的載入模型，載入 Llama 3 便可開始對話

實際測試表現

無論是線上還是本機，Llama 3 在基本問答、程式能力和流暢度方面的表現都相當出色。以下是一些測試結果:

HuggingChat 上的 70B 模型

首先要測試的是 Llama 3 70B 的程式能力，使用 LeetCode 困難難度的題目測試，可以正確的給出答案。

測試LeetCode題目 LeetCode的題目回覆正確

隨便亂聊一些怪問題，像是「義大利麵拌 42 號混凝土」，回復的語句算是流暢自然。

隨便亂聊

即使是 8B 參數的模型，在未經過繁體中文微調的情況下，對繁中的輸出流暢度已達可以正常對話的水準。

8B Q4_K_M 模型測試

不過，對於目前語言模型仍難以解決的邏輯推理問題，這邊詢問 Llama 3 之前我有問過 Claude 等 LLM 的「左輪手槍問題」，Llama 3 和其他大型模型一樣都無法正確回答。

左輪手槍問題測試

總結

總的來說，Llama 3 不僅在規模和表現上有長足進步，對多語言的支援(至少在中文方面)也有明顯提升。尤其是 8B 參數的模型，即便經過 4bit 量化，也能以流暢的繁體中文回覆，確實給人驚喜。如果你有興趣嘗試這款新模型，不妨按照上述方式在線上服務或本機環境免費使用!

影片介紹

Meta Llama 3 官方網站

Hugging Face Blog 對 Llama3 的介紹

Model Card

MetaAI 目前開放國家不包含台灣

HuggingChat 聊天頁面

LM Studio 官網

HuggingChat 介紹

LM Studio 介紹

左輪手槍問題的來源 - 遠見雜誌