Featured image of post Llama 3 正式推出!免費線上、本機使用教學|堪稱目前最強開源語言模型!?性能比肩 Claude 3|【Llama 3】

Llama 3 正式推出!免費線上、本機使用教學|堪稱目前最強開源語言模型!?性能比肩 Claude 3|【Llama 3】

Meta 最近正式推出新一代的開源語言模型 - Llama 3。在推出前,Llama 3 備受市場期待,今天就讓我們來看看 Llama 3 相較於 Llama 2 有哪些不同之處,以及現在我們如何免費使用 Llama 3 模型。

4 月 18 日,Meta 正式發表了新一代的開源語言模型 - Llama 3。在推出前,Llama 3 備受市場期待,今天就讓我們來看看 Llama 3 相較於 Llama 2 有哪些不同之處,以及現在我們如何免費使用 Llama 3 模型。

Llama 3 官網:
https://llama.meta.com/llama3/

Llama 3官網

Llama 3 系列規模與表現

根據Meta公布的資料,Llama 3 系列包含 8B、70B 和 400B 參數的版本,其中 400B 版本仍在訓練中。值得一提的是,Llama 3 最小的模型參數量並非常見的 7B,而是稍大的 8B 參數。

8B與70B模型測試 400B模型測試

就表現而言,根據 Meta 官方數據,Llama 3 70B 參數的模型在多項測試中超越 Claude 3 Sonnet、Gemini 1.5 等知名模型。Meta 也針對寫成式、數學推理、尋求建議等 12 個項目進行人工評估,最終 Llama 3 70B 參數模型在與 Mistral Medium、Claude 3 Sonnet、Llama 2 和 GPT-3.5 的比較中獲得全面勝利。

人工評估結果

令人驚喜的是,即使是最小的 8B 參數模型,在測試資料集上的表現也已與 Llama 2 70B 參數的模型不相上下。這次 Llama 3 的進步可說是相當巨大,同時也反映出 Meta 投入的龐大資源:兩個擁有 24000 個 H100 GPU 的叢集,以及 15 兆個 TOKENS 的訓練資料(Llama 2 僅使用約 2 兆個 TOKENS)。

Llama 3 8B 模型的測試結果與 Llama 2 的對比

Llama 3 的模型架構改變

在模型架構上,Llama 3 與 Llama 2 基本架構相同,最大的不同是採用了新的 Tokenizer,增大了詞彙表,理論上可以增強模型的多語言能力。但與之相對的是,模型大小也會增加,這也解釋了為什麼 Llama 3 最小的模型就是 8B 參數。

Meta 官方部落格上的架構改變介紹

免費使用 Llama 3 的途徑

由於 Llama 3 是開源模型,我們可以選擇在自己的電腦上運行,或使用一些網站提供的線上服務。以下我會分別跟大家介紹我推薦的方式。

線上使用

線上使用的部分,我個人推薦使用 HuggingFace 的 HuggingChat 上免費使用 Llama 3 70B 參數的模型,HuggingChat 提供了方便使用的聊天介面,有歷史紀錄、網路搜尋、自定 Assistant 等功能。我之前就有介紹過有興趣的可以去看一下。

HuggingChat 介面

第一次執行的時候,可以自行選擇是否登入,不登入也一樣可以免費使用模型,只是比較容易達到使用上限。同時 Assistant 等功能也會無法使用,大家可以自行取捨。

可以自行選擇是否登入HuggingFace帳號

進到對話頁面裡,我們只需要點擊畫面中間偏左上角的設定按鈕,就可以打開設定頁面,在左側選擇 Llama 3 70B 模型。

點齒輪開啟設定

選擇模型後按 Activate

選擇模型後按 Activate

這樣就可以開始對話了

對話測試

(P.S.Meta 官網的 Meta AI 雖然已採用 Llama 3,但目前只開放美國、澳洲、加拿大等國家使用。) 目前台灣尚不可使用 Meta AI

本機使用

如果想在自己的電腦上執行 Llama 3,我個人推薦使用 LM Studio 這個工具。它提供了方便的模型下載介面和對話視窗,並使用 llama.cpp 來運行模型,因此即使沒有獨立顯卡,只要記憶體足夠也能跑語言模型。(以前我也有介紹過,有興趣可以去看看這篇文章)

LM Studio 官網:
https://lmstudio.ai/

LM Studio官網

在下載並安裝完 LM Studio 後,在程式中搜尋 Llama 3 就可以看到 Llama 3 的 GGUF 檔

搜尋 Llama 3

接著要下載的模型,基本上一般家用電腦應該只跑得動 8B 參數。至於 8B 參數模型點進去後,裡面有多個可以下載的模型檔案,個人建議是 Q4_K_M 的版本,這個版本是性能與大小較平衡的版本,硬體配置好的話也可選擇 Q5、Q6 或 Q8 版本。

下載的版本建議選 Q4_K_M,如果電腦硬體更好可以選Q5、Q6 或 Q8

下載完成後,在聊天頁面載入模型即可開始與 Llama 3 對話。

進入聊天頁面,並點擊上方的載入模型,載入 Llama 3 便可開始對話

實際測試表現

無論是線上還是本機,Llama 3 在基本問答、程式能力和流暢度方面的表現都相當出色。以下是一些測試結果:

HuggingChat 上的 70B 模型

首先要測試的是 Llama 3 70B 的程式能力,使用 LeetCode 困難難度的題目測試,可以正確的給出答案。

測試LeetCode題目 LeetCode的題目回覆正確

隨便亂聊一些怪問題,像是「義大利麵拌 42 號混凝土」,回復的語句算是流暢自然。

隨便亂聊

即使是 8B 參數的模型,在未經過繁體中文微調的情況下,對繁中的輸出流暢度已達可以正常對話的水準。

8B Q4_K_M 模型測試

不過,對於目前語言模型仍難以解決的邏輯推理問題,這邊詢問 Llama 3 之前我有問過 Claude 等 LLM 的「左輪手槍問題」,Llama 3 和其他大型模型一樣都無法正確回答。

左輪手槍問題測試

總結

總的來說,Llama 3 不僅在規模和表現上有長足進步,對多語言的支援(至少在中文方面)也有明顯提升。尤其是 8B 參數的模型,即便經過 4bit 量化,也能以流暢的繁體中文回覆,確實給人驚喜。如果你有興趣嘗試這款新模型,不妨按照上述方式在線上服務或本機環境免費使用!

影片介紹