跳到主要內容
AI 詞彙

LLM 大型語言模型是什麼?

LLM(Large Language Model)是一種基於深度學習的自然語言處理模型,能理解與生成人類語言。

LLM 深度學習 NLP Transformer

LLM 是什麼?

LLM(Large Language Model,大型語言模型)是一種透過大量文字資料訓練的深度學習模型,能理解和生成自然語言。核心架構為 Transformer。

核心概念

  • 參數規模:從數十億到數千億個參數
  • 訓練資料:網頁、書籍、程式碼等大量文本
  • 自回歸生成:逐字(token)預測下一個最可能的輸出
  • 上下文窗口:模型能「記住」的對話長度

代表性模型

模型開發者參數規模
GPT-4oOpenAI未公開
ClaudeAnthropic未公開
GeminiGoogle未公開
Llama 3Meta8B-70B