LLM 大型語言模型是什麼?
LLM(Large Language Model)是一種基於深度學習的自然語言處理模型,能理解與生成人類語言。
LLM 深度學習 NLP Transformer
LLM 是什麼?
LLM(Large Language Model,大型語言模型)是一種透過大量文字資料訓練的深度學習模型,能理解和生成自然語言。核心架構為 Transformer。
核心概念
- 參數規模:從數十億到數千億個參數
- 訓練資料:網頁、書籍、程式碼等大量文本
- 自回歸生成:逐字(token)預測下一個最可能的輸出
- 上下文窗口:模型能「記住」的對話長度
代表性模型
| 模型 | 開發者 | 參數規模 |
|---|---|---|
| GPT-4o | OpenAI | 未公開 |
| Claude | Anthropic | 未公開 |
| Gemini | 未公開 | |
| Llama 3 | Meta | 8B-70B |