AI 詞彙

LLM 大型語言模型是什麼？

LLM（Large Language Model）是一種基於深度學習的自然語言處理模型，能理解與生成人類語言。

LLM 深度學習 NLP Transformer

LLM 是什麼？

LLM（Large Language Model，大型語言模型）是一種透過大量文字資料訓練的深度學習模型，能理解和生成自然語言。核心架構為 Transformer。

核心概念

參數規模：從數十億到數千億個參數
訓練資料：網頁、書籍、程式碼等大量文本
自回歸生成：逐字（token）預測下一個最可能的輸出
上下文窗口：模型能「記住」的對話長度

代表性模型

模型	開發者	參數規模
GPT-4o	OpenAI	未公開
Claude	Anthropic	未公開
Gemini	Google	未公開
Llama 3	Meta	8B-70B