11장. 모델 이름 해독법

이 장의 목표 처음 보는 모델 이름이 와도 30초 안에 정체를 파악 할 수 있게 됩니다.

이 장의 결과는 곧 이 책 1~10장의 종합 응용입니다.

11.1 이름은 보통 7가지 정보로 만들어진다

길고 복잡해 보이는 이름도 다음 7개 정보를 조립한 것입니다.

①모델시리즈 ②버전 ③파라미터수 ④유형 ⑤특수기법 ⑥양자화 ⑦포맷

전부 다 적힌 경우는 드물고, 관련된 것만 골라 적습니다.

11.2 예제 1 — `Qwen3-32B-Instruct`

Qwen 3 - 32B - Instruct
└──┘ │   └─┘   └──────┘
①    ②   ③     ④

부분	의미
Qwen	모델 시리즈 (Alibaba)
3	메이저 버전
32B	약 320억 파라미터 (3장)
Instruct	지시사항 튜닝 (9장)

→ “Qwen 시리즈 3세대, 320억 파라미터, 일반 대화용”

11.3 예제 2 — `Qwen3-32B-Instruct-Q4_K_M.gguf`

Qwen3-32B-Instruct - Q4_K_M . gguf
└─────────────────┘  └────┘   └──┘
       기존 정보       ⑥양자화    ⑦포맷

추가 부분	의미
Q4_K_M	4비트 K-quant Medium (5장)
.gguf	GGUF 포맷 (10장)

→ “위 모델의 4비트 양자화 GGUF 파일”

11.4 예제 3 — `meta-llama/Llama-3.1-8B-Instruct`

meta-llama / Llama-3.1-8B-Instruct
└────────┘   └───┘ └─┘ └─┘ └──────┘
 소유자        ①   ②   ③    ④

부분	의미
meta-llama	Meta가 올린 모델 (소유자)
Llama	시리즈명
3.1	버전 (메이저.마이너)
8B	80억 파라미터
Instruct	지시사항 튜닝

소유자가 meta-llama 라는 건 원본이라는 뜻입니다 (10장).

11.5 예제 4 — `Gemma-3-27B-it`

Gemma - 3 - 27B - it
└───┘   │   └─┘   └┘
 ①      ②   ③    ④

부분	의미
Gemma	Google 모델 시리즈
3	3세대
27B	270억 파라미터
it	instruction-tuned (= Instruct)

it 표기는 Google·Gemma 시리즈에서 잘 씁니다. 9장에서 본 그 꼬리표입니다.

11.6 예제 5 — `Qwen3-30B-A3B-Instruct-2507`

Qwen3 - 30B - A3B - Instruct - 2507
└──┘    └─┘   └─┘   └──────┘   └──┘
 ①+②    ③    ⑤        ④       날짜

새로운 게 두 개 등장.

부분	의미
A3B	MoE의 활성(Active) 파라미터 3B (14장)
2507	출시 날짜 표기 (2025년 7월)

→ “총 30B인데 매 토큰마다 3B만 깨어남. 2025년 7월 버전 Instruct”

날짜 표기는 모델 카드를 잘 안 보면 “같은 모델인데 두 개?” 혼란이 와서 붙는 일이 많습니다.

11.7 예제 6 — `DeepSeek-R1-Distill-Qwen-32B`

DeepSeek - R1 - Distill - Qwen - 32B
└──────┘   └┘   └─────┘   └──┘   └─┘
   ①       ②      ⑤        ?     ③

부분	의미
DeepSeek	모델 시리즈 (DeepSeek-AI)
R1	추론(Reasoning) 모델 1세대
Distill	큰 R1의 능력을 작은 모델로 증류
Qwen	베이스로 쓴 모델 (Qwen)
32B	베이스의 크기

→ “DeepSeek R1의 능력을 Qwen 32B에 옮겨 담은 reasoning 모델”

Distill: 큰 선생 모델의 답안으로 작은 학생 모델을 가르치는 기법. “큰 모델 똑똑함을 압축한 작은 모델” 이라고 보면 됩니다.

11.8 예제 7 — `bartowski/Llama-3.3-70B-Instruct-Q5_K_L-GGUF`

bartowski / Llama-3.3-70B-Instruct - Q5_K_L - GGUF
└───────┘   └─────────────────────┘  └────┘   └──┘
 소유자          기존 정보             ⑥양자화   포맷

처음 보는 양자화 Q5_K_L 도 5장에 나왔던 S/M/L 의 L 입니다. “같은 Q5 중에서도 Large = 정보를 더 많이 보존” 한 버전.

→ “bartowski가 양자화한 Llama 3.3 70B Instruct, Q5_K_L GGUF”

11.9 예제 8 — `mlx-community/Qwen2.5-VL-32B-Instruct-4bit`

mlx-community / Qwen2.5 - VL - 32B - Instruct - 4bit
└───────────┘   └────┘   └┘   └─┘   └──────┘   └──┘
   소유자        ①+②     ④     ③       ④       ⑥

부분	의미
mlx-community	MLX 변환본 모음 (10장)
Qwen2.5	Qwen 시리즈 2.5
VL	Vision-Language, 이미지 입력 지원 (9장)
32B	320억 파라미터
Instruct	지시사항 튜닝
4bit	MLX 4비트 양자화 (5장)

→ “Qwen 2.5 VL 32B의 MLX 4비트 버전, 이미지 입력 가능”

11.10 자주 헷갈리는 표기 정리

표기	진짜 의미
`-it`	instruction-tuned (Gemma 계열)
`-Chat`	대화 튜닝
`-DPO`	DPO로 정렬한 버전
`-Distill`	큰 모델에서 증류
`-AWQ`, `-GPTQ`	GPU 양자화 (맥에서는 잘 안 씀)
`-A3B`, `-A22B`	MoE 활성 파라미터
`-Reasoning`, `-Thinking`, `-R1`	추론 모델
`-VL`, `-Vision`	이미지 입력
`-Omni`	다중 모달
`-128K`, `-1M`	컨텍스트 길이
`-Uncensored`, `-Abliterated`	안전장치 제거 (위험)
`-2507`	출시 연월 (YYMM)

11.11 30초 해독 절차

이름이 길고 무서워 보이면 왼쪽부터 한 토막씩 끊어 읽으세요.

[소유자] / [시리즈]-[버전]-[크기]-[유형]-[특수]-[양자화].[포맷]

읽어가며 머리에 떠올릴 질문:

누가 올렸나? (원본/양자화 배포자)
어떤 시리즈인가? (Qwen, Llama, …)
몇 B인가? (메모리 계산용 — 4장)
무슨 용도인가? (Instruct? Vision? Reasoning?)
특수 기법? (Distill, MoE A_B, Thinking?)
양자화? (Q4_K_M 등 — 5장)
포맷? (GGUF / MLX / Safetensors — 10장)

11.12 실전 — 모르는 이름 만났을 때

이 책에 안 나온 이름이 와도 당황하지 마세요.

Phi-4-mini-Reasoning-4B-Q4_K_M.gguf

해독:

Phi: Microsoft 시리즈
4: 4세대
mini: 작은 버전
Reasoning: 추론 모델
4B: 40억 파라미터
Q4_K_M: 4비트 양자화
gguf: GGUF 포맷

→ “Microsoft Phi 4세대 소형 추론 모델, 40억 파라미터, 4비트 양자화 GGUF”

이 정도 추론이 30초 안에 되면 이 책 1부·2부가 잘 들어온 겁니다.

이 장에서 기억할 한 가지

모델 이름은 7개 필드의 조립체: 시리즈 / 버전 / 크기 / 유형 / 특수 / 양자화 / 포맷.

왼쪽부터 토막내서 읽으면 모르는 이름도 거의 다 풀립니다.

손으로 해볼 것

다음 모델 이름을 각각 해독해보세요. 답은 모델 카드를 열어보면 확인할 수 있습니다.

Qwen3-14B-Instruct
mistralai/Mixtral-8x7B-Instruct-v0.1
unsloth/DeepSeek-R1-Distill-Qwen-14B-GGUF
mlx-community/Llama-3.3-70B-Instruct-4bit
bartowski/Qwen2.5-Coder-32B-Instruct-Q5_K_L.gguf

처음에는 답이 안 나와도 좋습니다. 3개 정도부터 막힐 텐데, 3장(파라미터), 9장(유형), 10장(포맷), 14장(MoE) 을 다시 한 번씩 펼쳐보세요.

다음 장에서는 라이선스 를 정면으로 봅니다.

“이 모델 회사에서 써도 되는 거 맞아?” 라는 질문에 답할 수 있게 됩니다.

Keyboard shortcuts

맥에서 시작하는 로컬 AI