11장. 모델 이름 해독법
이 장의 목표 처음 보는 모델 이름이 와도 30초 안에 정체를 파악 할 수 있게 됩니다.
이 장의 결과는 곧 이 책 1~10장의 종합 응용입니다.
11.1 이름은 보통 7가지 정보로 만들어진다
길고 복잡해 보이는 이름도 다음 7개 정보를 조립한 것입니다.
①모델시리즈 ②버전 ③파라미터수 ④유형 ⑤특수기법 ⑥양자화 ⑦포맷
전부 다 적힌 경우는 드물고, 관련된 것만 골라 적습니다.
11.2 예제 1 — Qwen3-32B-Instruct
Qwen 3 - 32B - Instruct
└──┘ │ └─┘ └──────┘
① ② ③ ④
| 부분 | 의미 |
|---|---|
| Qwen | 모델 시리즈 (Alibaba) |
| 3 | 메이저 버전 |
| 32B | 약 320억 파라미터 (3장) |
| Instruct | 지시사항 튜닝 (9장) |
→ “Qwen 시리즈 3세대, 320억 파라미터, 일반 대화용”
11.3 예제 2 — Qwen3-32B-Instruct-Q4_K_M.gguf
Qwen3-32B-Instruct - Q4_K_M . gguf
└─────────────────┘ └────┘ └──┘
기존 정보 ⑥양자화 ⑦포맷
| 추가 부분 | 의미 |
|---|---|
| Q4_K_M | 4비트 K-quant Medium (5장) |
| .gguf | GGUF 포맷 (10장) |
→ “위 모델의 4비트 양자화 GGUF 파일”
11.4 예제 3 — meta-llama/Llama-3.1-8B-Instruct
meta-llama / Llama-3.1-8B-Instruct
└────────┘ └───┘ └─┘ └─┘ └──────┘
소유자 ① ② ③ ④
| 부분 | 의미 |
|---|---|
| meta-llama | Meta가 올린 모델 (소유자) |
| Llama | 시리즈명 |
| 3.1 | 버전 (메이저.마이너) |
| 8B | 80억 파라미터 |
| Instruct | 지시사항 튜닝 |
소유자가 meta-llama 라는 건
원본이라는 뜻입니다 (10장).
11.5 예제 4 — Gemma-3-27B-it
Gemma - 3 - 27B - it
└───┘ │ └─┘ └┘
① ② ③ ④
| 부분 | 의미 |
|---|---|
| Gemma | Google 모델 시리즈 |
| 3 | 3세대 |
| 27B | 270억 파라미터 |
| it | instruction-tuned (= Instruct) |
it 표기는 Google·Gemma 시리즈에서 잘 씁니다.
9장에서 본 그 꼬리표입니다.
11.6 예제 5 — Qwen3-30B-A3B-Instruct-2507
Qwen3 - 30B - A3B - Instruct - 2507
└──┘ └─┘ └─┘ └──────┘ └──┘
①+② ③ ⑤ ④ 날짜
새로운 게 두 개 등장.
| 부분 | 의미 |
|---|---|
| A3B | MoE의 활성(Active) 파라미터 3B (14장) |
| 2507 | 출시 날짜 표기 (2025년 7월) |
→ “총 30B인데 매 토큰마다 3B만 깨어남. 2025년 7월 버전 Instruct”
날짜 표기는 모델 카드를 잘 안 보면 “같은 모델인데 두 개?” 혼란이 와서 붙는 일이 많습니다.
11.7 예제 6 — DeepSeek-R1-Distill-Qwen-32B
DeepSeek - R1 - Distill - Qwen - 32B
└──────┘ └┘ └─────┘ └──┘ └─┘
① ② ⑤ ? ③
| 부분 | 의미 |
|---|---|
| DeepSeek | 모델 시리즈 (DeepSeek-AI) |
| R1 | 추론(Reasoning) 모델 1세대 |
| Distill | 큰 R1의 능력을 작은 모델로 증류 |
| Qwen | 베이스로 쓴 모델 (Qwen) |
| 32B | 베이스의 크기 |
→ “DeepSeek R1의 능력을 Qwen 32B에 옮겨 담은 reasoning 모델”
Distill: 큰 선생 모델의 답안으로 작은 학생 모델을 가르치는 기법. “큰 모델 똑똑함을 압축한 작은 모델” 이라고 보면 됩니다.
11.8 예제 7 — bartowski/Llama-3.3-70B-Instruct-Q5_K_L-GGUF
bartowski / Llama-3.3-70B-Instruct - Q5_K_L - GGUF
└───────┘ └─────────────────────┘ └────┘ └──┘
소유자 기존 정보 ⑥양자화 포맷
처음 보는 양자화 Q5_K_L 도
5장에 나왔던 S/M/L 의 L 입니다.
“같은 Q5 중에서도 Large = 정보를 더 많이 보존” 한 버전.
→ “bartowski가 양자화한 Llama 3.3 70B Instruct, Q5_K_L GGUF”
11.9 예제 8 — mlx-community/Qwen2.5-VL-32B-Instruct-4bit
mlx-community / Qwen2.5 - VL - 32B - Instruct - 4bit
└───────────┘ └────┘ └┘ └─┘ └──────┘ └──┘
소유자 ①+② ④ ③ ④ ⑥
| 부분 | 의미 |
|---|---|
| mlx-community | MLX 변환본 모음 (10장) |
| Qwen2.5 | Qwen 시리즈 2.5 |
| VL | Vision-Language, 이미지 입력 지원 (9장) |
| 32B | 320억 파라미터 |
| Instruct | 지시사항 튜닝 |
| 4bit | MLX 4비트 양자화 (5장) |
→ “Qwen 2.5 VL 32B의 MLX 4비트 버전, 이미지 입력 가능”
11.10 자주 헷갈리는 표기 정리
| 표기 | 진짜 의미 |
|---|---|
-it | instruction-tuned (Gemma 계열) |
-Chat | 대화 튜닝 |
-DPO | DPO로 정렬한 버전 |
-Distill | 큰 모델에서 증류 |
-AWQ, -GPTQ | GPU 양자화 (맥에서는 잘 안 씀) |
-A3B, -A22B | MoE 활성 파라미터 |
-Reasoning, -Thinking, -R1 | 추론 모델 |
-VL, -Vision | 이미지 입력 |
-Omni | 다중 모달 |
-128K, -1M | 컨텍스트 길이 |
-Uncensored, -Abliterated | 안전장치 제거 (위험) |
-2507 | 출시 연월 (YYMM) |
11.11 30초 해독 절차
이름이 길고 무서워 보이면 왼쪽부터 한 토막씩 끊어 읽으세요.
[소유자] / [시리즈]-[버전]-[크기]-[유형]-[특수]-[양자화].[포맷]
읽어가며 머리에 떠올릴 질문:
- 누가 올렸나? (원본/양자화 배포자)
- 어떤 시리즈인가? (Qwen, Llama, …)
- 몇 B인가? (메모리 계산용 — 4장)
- 무슨 용도인가? (Instruct? Vision? Reasoning?)
- 특수 기법? (Distill, MoE A_B, Thinking?)
- 양자화? (Q4_K_M 등 — 5장)
- 포맷? (GGUF / MLX / Safetensors — 10장)
11.12 실전 — 모르는 이름 만났을 때
이 책에 안 나온 이름이 와도 당황하지 마세요.
Phi-4-mini-Reasoning-4B-Q4_K_M.gguf
해독:
- Phi: Microsoft 시리즈
- 4: 4세대
- mini: 작은 버전
- Reasoning: 추론 모델
- 4B: 40억 파라미터
- Q4_K_M: 4비트 양자화
- gguf: GGUF 포맷
→ “Microsoft Phi 4세대 소형 추론 모델, 40억 파라미터, 4비트 양자화 GGUF”
이 정도 추론이 30초 안에 되면 이 책 1부·2부가 잘 들어온 겁니다.
이 장에서 기억할 한 가지
모델 이름은 7개 필드의 조립체: 시리즈 / 버전 / 크기 / 유형 / 특수 / 양자화 / 포맷.
왼쪽부터 토막내서 읽으면 모르는 이름도 거의 다 풀립니다.
손으로 해볼 것
다음 모델 이름을 각각 해독해보세요. 답은 모델 카드를 열어보면 확인할 수 있습니다.
Qwen3-14B-Instructmistralai/Mixtral-8x7B-Instruct-v0.1unsloth/DeepSeek-R1-Distill-Qwen-14B-GGUFmlx-community/Llama-3.3-70B-Instruct-4bitbartowski/Qwen2.5-Coder-32B-Instruct-Q5_K_L.gguf
처음에는 답이 안 나와도 좋습니다. 3개 정도부터 막힐 텐데, 3장(파라미터), 9장(유형), 10장(포맷), 14장(MoE) 을 다시 한 번씩 펼쳐보세요.
다음 장에서는 라이선스 를 정면으로 봅니다.
“이 모델 회사에서 써도 되는 거 맞아?” 라는 질문에 답할 수 있게 됩니다.