12장. 라이선스 — 회사에서 써도 되는 모델 가리기
이 장의 목표 라이선스 한 줄만 보고 “이거 회사에서 써도 되겠다 / 안 되겠다” 를 판단할 수 있게 됩니다.
변호사 수준이 아니라, 개발자 수준의 실용 판단 기준입니다.
12.1 왜 이게 중요한가
회사에서 로컬 AI를 도입할 때 가장 많이 막히는 게 라이선스입니다.
- 무료라고 받았는데 상업적으로 쓰면 안 되는 경우
- 출력에 출처 표기를 해야 하는 경우
- 회사 규모가 너무 크면 별도 계약이 필요한 경우
- 데이터를 학습에 다시 쓰면 안 되는 경우
한 번 정리해두면 평생 든든합니다.
12.2 라이선스 한눈에 보기
자주 만나는 라이선스 8종.
| 라이선스 | 상업적 사용 | 출처 표기 | 비고 |
|---|---|---|---|
| Apache 2.0 | ✅ | 권장 | 가장 자유 |
| MIT | ✅ | 권장 | 가장 자유 |
| BSD-3 | ✅ | 권장 | Apache와 유사 |
| Llama 3 / 3.1 / 3.3 | ✅ ※ | 필수 | 월 7억 MAU 회사 별도 계약 |
| Gemma | ✅ ※ | 필수 | Use Policy 준수 필요 |
| Qwen License | ✅ ※ | 권장 | 일부 모델 규모별 제한 |
| CC-BY-NC | ❌ | 필수 | 비상업 전용 |
| OpenRAIL-M | △ | 필수 | 사용 목적 제한 |
※ 가 붙은 것들은 조건부 OK 입니다.
12.3 ✅ 자유롭게 쓸 수 있는 라이선스
Apache 2.0
- 가장 사업 친화적
- 수정·배포·상업적 사용 자유
- 출처 표기 필요 (보통 NOTICE 파일에)
- 코드·모델 모두에서 가장 흔함
대표 모델:
Qwen3 시리즈 (일부)
Mistral 7B (오리지널)
DeepSeek 일부
MIT
- Apache보다 더 짧고 간결
- 거의 같은 효력
- 한 줄: “마음대로 써, 책임은 안 짐”
대표 모델:
Phi-4
일부 Mistral 모델
다수의 임베딩 모델
이 두 라이선스가 붙어있으면 회사에서 거의 무조건 OK 입니다.
12.4 ⚠ 조건부 OK — Llama 라이선스
Meta의 Llama 시리즈는 자체 라이선스(Llama 3 / 3.1 / 3.3 Community License) 를 씁니다.
| 조건 | 내용 |
|---|---|
| 상업적 사용 | ✅ 가능 |
| 월 활성 사용자(MAU) 7억 명 초과 회사 | ❌ 별도 계약 필요 |
| “Built with Llama” 표기 | ✅ 필수 |
| 출력에 대해 다른 LLM 학습 | ⚠ 제한 |
Llama 파생 모델 이름 앞에 Llama 붙이기 | ✅ 권장 |
일반 회사라면 다 통과합니다. 단, “Built with Meta Llama 3” 같은 표기를 잊지 마세요.
대표 모델:
meta-llama/Llama-3.3-70B-Instruct
meta-llama/Llama-3.1-8B-Instruct
12.5 ⚠ 조건부 OK — Gemma 라이선스
Google의 Gemma 시리즈도 자체 라이선스(Gemma Terms of Use) 를 씁니다.
| 조건 | 내용 |
|---|---|
| 상업적 사용 | ✅ 가능 |
| Gemma Prohibited Use Policy 준수 | ✅ 필수 |
| 출력 모니터링 권장 | ✅ |
| Gemma 파생 모델 표기 | ✅ |
Prohibited Use Policy는 “무기·차별·기만·아동 안전 위반” 같은 일반적인 금지사항입니다.
대표 모델:
google/gemma-3-27b-it
google/gemma-3-9b-it
12.6 ⚠ 조건부 OK — Qwen / DeepSeek 등
알리바바의 Qwen, DeepSeek 등은 모델마다 라이선스가 약간 다릅니다.
- 대부분은 Apache 2.0 이나 자체 라이선스
- 일부 큰 모델은 상업적 사용 시 별도 신청
- 모델 카드 라이선스 칸을 꼭 확인
대표 케이스:
Qwen3-32B-Instruct → Apache 2.0 ✅
Qwen-Max (상업 API) → 자체 라이선스
12.7 ❌ 회사에서 쓰면 안 되는 라이선스
CC-BY-NC (Non-Commercial)
NC 가 핵심입니다.
비상업적 용도만 가능.
회사 업무에 쓰면 라이선스 위반입니다. 취미나 연구라면 OK.
흔히 보이는 변종:
cc-by-nc-4.0
cc-by-nc-sa-4.0
일부 모델의 research only 표기
모델 카드에:
"This model is for research purposes only."
이런 문장이 보이면 회사 업무에 쓰면 안 됩니다.
Uncensored / Abliterated 변종
라이선스 자체는 원본을 따르지만, 안전장치를 제거한 모델은 회사 도입에 부적합 입니다.
- 사내 챗봇·고객 응대에 절대 안 됨
- 거부 회로가 우회되어 위험 발언이 그대로 나옴
- 컴플라이언스 이슈 큼
12.8 △ OpenRAIL — 책임 있는 사용
OpenRAIL-M 같은 라이선스는
사용 목적 제한 이 있습니다.
금지된 용도 예:
- 사람 차별·해코지
- 의료 진단 (의사 감독 없이)
- 군사 활용
회사가 이런 용도가 아니라면 보통 OK입니다.
12.9 회사 도입 체크리스트
새 모델 도입 전에 묻는 5가지.
- 라이선스가 뭔가?
- Apache 2.0 / MIT → 거의 OK
- Llama / Gemma → 조건부 OK
- CC-BY-NC → ❌
- 출처 표기가 필요한가?
- 사내 도구 어딘가에 표기 가능 위치 확보
- 회사 규모 제한이 있는가?
- Llama: 월 7억 MAU 초과 시 별도 계약
- 출력물의 권리는?
- 대부분 자유롭게 사용 가능
- 다른 LLM 학습에 쓰는 건 제한 있을 수 있음
- 금지된 사용 목적은?
- 의료·법률 자동 결정·감시 등 주의
12.10 한국 회사가 흔히 빠지는 함정
“오픈소스 = 무료 = 마음대로 OK” 함정
오픈소스 라이선스도 의무가 있습니다. 출처 표기 안 하면 라이선스 위반 입니다.
“어차피 사내용인데 누가 알겠어” 함정
라이선스 위반은 추후 외부 공개·소스 감사 때 드러납니다. 파이프라인 깨고 다시 만드는 게 비용 더 큽니다.
“양자화 모델은 라이선스 다르겠지” 함정
아닙니다. 양자화 모델은 원본 라이선스를 그대로 따릅니다.
bartowski 가 양자화한 Llama 모델도 Llama 라이선스를 따릅니다.
“파인튜닝하면 내 모델 되겠지” 함정
베이스 모델 라이선스를 여전히 따라야 합니다. Llama 베이스로 파인튜닝하면 결과물도 Llama 라이선스.
이 장에서 기억할 한 가지
회사 도입 라이선스 한 줄 결정 트리
- Apache 2.0 / MIT → ✅ 그냥 쓰세요
- Llama / Gemma / Qwen → ✅ 단, 표기·정책 확인
- CC-BY-NC / research only → ❌ 회사에서 쓰지 마세요
- Uncensored / Abliterated → ❌ 회사에서 쓰지 마세요
손으로 해볼 것
1. 후보 모델 라이선스 메모표 만들기
지금까지 봐온 모델들을 표로 정리하세요.
| 모델 | 라이선스 | 회사 사용 |
|---|---|---|
| Qwen3-32B-Instruct | Apache 2.0 | ✅ |
| Llama-3.3-70B-Instruct | Llama 3.3 | ✅ (표기) |
| Gemma-3-27B-it | Gemma | ✅ (정책) |
| … | … | … |
2. 회사 표기 위치 미리 정해두기
만약 사내 챗봇에 로컬 AI를 쓸 거라면, 다음 중 어디에 라이선스 표기를 둘지 정해두세요.
- README에 “Built with Llama” 한 줄
- 챗봇 푸터에 “Powered by …” 한 줄
- 사내 위키에 모델 출처 페이지
다음 장에서는 벤치마크 점수 읽는 법 입니다.
“이 모델 MMLU 75점인데 좋은 거야?” 같은 질문에 답할 수 있게 됩니다.