12장. 라이선스 — 회사에서 써도 되는 모델 가리기

이 장의 목표 라이선스 한 줄만 보고 “이거 회사에서 써도 되겠다 / 안 되겠다” 를 판단할 수 있게 됩니다.

변호사 수준이 아니라, 개발자 수준의 실용 판단 기준입니다.

12.1 왜 이게 중요한가

회사에서 로컬 AI를 도입할 때 가장 많이 막히는 게 라이선스입니다.

무료라고 받았는데 상업적으로 쓰면 안 되는 경우
출력에 출처 표기를 해야 하는 경우
회사 규모가 너무 크면 별도 계약이 필요한 경우
데이터를 학습에 다시 쓰면 안 되는 경우

한 번 정리해두면 평생 든든합니다.

12.2 라이선스 한눈에 보기

자주 만나는 라이선스 8종.

라이선스	상업적 사용	출처 표기	비고
Apache 2.0	✅	권장	가장 자유
MIT	✅	권장	가장 자유
BSD-3	✅	권장	Apache와 유사
Llama 3 / 3.1 / 3.3	✅ ※	필수	월 7억 MAU 회사 별도 계약
Gemma	✅ ※	필수	Use Policy 준수 필요
Qwen License	✅ ※	권장	일부 모델 규모별 제한
CC-BY-NC	❌	필수	비상업 전용
OpenRAIL-M	△	필수	사용 목적 제한

※ 가 붙은 것들은 조건부 OK 입니다.

12.3 ✅ 자유롭게 쓸 수 있는 라이선스

Apache 2.0

가장 사업 친화적
수정·배포·상업적 사용 자유
출처 표기 필요 (보통 NOTICE 파일에)
코드·모델 모두에서 가장 흔함

대표 모델:

Qwen3 시리즈 (일부)
Mistral 7B (오리지널)
DeepSeek 일부

MIT

Apache보다 더 짧고 간결
거의 같은 효력
한 줄: “마음대로 써, 책임은 안 짐”

대표 모델:

Phi-4
일부 Mistral 모델
다수의 임베딩 모델

이 두 라이선스가 붙어있으면 회사에서 거의 무조건 OK 입니다.

12.4 ⚠ 조건부 OK — Llama 라이선스

Meta의 Llama 시리즈는 자체 라이선스(Llama 3 / 3.1 / 3.3 Community License) 를 씁니다.

조건	내용
상업적 사용	✅ 가능
월 활성 사용자(MAU) 7억 명 초과 회사	❌ 별도 계약 필요
“Built with Llama” 표기	✅ 필수
출력에 대해 다른 LLM 학습	⚠ 제한
Llama 파생 모델 이름 앞에 `Llama` 붙이기	✅ 권장

일반 회사라면 다 통과합니다. 단, “Built with Meta Llama 3” 같은 표기를 잊지 마세요.

대표 모델:

meta-llama/Llama-3.3-70B-Instruct
meta-llama/Llama-3.1-8B-Instruct

12.5 ⚠ 조건부 OK — Gemma 라이선스

Google의 Gemma 시리즈도 자체 라이선스(Gemma Terms of Use) 를 씁니다.

조건	내용
상업적 사용	✅ 가능
Gemma Prohibited Use Policy 준수	✅ 필수
출력 모니터링 권장	✅
Gemma 파생 모델 표기	✅

Prohibited Use Policy는 “무기·차별·기만·아동 안전 위반” 같은 일반적인 금지사항입니다.

대표 모델:

google/gemma-3-27b-it
google/gemma-3-9b-it

12.6 ⚠ 조건부 OK — Qwen / DeepSeek 등

알리바바의 Qwen, DeepSeek 등은 모델마다 라이선스가 약간 다릅니다.

대부분은 Apache 2.0 이나 자체 라이선스
일부 큰 모델은 상업적 사용 시 별도 신청
모델 카드 라이선스 칸을 꼭 확인

대표 케이스:

Qwen3-32B-Instruct           →  Apache 2.0  ✅
Qwen-Max (상업 API)          →  자체 라이선스

12.7 ❌ 회사에서 쓰면 안 되는 라이선스

CC-BY-NC (Non-Commercial)

NC 가 핵심입니다.

비상업적 용도만 가능.

회사 업무에 쓰면 라이선스 위반입니다. 취미나 연구라면 OK.

흔히 보이는 변종:

cc-by-nc-4.0
cc-by-nc-sa-4.0

일부 모델의 `research only` 표기

모델 카드에:

"This model is for research purposes only."

이런 문장이 보이면 회사 업무에 쓰면 안 됩니다.

Uncensored / Abliterated 변종

라이선스 자체는 원본을 따르지만, 안전장치를 제거한 모델은 회사 도입에 부적합 입니다.

- 사내 챗봇·고객 응대에 절대 안 됨
- 거부 회로가 우회되어 위험 발언이 그대로 나옴
- 컴플라이언스 이슈 큼

12.8 △ OpenRAIL — 책임 있는 사용

OpenRAIL-M 같은 라이선스는 사용 목적 제한 이 있습니다.

금지된 용도 예:

사람 차별·해코지
의료 진단 (의사 감독 없이)
군사 활용

회사가 이런 용도가 아니라면 보통 OK입니다.

12.9 회사 도입 체크리스트

새 모델 도입 전에 묻는 5가지.

라이선스가 뭔가?
- Apache 2.0 / MIT → 거의 OK
- Llama / Gemma → 조건부 OK
- CC-BY-NC → ❌
출처 표기가 필요한가?
- 사내 도구 어딘가에 표기 가능 위치 확보
회사 규모 제한이 있는가?
- Llama: 월 7억 MAU 초과 시 별도 계약
출력물의 권리는?
- 대부분 자유롭게 사용 가능
- 다른 LLM 학습에 쓰는 건 제한 있을 수 있음
금지된 사용 목적은?
- 의료·법률 자동 결정·감시 등 주의

12.10 한국 회사가 흔히 빠지는 함정

“오픈소스 = 무료 = 마음대로 OK” 함정

오픈소스 라이선스도 의무가 있습니다. 출처 표기 안 하면 라이선스 위반 입니다.

“어차피 사내용인데 누가 알겠어” 함정

라이선스 위반은 추후 외부 공개·소스 감사 때 드러납니다. 파이프라인 깨고 다시 만드는 게 비용 더 큽니다.

“양자화 모델은 라이선스 다르겠지” 함정

아닙니다. 양자화 모델은 원본 라이선스를 그대로 따릅니다. bartowski 가 양자화한 Llama 모델도 Llama 라이선스를 따릅니다.

“파인튜닝하면 내 모델 되겠지” 함정

베이스 모델 라이선스를 여전히 따라야 합니다. Llama 베이스로 파인튜닝하면 결과물도 Llama 라이선스.

이 장에서 기억할 한 가지

회사 도입 라이선스 한 줄 결정 트리

Apache 2.0 / MIT → ✅ 그냥 쓰세요

Llama / Gemma / Qwen → ✅ 단, 표기·정책 확인

CC-BY-NC / research only → ❌ 회사에서 쓰지 마세요

Uncensored / Abliterated → ❌ 회사에서 쓰지 마세요

손으로 해볼 것

1. 후보 모델 라이선스 메모표 만들기

지금까지 봐온 모델들을 표로 정리하세요.

모델	라이선스	회사 사용
Qwen3-32B-Instruct	Apache 2.0	✅
Llama-3.3-70B-Instruct	Llama 3.3	✅ (표기)
Gemma-3-27B-it	Gemma	✅ (정책)
…	…	…

2. 회사 표기 위치 미리 정해두기

만약 사내 챗봇에 로컬 AI를 쓸 거라면, 다음 중 어디에 라이선스 표기를 둘지 정해두세요.

README에 “Built with Llama” 한 줄
챗봇 푸터에 “Powered by …” 한 줄
사내 위키에 모델 출처 페이지

다음 장에서는 벤치마크 점수 읽는 법 입니다.

“이 모델 MMLU 75점인데 좋은 거야?” 같은 질문에 답할 수 있게 됩니다.

Keyboard shortcuts

맥에서 시작하는 로컬 AI