Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

12장. 라이선스 — 회사에서 써도 되는 모델 가리기

이 장의 목표 라이선스 한 줄만 보고 “이거 회사에서 써도 되겠다 / 안 되겠다” 를 판단할 수 있게 됩니다.

변호사 수준이 아니라, 개발자 수준의 실용 판단 기준입니다.


12.1 왜 이게 중요한가

회사에서 로컬 AI를 도입할 때 가장 많이 막히는 게 라이선스입니다.

  • 무료라고 받았는데 상업적으로 쓰면 안 되는 경우
  • 출력에 출처 표기를 해야 하는 경우
  • 회사 규모가 너무 크면 별도 계약이 필요한 경우
  • 데이터를 학습에 다시 쓰면 안 되는 경우

한 번 정리해두면 평생 든든합니다.


12.2 라이선스 한눈에 보기

자주 만나는 라이선스 8종.

라이선스상업적 사용출처 표기비고
Apache 2.0권장가장 자유
MIT권장가장 자유
BSD-3권장Apache와 유사
Llama 3 / 3.1 / 3.3✅ ※필수월 7억 MAU 회사 별도 계약
Gemma✅ ※필수Use Policy 준수 필요
Qwen License✅ ※권장일부 모델 규모별 제한
CC-BY-NC필수비상업 전용
OpenRAIL-M필수사용 목적 제한

가 붙은 것들은 조건부 OK 입니다.


12.3 ✅ 자유롭게 쓸 수 있는 라이선스

Apache 2.0

  • 가장 사업 친화적
  • 수정·배포·상업적 사용 자유
  • 출처 표기 필요 (보통 NOTICE 파일에)
  • 코드·모델 모두에서 가장 흔함

대표 모델:

Qwen3 시리즈 (일부)
Mistral 7B (오리지널)
DeepSeek 일부

MIT

  • Apache보다 더 짧고 간결
  • 거의 같은 효력
  • 한 줄: “마음대로 써, 책임은 안 짐”

대표 모델:

Phi-4
일부 Mistral 모델
다수의 임베딩 모델

이 두 라이선스가 붙어있으면 회사에서 거의 무조건 OK 입니다.


12.4 ⚠ 조건부 OK — Llama 라이선스

Meta의 Llama 시리즈는 자체 라이선스(Llama 3 / 3.1 / 3.3 Community License) 를 씁니다.

조건내용
상업적 사용✅ 가능
월 활성 사용자(MAU) 7억 명 초과 회사❌ 별도 계약 필요
“Built with Llama” 표기✅ 필수
출력에 대해 다른 LLM 학습⚠ 제한
Llama 파생 모델 이름 앞에 Llama 붙이기✅ 권장

일반 회사라면 다 통과합니다. 단, “Built with Meta Llama 3” 같은 표기를 잊지 마세요.

대표 모델:

meta-llama/Llama-3.3-70B-Instruct
meta-llama/Llama-3.1-8B-Instruct

12.5 ⚠ 조건부 OK — Gemma 라이선스

Google의 Gemma 시리즈도 자체 라이선스(Gemma Terms of Use) 를 씁니다.

조건내용
상업적 사용✅ 가능
Gemma Prohibited Use Policy 준수✅ 필수
출력 모니터링 권장
Gemma 파생 모델 표기

Prohibited Use Policy는 “무기·차별·기만·아동 안전 위반” 같은 일반적인 금지사항입니다.

대표 모델:

google/gemma-3-27b-it
google/gemma-3-9b-it

12.6 ⚠ 조건부 OK — Qwen / DeepSeek 등

알리바바의 Qwen, DeepSeek 등은 모델마다 라이선스가 약간 다릅니다.

  • 대부분은 Apache 2.0 이나 자체 라이선스
  • 일부 큰 모델은 상업적 사용 시 별도 신청
  • 모델 카드 라이선스 칸을 꼭 확인

대표 케이스:

Qwen3-32B-Instruct           →  Apache 2.0  ✅
Qwen-Max (상업 API)          →  자체 라이선스

12.7 ❌ 회사에서 쓰면 안 되는 라이선스

CC-BY-NC (Non-Commercial)

NC 가 핵심입니다.

비상업적 용도만 가능.

회사 업무에 쓰면 라이선스 위반입니다. 취미나 연구라면 OK.

흔히 보이는 변종:

cc-by-nc-4.0
cc-by-nc-sa-4.0

일부 모델의 research only 표기

모델 카드에:

"This model is for research purposes only."

이런 문장이 보이면 회사 업무에 쓰면 안 됩니다.

Uncensored / Abliterated 변종

라이선스 자체는 원본을 따르지만, 안전장치를 제거한 모델은 회사 도입에 부적합 입니다.

- 사내 챗봇·고객 응대에 절대 안 됨
- 거부 회로가 우회되어 위험 발언이 그대로 나옴
- 컴플라이언스 이슈 큼

12.8 △ OpenRAIL — 책임 있는 사용

OpenRAIL-M 같은 라이선스는 사용 목적 제한 이 있습니다.

금지된 용도 예:

  • 사람 차별·해코지
  • 의료 진단 (의사 감독 없이)
  • 군사 활용

회사가 이런 용도가 아니라면 보통 OK입니다.


12.9 회사 도입 체크리스트

새 모델 도입 전에 묻는 5가지.

  1. 라이선스가 뭔가?
    • Apache 2.0 / MIT → 거의 OK
    • Llama / Gemma → 조건부 OK
    • CC-BY-NC → ❌
  2. 출처 표기가 필요한가?
    • 사내 도구 어딘가에 표기 가능 위치 확보
  3. 회사 규모 제한이 있는가?
    • Llama: 월 7억 MAU 초과 시 별도 계약
  4. 출력물의 권리는?
    • 대부분 자유롭게 사용 가능
    • 다른 LLM 학습에 쓰는 건 제한 있을 수 있음
  5. 금지된 사용 목적은?
    • 의료·법률 자동 결정·감시 등 주의

12.10 한국 회사가 흔히 빠지는 함정

“오픈소스 = 무료 = 마음대로 OK” 함정

오픈소스 라이선스도 의무가 있습니다. 출처 표기 안 하면 라이선스 위반 입니다.

“어차피 사내용인데 누가 알겠어” 함정

라이선스 위반은 추후 외부 공개·소스 감사 때 드러납니다. 파이프라인 깨고 다시 만드는 게 비용 더 큽니다.

“양자화 모델은 라이선스 다르겠지” 함정

아닙니다. 양자화 모델은 원본 라이선스를 그대로 따릅니다. bartowski 가 양자화한 Llama 모델도 Llama 라이선스를 따릅니다.

“파인튜닝하면 내 모델 되겠지” 함정

베이스 모델 라이선스를 여전히 따라야 합니다. Llama 베이스로 파인튜닝하면 결과물도 Llama 라이선스.


이 장에서 기억할 한 가지

회사 도입 라이선스 한 줄 결정 트리

  1. Apache 2.0 / MIT → ✅ 그냥 쓰세요
  2. Llama / Gemma / Qwen → ✅ 단, 표기·정책 확인
  3. CC-BY-NC / research only → ❌ 회사에서 쓰지 마세요
  4. Uncensored / Abliterated → ❌ 회사에서 쓰지 마세요

손으로 해볼 것

1. 후보 모델 라이선스 메모표 만들기

지금까지 봐온 모델들을 표로 정리하세요.

모델라이선스회사 사용
Qwen3-32B-InstructApache 2.0
Llama-3.3-70B-InstructLlama 3.3✅ (표기)
Gemma-3-27B-itGemma✅ (정책)

2. 회사 표기 위치 미리 정해두기

만약 사내 챗봇에 로컬 AI를 쓸 거라면, 다음 중 어디에 라이선스 표기를 둘지 정해두세요.

  • README에 “Built with Llama” 한 줄
  • 챗봇 푸터에 “Powered by …” 한 줄
  • 사내 위키에 모델 출처 페이지

다음 장에서는 벤치마크 점수 읽는 법 입니다.

“이 모델 MMLU 75점인데 좋은 거야?” 같은 질문에 답할 수 있게 됩니다.