2장. AI, 머신러닝, 딥러닝, 생성형 AI의 차이
1. AI라는 말이 너무 넓게 쓰이고 있다
요즘은 거의 모든 곳에서 AI라는 말을 사용한다.
AI 검색, AI 챗봇, AI 번역, AI 추천, AI 이미지 생성, AI 코딩 도구, AI 상담원 같은 표현을 쉽게 볼 수 있다.
그런데 막상 “AI가 정확히 무엇인가?”라고 물어보면 설명하기가 쉽지 않다.
이유는 AI라는 말이 하나의 특정 기술만 가리키는 것이 아니라, 여러 기술을 포함하는 큰 범위의 개념이기 때문이다.
예를 들어 다음 기능들은 모두 AI라고 부를 수 있다.
- 쇼핑몰에서 내가 관심 있을 만한 상품을 추천해주는 기능
- 이메일에서 스팸 메일을 자동으로 분류하는 기능
- 휴대폰 사진첩에서 사람 얼굴을 인식하는 기능
- 음성을 텍스트로 변환하는 기능
- 문장을 다른 언어로 번역하는 기능
- 질문에 답변하는 챗봇 기능
- 이미지를 만들어주는 기능
- 코드를 작성해주는 기능
이 기능들은 모두 AI라고 부를 수 있지만, 내부 동작 방식은 서로 다를 수 있다.
어떤 기능은 단순한 규칙 기반에 가깝고, 어떤 기능은 머신러닝 모델을 사용한다.
또 어떤 기능은 대규모 언어 모델을 사용하고, 어떤 기능은 이미지 생성 모델을 사용한다.
그래서 AI를 제대로 이해하려면 먼저 큰 개념부터 정리해야 한다.
AI
→ 머신러닝
→ 딥러닝
→ 생성형 AI
→ LLM
이 장에서는 이 용어들이 어떻게 다르고, 서로 어떤 관계가 있는지 쉽게 정리한다.
2. AI는 가장 큰 범위의 개념이다
AI는 Artificial Intelligence의 약자다.
한국어로는 인공지능이라고 부른다.
AI는 사람이 하던 지능적인 작업을 컴퓨터가 수행하도록 만드는 기술 전체를 의미한다.
여기서 말하는 지능적인 작업은 꼭 사람처럼 생각한다는 뜻은 아니다.
사람이 판단하거나 분류하거나 예측하거나 생성하던 일을 컴퓨터가 대신할 수 있다면 넓은 의미에서 AI라고 볼 수 있다.
예를 들어 다음과 같은 작업이 있다.
- 이 메일이 스팸인지 아닌지 판단하기
- 사용자가 좋아할 만한 영상을 추천하기
- 사진 속에 고양이가 있는지 확인하기
- 고객 문의 내용을 자동으로 분류하기
- 다음 달 매출을 예측하기
- 사용자의 질문에 자연어로 답변하기
이런 작업은 모두 AI의 범위에 들어간다.
다만 AI라고 해서 모두 ChatGPT 같은 방식으로 동작하는 것은 아니다.
예전 AI 시스템은 사람이 직접 규칙을 정하는 방식이 많았다.
예를 들어 스팸 메일을 분류한다고 해보자.
- 제목에 "무료"가 포함되어 있으면 스팸 가능성 증가
- 본문에 "대출"이 반복되면 스팸 가능성 증가
- 발신자가 차단 목록에 있으면 스팸 처리
이런 방식은 사람이 규칙을 직접 만든다.
규칙이 단순한 업무에는 꽤 잘 동작할 수 있다.
하지만 현실의 데이터는 복잡하다.
스팸 메일도 단어를 바꿔가며 우회할 수 있고, 정상 메일에도 “무료”, “대출” 같은 단어가 들어갈 수 있다.
그래서 사람이 모든 규칙을 직접 만드는 방식에는 한계가 있다.
이 한계를 줄이기 위해 등장한 방식이 머신러닝이다.
AI는 가장 넓은 개념이다.
사람이 하던 판단, 분류, 예측, 생성 같은 작업을 컴퓨터가 수행하게 만드는 기술 전체를 AI라고 볼 수 있다.
3. 머신러닝은 규칙을 직접 만들지 않고 데이터에서 배우는 방식이다
머신러닝은 Machine Learning을 한국어로 표현한 말이다.
말 그대로 기계가 학습한다는 뜻이다.
기존 규칙 기반 방식에서는 사람이 직접 조건을 만든다.
if 제목에 "무료"가 포함되어 있으면:
스팸 점수 + 10
하지만 머신러닝은 사람이 모든 규칙을 직접 작성하지 않는다.
대신 많은 데이터를 넣고, 컴퓨터가 그 데이터 안에서 패턴을 찾도록 한다.
예를 들어 스팸 메일 분류 모델을 만든다고 해보자.
개발자는 다음과 같은 데이터를 준비한다.
메일 A → 스팸
메일 B → 정상
메일 C → 스팸
메일 D → 정상
메일 E → 정상
모델은 이 데이터를 학습하면서 어떤 표현, 단어 조합, 발신 패턴이 스팸과 관련 있는지 찾아간다.
사람이 “무료라는 단어가 있으면 무조건 스팸”이라고 직접 규칙을 박아두는 것이 아니다.
데이터를 보고 스팸일 가능성이 높은 패턴을 학습하는 것이다.
이 차이가 중요하다.
규칙 기반 방식은 사람이 규칙을 만든다.
머신러닝 방식은 데이터에서 규칙에 가까운 패턴을 찾아낸다.
규칙 기반 방식:
사람이 규칙을 만든다
→ 컴퓨터는 그 규칙대로 판단한다
머신러닝 방식:
사람이 데이터를 제공한다
→ 컴퓨터가 데이터에서 패턴을 찾는다
→ 그 패턴을 기반으로 판단한다
예를 들어 상품 추천도 비슷하다.
규칙 기반으로 추천한다면 이렇게 만들 수 있다.
사용자가 운동화를 봤으면 운동복을 추천한다.
사용자가 노트북을 봤으면 마우스를 추천한다.
하지만 머신러닝 기반 추천은 더 많은 데이터를 본다.
- 이 사용자가 본 상품
- 비슷한 사용자가 구매한 상품
- 장바구니에 넣었다가 구매하지 않은 상품
- 특정 시간대에 많이 구매되는 상품
- 가격대별 구매 전환율
- 클릭 후 구매까지 걸린 시간
이 데이터를 기반으로 사용자가 관심 가질 가능성이 높은 상품을 추천한다.
머신러닝은 사람이 모든 규칙을 직접 작성하지 않고, 데이터에서 패턴을 학습해 판단하는 방식이다.
4. 딥러닝은 머신러닝의 한 종류다
딥러닝은 Deep Learning을 한국어로 표현한 말이다.
딥러닝은 머신러닝의 한 종류다.
즉, AI 안에 머신러닝이 있고, 머신러닝 안에 딥러닝이 있다고 볼 수 있다.
AI
└── 머신러닝
└── 딥러닝
딥러닝은 사람의 뇌 구조에서 아이디어를 얻은 인공신경망을 사용한다.
여기서 중요한 것은 “진짜 사람처럼 생각한다”는 뜻이 아니다.
여러 단계의 계산 층을 쌓아서 복잡한 패턴을 학습할 수 있게 만든 방식이라고 이해하면 된다.
예를 들어 이미지를 인식한다고 해보자.
고양이 사진을 구분하는 모델을 만든다고 했을 때, 단순한 머신러닝 방식에서는 사람이 특징을 정리해야 하는 경우가 많았다.
- 귀가 뾰족한가?
- 수염이 있는가?
- 눈 모양이 어떤가?
- 털 색깔이 어떤가?
하지만 딥러닝은 이미지의 픽셀 데이터를 바탕으로 여러 단계의 특징을 스스로 학습할 수 있다.
처음 단계에서는 단순한 선이나 모서리 같은 특징을 보고,
다음 단계에서는 눈, 귀, 코 같은 부분을 보고,
더 깊은 단계에서는 전체적인 고양이 형태를 인식하는 식이다.
물론 실제 내부 동작은 훨씬 복잡하지만, 개념적으로는 이렇게 이해할 수 있다.
낮은 단계:
선, 모서리, 색상 차이 같은 단순 특징 학습
중간 단계:
눈, 귀, 코, 무늬 같은 부분 특징 학습
높은 단계:
고양이, 강아지, 자동차 같은 전체 대상 인식
딥러닝이 강력한 이유는 사람이 일일이 특징을 정의하지 않아도 복잡한 데이터를 학습할 수 있기 때문이다.
그래서 이미지 인식, 음성 인식, 자연어 처리 같은 분야에서 큰 성능 향상이 있었다.
딥러닝은 머신러닝의 한 종류다.
여러 계산 층을 쌓은 인공신경망을 사용해 이미지, 음성, 문장처럼 복잡한 데이터의 패턴을 학습한다.
5. 생성형 AI는 새로운 결과물을 만들어내는 AI다
생성형 AI는 Generative AI를 한국어로 표현한 말이다.
기존 AI는 주로 분류하거나 예측하는 데 많이 사용되었다.
예를 들어 다음과 같은 작업이다.
- 이 메일은 스팸인가?
- 이 사진은 고양이인가?
- 이 고객은 이탈 가능성이 높은가?
- 이 거래는 이상 거래인가?
이런 AI는 입력을 보고 특정 결과를 판단한다.
반면 생성형 AI는 새로운 결과물을 만들어낸다.
- 질문에 대한 답변 생성
- 문서 요약
- 이메일 초안 작성
- 코드 생성
- 이미지 생성
- 음성 생성
- 번역문 생성
- 회의록 정리
즉, 생성형 AI는 단순히 “맞다/아니다”를 판단하는 것을 넘어, 사람이 사용할 수 있는 결과물을 만들어준다.
예를 들어 고객 문의를 분류하는 기존 AI는 이렇게 동작할 수 있다.
입력:
"결제가 두 번 됐어요."
출력:
결제 문의
생성형 AI는 여기서 한 단계 더 나아갈 수 있다.
입력:
"결제가 두 번 됐어요."
출력:
고객님, 불편을 드려 죄송합니다.
결제 내역 확인을 위해 주문번호와 결제 시간을 알려주시면
중복 결제 여부를 확인한 뒤 안내드리겠습니다.
이처럼 생성형 AI는 답변 자체를 만들어낼 수 있다.
개발 업무에서도 마찬가지다.
기존 도구가 문법 오류를 알려주는 수준이었다면, 생성형 AI는 다음과 같은 일을 할 수 있다.
- 요구사항을 바탕으로 API 코드 초안 만들기
- 기존 코드를 읽고 리팩토링 방향 제안하기
- 테스트 코드 작성하기
- README 문서 작성하기
- 에러 로그를 보고 원인 후보 정리하기
이 때문에 생성형 AI는 개발자에게 큰 영향을 주고 있다.
생성형 AI는 텍스트, 코드, 이미지, 음성처럼 새로운 결과물을 만들어내는 AI다.
ChatGPT, Claude, Gemini, 이미지 생성 AI, AI 코딩 도구 등이 여기에 포함된다.
6. LLM은 언어를 다루는 생성형 AI다
LLM은 Large Language Model의 약자다.
한국어로는 대규모 언어 모델이라고 부른다.
LLM은 많은 양의 텍스트 데이터를 학습해서 언어를 이해하고 생성하는 데 특화된 AI 모델이다.
여기서 말하는 언어는 사람의 말만 의미하지 않는다.
개발자 입장에서는 코드도 중요한 언어다.
그래서 LLM은 다음과 같은 작업을 할 수 있다.
- 질문에 답변하기
- 긴 문서 요약하기
- 문장 번역하기
- 이메일 작성하기
- 코드 작성하기
- 코드 설명하기
- 에러 메시지 분석하기
- SQL 작성하기
- 정규식 만들기
LLM이 답변을 만드는 방식은 사람처럼 정확히 이해하고 생각하는 방식과는 다르다.
LLM은 입력된 문맥을 바탕으로 다음에 올 가능성이 높은 단어 또는 토큰을 예측하면서 문장을 만들어간다.
예를 들어 다음 문장이 있다고 해보자.
오늘 날씨가 너무 추워서 두꺼운
이 다음에는 “옷”, “외투”, “코트” 같은 단어가 올 가능성이 높다.
LLM은 훨씬 더 복잡한 방식으로 이 과정을 수행한다.
긴 문맥을 보고, 질문의 의도를 파악하고, 적절한 답변 형태를 만들어낸다.
개발 코드도 비슷하다.
function add(a, b) {
return
이 다음에는 a + b; 같은 코드가 올 가능성이 높다.
물론 실제 LLM은 단순 자동완성보다 훨씬 복잡하다.
문맥, 패턴, 코드 구조, 주석, 함수명 등을 함께 보고 다음 내용을 생성한다.
LLM은 텍스트와 코드를 다루는 생성형 AI 모델이다.
문장을 이해하는 것처럼 보이지만, 내부적으로는 문맥을 기반으로 다음에 올 가능성이 높은 내용을 생성하는 방식에 가깝다.
7. AI, 머신러닝, 딥러닝, 생성형 AI의 관계
지금까지 설명한 내용을 관계로 정리하면 다음과 같다.
AI
├── 규칙 기반 AI
├── 머신러닝
│ └── 딥러닝
│ ├── 이미지 인식 모델
│ ├── 음성 인식 모델
│ ├── 추천 모델
│ └── 생성형 AI
│ ├── LLM
│ ├── 이미지 생성 모델
│ ├── 음성 생성 모델
│ └── 멀티모달 모델
이 구조에서 AI가 가장 큰 개념이다.
머신러닝은 AI를 구현하는 방법 중 하나다.
딥러닝은 머신러닝의 한 종류다.
생성형 AI는 새로운 결과물을 만드는 AI다.
LLM은 생성형 AI 중에서도 언어와 코드를 다루는 모델이다.
간단히 말하면 이렇게 정리할 수 있다.
| 용어 | 쉽게 설명하면 |
|---|---|
| AI | 사람이 하던 지능적인 일을 컴퓨터가 하게 만드는 전체 기술 |
| 머신러닝 | 데이터를 통해 패턴을 학습하는 AI 방식 |
| 딥러닝 | 인공신경망을 깊게 쌓아 복잡한 패턴을 학습하는 머신러닝 방식 |
| 생성형 AI | 텍스트, 코드, 이미지, 음성 같은 새 결과물을 만드는 AI |
| LLM | 언어와 코드를 다루는 대규모 생성형 AI 모델 |
예를 들어 “고객 문의 자동 처리 시스템”을 만든다고 해보자.
이 시스템 안에는 여러 종류의 AI가 함께 들어갈 수 있다.
고객 문의가 어떤 유형인지 분류
→ 머신러닝 또는 딥러닝
고객 문의 내용을 요약
→ 생성형 AI
고객에게 답변 초안 작성
→ LLM
고객이 보낸 첨부 이미지 분석
→ 비전 모델
상담 내용을 음성으로 읽어주기
→ 음성 생성 모델
즉, 하나의 서비스 안에서도 여러 AI 기술이 섞여 사용될 수 있다.
그래서 개발자는 AI를 하나의 기술로만 보면 안 된다.
어떤 문제를 해결하려는지에 따라 적절한 AI 방식을 선택해야 한다.
8. 생성형 AI가 주목받는 이유
AI는 예전부터 있었다.
추천 시스템, 스팸 필터, 음성 인식, 이미지 인식 같은 기술은 이미 오래전부터 사용되어 왔다.
그런데 최근 생성형 AI가 특히 주목받는 이유는 사용 방식이 매우 직관적이기 때문이다.
기존 AI 기능은 보통 특정 서비스 안에 숨어 있었다.
예를 들어 추천 시스템은 쇼핑몰이나 영상 플랫폼 안에서 동작한다.
스팸 필터는 메일 서비스 안에서 동작한다.
사용자는 내부에 AI가 있다는 사실을 크게 의식하지 않는다.
반면 생성형 AI는 사용자가 직접 대화하듯 사용할 수 있다.
이 문서 요약해줘.
이 코드 설명해줘.
이 에러 원인 찾아줘.
이 내용을 보고 보고서 초안 만들어줘.
이 API 설계 괜찮은지 검토해줘.
이처럼 자연어로 요청하면 결과를 받을 수 있다.
이 점이 개발자에게 특히 중요하다.
과거에는 새로운 기술을 사용하려면 API 문서를 읽고, SDK를 설치하고, 예제 코드를 이해해야 했다.
하지만 생성형 AI는 먼저 질문해볼 수 있다.
AWS Lambda에서 Node.js로 S3 파일을 읽는 예제를 만들어줘.
각 코드가 무슨 역할을 하는지도 설명해줘.
그러면 AI는 코드와 설명을 함께 제공한다.
물론 그대로 믿으면 안 되지만, 처음 접근하는 속도는 훨씬 빨라진다.
생성형 AI가 주목받는 이유는 단순히 성능이 좋아졌기 때문만은 아니다.
사람이 사용하는 방식과 매우 잘 맞기 때문이다.
9. 개발자 관점에서 중요한 AI 유형
개발자가 모든 AI 분야를 깊게 알 필요는 없다.
하지만 실무에서 자주 만나게 될 AI 유형은 알아두는 것이 좋다.
9.1 텍스트 AI
텍스트 AI는 문장을 다루는 AI다.
대표적으로 다음 작업에 사용된다.
- 문서 요약
- 번역
- 이메일 작성
- 고객 문의 답변
- 회의록 정리
- 보고서 초안 작성
개발 업무에서는 요구사항 정리, 장애 보고서 작성, API 문서 생성 등에 활용할 수 있다.
9.2 코드 AI
코드 AI는 코드를 작성하거나 이해하는 데 도움을 주는 AI다.
- 코드 생성
- 코드 설명
- 리팩토링
- 테스트 코드 작성
- 에러 원인 분석
- PR 리뷰 보조
GitHub Copilot, Cursor, JetBrains AI, Claude Code 같은 도구가 여기에 해당한다.
코드 AI는 생산성을 크게 높일 수 있지만, 보안과 품질 검증이 반드시 필요하다.
9.3 이미지 AI
이미지 AI는 이미지를 이해하거나 생성하는 AI다.
- 이미지 속 객체 인식
- OCR
- 이미지 설명 생성
- 썸네일 생성
- 디자인 시안 생성
- 불법 이미지 탐지
서비스에 따라 이미지 검수, 프로필 이미지 필터링, 콘텐츠 모더레이션 등에 활용할 수 있다.
OCR은 이미지 안에 있는 글자를 텍스트로 추출하는 기술이다.
예를 들어 영수증 사진에서 금액과 날짜를 읽어내는 기능이 OCR에 해당한다.
9.4 음성 AI
음성 AI는 말소리를 다루는 AI다.
- 음성을 텍스트로 변환
- 텍스트를 음성으로 변환
- 실시간 자막 생성
- 통화 내용 요약
- 화자 구분
라이브 방송, 고객센터, 회의록 자동화 같은 분야에서 많이 사용된다.
STT는 Speech To Text의 약자로, 음성을 텍스트로 바꾸는 기술이다.
TTS는 Text To Speech의 약자로, 텍스트를 음성으로 바꾸는 기술이다.
9.5 멀티모달 AI
멀티모달 AI는 텍스트만 다루는 것이 아니라 이미지, 음성, 영상 등 여러 종류의 입력을 함께 처리하는 AI다.
예를 들어 사용자가 이미지를 올리고 이렇게 물어볼 수 있다.
이 화면에서 에러가 발생한 원인을 설명해줘.
또는 회의 음성과 화면 자료를 함께 분석해서 회의록을 만들 수도 있다.
멀티모달 AI는 앞으로 더 중요해질 가능성이 높다.
개발자 입장에서는 단순 챗봇을 넘어서, 이미지 분석, 음성 인식, 영상 이해까지 포함한 AI 기능을 만들 수 있게 된다.
멀티모달은 여러 종류의 데이터를 함께 다룬다는 뜻이다.
텍스트만 처리하는 것이 아니라 이미지, 음성, 영상까지 함께 이해하고 생성하는 AI를 멀티모달 AI라고 부른다.
10. AI를 배울 때 중요한 관점
AI를 배울 때 모든 수학과 알고리즘을 처음부터 깊게 공부할 필요는 없다.
물론 AI 모델을 직접 연구하거나 학습시키는 일을 한다면 수학, 통계, 선형대수, 확률, 최적화 같은 지식이 중요하다.
하지만 이 책의 대상은 AI 연구자가 아니라 AI를 활용해 서비스를 만들 개발자다.
개발자에게 더 중요한 질문은 다음과 같다.
- 이 문제에 AI가 필요한가?
- 어떤 AI 모델을 사용해야 하는가?
- 클라우드 AI를 쓸 것인가, 로컬 AI를 쓸 것인가?
- 데이터를 어떻게 넣어야 하는가?
- 응답을 어떻게 검증할 것인가?
- 비용은 얼마나 나올 것인가?
- 개인정보는 안전한가?
- 장애가 나면 어떻게 처리할 것인가?
즉, 개발자는 AI 모델 내부를 모두 직접 만들 필요는 없지만, AI를 시스템에 연결하고 운영할 수 있어야 한다.
비유하면 데이터베이스와 비슷하다.
개발자가 데이터베이스 엔진 내부 구조를 모두 직접 만들 필요는 없다.
하지만 인덱스가 무엇인지, 트랜잭션이 무엇인지, 쿼리가 왜 느려지는지는 알아야 한다.
AI도 마찬가지다.
모델을 직접 만들지 않더라도, 모델이 어떤 특성을 가지고 있는지, 어떤 상황에서 위험한지, 어떻게 서비스에 붙여야 하는지는 알아야 한다.
11. 정리
AI는 가장 넓은 개념이다.
AI 안에는 규칙 기반 방식도 있고, 데이터를 기반으로 학습하는 머신러닝도 있다.
머신러닝 안에는 인공신경망을 깊게 쌓아 복잡한 패턴을 학습하는 딥러닝이 있다.
그리고 최근 주목받는 생성형 AI는 텍스트, 코드, 이미지, 음성 같은 새로운 결과물을 만들어내는 AI다.
LLM은 생성형 AI 중에서도 언어와 코드를 다루는 모델이다.
ChatGPT, Claude, Gemini 같은 서비스가 대표적인 예다.
개발자에게 중요한 것은 이 용어를 외우는 것이 아니다.
중요한 것은 어떤 문제에 어떤 AI 방식을 적용할 수 있는지 이해하는 것이다.
스팸 분류에는 분류 모델이 적합할 수 있다.
문서 요약에는 LLM이 적합할 수 있다.
사내 문서 검색에는 RAG 구조가 필요할 수 있다.
실시간 자막에는 STT와 번역 모델이 필요할 수 있다.
이미지 검수에는 비전 모델이 필요할 수 있다.
AI를 하나의 마법 같은 기술로 보면 실제 서비스에 적용하기 어렵다.
AI를 여러 도구의 묶음으로 이해하면, 문제에 맞는 도구를 선택할 수 있다.
2장 핵심 요약
| 핵심 내용 | 설명 |
|---|---|
| AI는 가장 넓은 개념이다 | 사람이 하던 판단, 분류, 예측, 생성 같은 작업을 컴퓨터가 수행하게 만드는 기술 전체를 말한다. |
| 머신러닝은 데이터에서 학습한다 | 사람이 모든 규칙을 직접 만들지 않고, 데이터에서 패턴을 찾아 판단한다. |
| 딥러닝은 머신러닝의 한 종류다 | 인공신경망을 여러 층으로 쌓아 이미지, 음성, 문장처럼 복잡한 데이터를 학습한다. |
| 생성형 AI는 결과물을 만든다 | 텍스트, 코드, 이미지, 음성처럼 새로운 결과물을 생성한다. |
| LLM은 언어와 코드를 다룬다 | 질문 답변, 요약, 번역, 코드 생성 등에 사용되는 대규모 언어 모델이다. |
| 개발자는 AI를 도구로 이해해야 한다 | 문제에 따라 적절한 AI 방식을 선택하고, 서비스에 연결할 수 있어야 한다. |