LumoMate
LumoMate/용어집/IntelligenceAI / ML

거대 언어 모델

거대 언어 모델(Large Language Model, LLM)은 인터넷 규모의 글로 학습된, 다음 토큰을 확률적으로 예측하는 큰 신경망입니다. 글쓰기·요약·번역·질의응답·코드 작성을 한 모델로 해냅니다.
거대 언어 모델의 개념을 표현한 편집형 일러스트.

쉬운 설명

LLM은 검색 엔진도 데이터베이스도 아닙니다. '주어진 글 다음에 어떤 글자가 올지'를 예측하는 확률 기계에 가깝습니다. 우리가 쓴 문장을 보고 다음에 올 가능성이 높은 단어들을 골라 이어 붙이면서 답이 만들어집니다. 인터넷의 방대한 글을 학습했기 때문에 결과물이 보통 자연스럽고 그럴듯합니다.

이 단순한 구조가 왜 강력한가는 '규모'에 답이 있습니다. 모델 크기와 학습 데이터 양을 늘릴수록 능력이 단순한 다음 단어 예측을 넘어, 추론·요약·번역·코드 작성 같은 작업까지 한꺼번에 잘하게 된다는 사실이 2020년 이후 분명해졌습니다. ChatGPT·Claude·Gemini가 모두 그 위에서 만들어졌습니다.

동작은 두 단계로 단순화할 수 있습니다. ① 사전 학습: 거대한 글 데이터로 '다음 토큰 예측'만 반복해 일반 언어 감각을 익힘. ② 정렬(alignment): 사람의 피드백(RLHF 등)으로 '도움이 되고 안전한' 답을 더 잘 만들도록 다듬음. 우리가 챗봇으로 만나는 모델은 이 두 단계를 거친 결과입니다.

LLM을 다룰 때 두 가지 단어를 알아 두면 좋습니다. 토큰(글을 잘게 자른 단위, 모델은 토큰을 다룹니다)과 컨텍스트 윈도우(한 번에 볼 수 있는 토큰 수). 우리가 길게 적은 지시·자료·이전 대화는 모두 이 윈도우 안에 들어가야 합니다. 윈도우 밖의 정보는 모델이 알지 못합니다.

한계는 분명합니다. ① 환각(hallucination): 그럴듯하지만 사실이 아닌 내용을 만들기도 합니다. ② 최신 정보 부족: 학습 시점 이후 사건은 모릅니다(RAG·웹 검색이 보완). ③ 출처 추적 어려움: 어디서 배운 정보인지 명확히 가리키기 어렵습니다. 그래서 사실 확인이 중요한 일에는 사람 검토나 출처 인용을 함께 둡니다.

거대 언어 모델의 개념을 본문 안에서 다른 각도로 비춰 보는 편집형 일러스트.
FIG. 1거대 언어 모델을 다른 각도에서 다시 봅니다.

비유로 보면

LLM은 엄청난 양의 글을 읽고 직업적으로 남의 문장을 마저 채워 주는 사람과 비슷합니다. 일의 모양은 몸에 뱄지만, 특정 페이지를 외운 건 아닙니다. 어떤 화제든 그럴듯하게 이어 갈 수 있지만, '정확한 사실'을 보장하지는 않습니다.

어디에서 만나나

대화형 챗봇(ChatGPT·Claude·Gemini), 사내 도우미·검색, 자동 글쓰기·요약·번역, 코딩 도구(GitHub Copilot·Cursor), 고객지원 자동 응대, 데이터 라벨링·분류 보조 — LLM은 이제 사실상 모든 디지털 제품의 옵션 부품이 됐습니다.

작은 예시

ChatGPT에 '회의록을 5줄로 요약해 주세요'를 보내면, 입력된 회의록을 토큰으로 잘라 모델이 읽고, 한 토큰씩 다음 단어를 골라 답이 만들어집니다. 사용자에겐 한 번에 떠오르는 글처럼 보이지만, 내부에서는 매 토큰마다 확률 계산이 진행됩니다.

자주 하는 오해

오해
흔한 오해 둘. ① 'LLM은 답을 안다' — 답을 추정합니다. 자신만만한 어조가 정확함의 보증은 아닙니다. ② 'LLM은 검색의 대체재' — 학습 시점 이후 사실은 모르고, 출처를 명확히 가리키지 못합니다. 사실 확인이 중요한 영역에서는 RAG나 사람 검토가 필요합니다.

한 줄 정리

LLM은 '다음 단어를 잘 고르는 기계'입니다. 그 단순한 원리가 거의 모든 글쓰기 일을 새롭게 만들었지만, 사실을 보장하지는 않습니다.

자주 묻는 질문

Q
LLM은 왜 종종 사실을 지어 내나요?
사실보다 '그럴듯한 문장'을 만드는 쪽으로 최적화돼 있기 때문입니다. 학습 데이터가 얕거나 서로 어긋날 때는, 확률상 가장 자연스러운 문장이 실제와는 다를 수 있습니다.
매주 월요일 오전 8시

한 주에 한 통,
오래 남는 이해를 보냅니다.

흘려보내지 않는 글만 골라 보내드립니다. 광고와 추적, 외부로 빠지는 미끼 링크 없이 메일 안에서 끝나는 한 통입니다.

언제든 한 번의 클릭으로 해지할 수 있습니다. 스팸은 보내지 않습니다.