Fine-tuning — Lumo glossary

쉬운 설명

처음부터 LLM 같은 큰 모델을 학습시키려면 어마어마한 데이터와 자원이 듭니다. 그러나 이미 잘 학습된 공개 모델(Llama·Mistral·Qwen·Gemma 등)을 가져와 우리 도메인 데이터로 조금만 더 학습시키면, 일반 지식은 유지하면서 우리 분야의 말투·용어·판단 기준을 익힌 모델을 비교적 저렴하게 만들 수 있습니다.

왜 파인튜닝이 필요한가 하면, 일반 LLM은 '평균적인 답'을 잘 만들지만 '우리만의 일'은 잘 못하기 때문입니다. 의료·법률·금융처럼 도메인 어휘가 중요한 분야, 회사 고유의 톤과 문법으로 답변하게 만들고 싶을 때, 답변 형식(JSON·구조화 출력)을 일정하게 따르게 만들고 싶을 때 효과가 큽니다. 모델이 새 사실을 외우는 게 아니라, '이런 입력엔 이런 모양으로 답한다'는 패턴을 익히는 일에 가깝습니다.

흐름은 보통 세 단계입니다. ① 학습 데이터를 (입력, 좋은 출력) 쌍으로 정리. ② 베이스 모델을 골라 정리한 데이터로 추가 학습. ③ 평가 데이터로 결과를 검증하고 필요하면 다시 데이터·하이퍼파라미터를 손봅니다. 모델 전체를 학습시키면 비용이 크니, LoRA·QLoRA 같은 방법으로 일부 파라미터만 학습시켜 비용을 더 낮추는 경우가 많습니다.

주의할 점: 파인튜닝이 항상 정답은 아닙니다. 단순히 모델이 회사 문서를 참고하길 원하는 거라면 RAG가 더 빠르고 유지보수도 쉽습니다. '말투·형식을 학습'은 파인튜닝, '지식 갱신'은 RAG로 나눠 보는 게 일반적입니다. 두 가지를 조합하는 경우도 많습니다.

파인튜닝의 위험: 학습 데이터가 작거나 편향되면 모델이 좁아집니다. 일반 능력은 떨어지는데 특정 패턴만 외워 버리는 '과적합'이 흔한 함정입니다. 또 학습 데이터에 민감 정보가 섞이면 모델이 그것을 출력으로 흘릴 수도 있어, 데이터 정제와 평가가 학습 자체만큼 중요합니다.

파인튜닝의 개념을 본문 안에서 다른 각도로 비춰 보는 편집형 일러스트. — FIG. 1파인튜닝을 다른 각도에서 다시 봅니다.

비유로 보면

베이스 모델은 명문대를 졸업한 사람, 파인튜닝은 그 사람에게 우리 회사의 신입 사원 교육을 시키는 일과 비슷합니다. 기본 교양은 이미 있으니, 회사 매뉴얼·말투·자주 쓰는 양식만 며칠 동안 익히면 곧 우리 일에 맞는 답변을 만들기 시작합니다.

어디에서 만나나

도메인 특화 챗봇(의료·법률·금융 상담), 회사 톤·브랜드를 따르는 마케팅 보조, 구조화 출력이 중요한 추출 모델(영수증·문서에서 필드 뽑기), 코드 에이전트의 특정 언어·프레임워크 적응이 대표 영역입니다. 오픈소스 모델 생태계가 풍부해지면서 작은 팀도 LoRA로 자체 파인튜닝 모델을 만들고 있습니다.

작은 예시

고객센터 챗봇을 만들 때, 일반 LLM을 그대로 쓰면 답변이 너무 일반적입니다. 회사의 과거 응대 기록 5천 건으로 파인튜닝하면, 같은 LLM이 그 회사 톤·약관 표현·자주 묻는 답변 패턴을 자연스럽게 따라 답하게 됩니다.

자주 하는 오해

오해

가장 흔한 오해는 '파인튜닝하면 모델이 새 사실을 외운다'고 믿는 것입니다. 실제로는 '이런 입력엔 이런 형태로 답한다'는 패턴을 익히는 데 강하고, 새 사실을 안정적으로 외우는 데는 약합니다. 새 지식이 필요하면 RAG가 더 적합합니다.

한 줄 정리

파인튜닝은 '말투·형식'을 가르치는 도구, RAG는 '사실·자료'를 가져오는 도구. 둘을 같이 써서 가장 큰 효과를 내는 경우가 많습니다.