본문 바로가기
인공지능 (AI)

LLM(대형 언어 모델)의 개념과 차이 (생성 AI, 머신러닝, NLP)

by worldproblemsolver 2024. 12. 17.

 

2022년 말에 Chat GPT가 발매된 지 2년이 되어가고 있습니다. 지난 시간동안 Open AI의 Chat GPT를 비롯해 구글의 Gemini, Anthropic의 Claude 등 인공지능을 활용한 제품들이 많이 쏟아져 나오고 있습니다.

아마 위 제품들을 써보셨다면, LLM이라는 단어를 많이 들어보셨을 것이라 생각합니다. LLM이란 자연어 처리 기술을 이용해 인간의 언어를 이해할 수 있는 AI 모델입니다. 한마디로, 이 전 포스팅에서 언급했던 딥러닝의 구조인 '인공신경망'을 사용하는 모델입니다.

 

 

뇌와 인공신경망(뉴럴 네트워크) 개념 차이, 발전과정

이 전 포스팅에서 인공지능의 딥러닝이란 뉴럴 네트워크를 이용한 학습이라고 말씀드렸던 적이 있습니다. 그리고 충분한 양의 데이터만 있다면 이 뉴럴 네트워크를 통해 사람의 도움 없이 인공

lets.hope2solveproblems.com

 

그러나, 아직도 많은 분들에게 있어서 LLM이라고는 미지의 존재이며, 그 기능이나 이용 방법, 가능성에 대해서는 충분히 알지 못하고 있습니다.

그래서 이번 포스팅에서는, LLM의 기본적인 개념에 대해서 설명해보도록 하겠습니다.


LLM(대형 언어모델)이란

LLM(Large Language Models)이란, 한국어로 '대형 언어 모델'이라고도 불리며, ChatGPT나 Gemini라고 하는 생성 AI계 서비스의 기반이 되는 기술입니다. 2023 - 2024년은 'AI의 해'로 불렸던 것에서 알 수 있듯이 요즘 비즈니스 트렌드는 생성 AI로 도배되어 있는 수준입니다.

그러나, 그 기초가 되는 LLM(대형 언어 모델)은 의외로 알려져 있지 않습니다. 그래서 LLM(대형 언어 모델)이란 원래 무엇인지, 또 LLM과 관련성이 높은 용어에 대해 알기 쉽게 다뤄보도록 하겠습니다.


본래 언어모델의 뜻

LLM은 한국어로 '대형 언어 모델'이라고 부릅니다. 하지만 원래 이 '언어 모델'이란 도대체 어떤 것일까요?

간단히 말해서 언어 모델이란 컴퓨터가 사람의 말을 이해하고 그것을 사용해서 말하기 위한 '교과서'와 같은 것입니다.

예를들어 우리가 학교에서 영어를 배울 때 먼저 문법이나 단어를 알고, 그리고나서 많은 영문을 읽고 학습합니다. 그와 마찬가지로 컴퓨터도 대량의 텍스트 데이터를 학습하여 어떤 단어가 어느 뒤에 오는지, 어떤 글이 자연스러운지를 배웁니다.

언어 모델이 있기 때문에 컴퓨터는 우리의 질문에 답하거나 새로운 문장을 만들 수 있습니다.

보다 친숙한 예를 들면, 스마트폰으로 다음에 치고 싶은 단어의 예측이 나오는 것도, 언어 모델이 탑재된 AI가 문맥을 판단하고 있기 때문입니다.

최근에는 AI 기술이 빠르게 진전됨에 따라 지금까지와는 비교가 안 될 정도로 대규모 데이터셋을 언어 모델에 학습시킬 수 있게 되었습니다.

그래서 최신 언어 모델을 '대형 언어 모델'이라고 부르게 된 것입니다.


생성 AI와의 차이점

생성 AI(Generative AI)와 LLM(대형 언어 모델)은 매우 비슷하기 때문에, 함께 묶여 있지만, 엄밀하게는 다릅니다.

생성 AI란, 이름 그대로 새로운 컨텐츠를 '생성'할 수 있는 AI의 총칭입니다. ChatGPT나 Gemini가 여기에 해당합니다.

그에 비해 LLM이란, 방대한 데이터 세트를 이용해 언어의 이해와 생성을 실시하는 AI 모델을 말합니다. GPT-3.5나 BERT 등이 이에 해당합니다.

엄밀히 설명하면 계층 구조 등에서 다른 점은 있지만, 모두 AI의 일종입니다. 하지만 LLM은 그 중에서도 텍스트 이해 및 생성에 특화되어 있습니다. 생성 AI처럼 이미지나 음성, 동영상을 생성할 수 없습니다.


NLP(자연어 처리)과의 차이

LLM(대형 언어모델)과 매우 관계성이 깊은 용어의 하나로 'NLP(자연어 처리)'가 있습니다. NLP(자연어 처리)도 LLM(대형 언어 모델)과 마찬가지로 컴퓨터가 인간의 언어를 이해하고 해석하고 생성하는 기술입니다.

NLP는 감정 분석과 기계 번역, 텍스트 요약, NER (이름을 가진 개체 인식)등 폭넓은 작업을 포함한 광범위한 분야를 가리킵니다. 이에 비해 LLM은 NLP의 일부로, 대량의 텍스트 데이터를 이용해 훈련된 심층 학습 모델을 말합니다.

즉, NLP는 언어에 관한 다양한 작업을 포괄하는 넓은 개념이고, LLM은 그 중 특히 고도의 텍스트 생성과 이해를 실현하는 기술입니다.

최근에는 LLM이 많은 NLP 작업을 효율적으로 처리할 수 있게 되었기 때문에 그 경계는 점점 모호해지고 있습니다.


머신러닝과의 차이

머신러닝은 컴퓨터에 데이터를 주고 그것을 기초로 학습시키는 기술(지도 학습)을 말합니다.

머신러닝을 통해 컴퓨터는 새로운 데이터에 대해 예측이나 판단을 할 수 있게 됩니다.

예를 들어 손으로 쓴 숫자를 인식하기 위한 모델을 학습시킬 경우 대량의 손으로 쓴 숫자의 데이터를 주어 어떤 숫자가 어떻게 생겼는지 학습시킵니다.

한편, LLM(대형 언어 모델)은, 텍스트 데이터를 집중적으로 학습시킨 심층 학습 모델의 일종입니다.

대량의 텍스트 데이터를 학습함으로써 문장의 구조와 맥락을 이해하고 새로운 문장을 생성하거나 질문에 답할 수 있습니다.

즉, 기계학습은 넓은 범위의 데이터 유형에 적용 가능한 학습 기술이며, LLM은 그 중에서도 특히 텍스트 데이터에 특화된 기술입니다.

LLM은 기계학습 기술을 기반으로 하기 때문에 공통점도 많지만 그 응용 범위나 특성에 있어서는 다른 점이 많이 있습니다.

 

  생성 AI 머신 러닝 NLP (자연어 처리) LLM (대형 언어 모델)
목적 새로운 콘텐츠 및 데이터 생성 데이터에서 패턴을 학습하고 예측 및 분류 컴퓨터가 인간의 언어를 이해, 해석, 생성 자연어 처리 및 이해
바탕 기술 생성 모델 머신 러닝, 심층 학습, 강화 학습 알고리즘과 수법의 진화 트랜스포머 모델
머신러닝, 심층 학습

학습 데이터 대량의 라벨이 아닌 데이터 다양한 데이터 타입 - 대규모 텍스트 데이터 세트
사용 예시 문장 생성, 이미지 생성, 음악 생성 이미지 인식, 음성 인식, 예측 분석 감정 분석, 기계 번역, 텍스트 마이닝, 텍스트 요약 등 질문 응답, 텍스트 요약, 번역
출력 형식 텍스트, 새로운 이미지, 음악 예측 모델, 분류 모델 등 - 텍스트
대표 제품 ChatGPT, Gemini, Midjourney, DALL-E - - GPT-3.5, GPT-4, Gemini 1.5, BERT
고려 사항 - - 적은 리소스로 실행 가능 고성능 GPU 필요
상대적으로 높은 리소스 필요

 

 

저출산 고령화와 노동인구 감소가 사회문제가 되고 있는 요즘 한국에서 AI 도입은 최우선 사항이라고도 할 수 있습니다. 생성 AI의 기반 모델인 LLM에 대해 올바르게 이해해서 앞으로 우리에게 다가올 AI시대에 대비해두는 것은 어떨까요?