본문 바로가기
인공지능 (AI)

Word2vec의 활용 범위와 사례

by worldproblemsolver 2025. 1. 2.

 

지난 블로그 포스팅에서는 Word2vec의 개념과 구조에 대해서 알아보았습니다.

 

Word2vec의 개념과 구조

올해는 다양한 분야에 있어서, AI를 탑재한 제품/서비스들이 적극적으로 활용되기 시작하고 있습니다. 그중에서도, 커뮤니케이션에 꼭 필요한 언어의 분야에서 많은 사람들이 편

hope2solveproblems.com

 

그렇다면 Word2vec를 이용하면 어떤 것을 할 수 있을까요? 이번 포스팅에서는 Word2vec가 할 수 있는 일에 대해서 자세히 다뤄보도록 하겠습니다.


Word2vec 할 수 있는 것

연산 처리

Word2vec는 문장 속의 단어를 0과 1만이 아닌 실수치 벡터로 파악하고 있습니다. 그렇기 때문에 단어끼리 더하거나 뺀다고 하는 연산 처리를 실시하는 것도 가능한 것입니다. 예를 들어보자면 다음과 같은 공식으로 나타내볼 수 있습니다: Prince – Masculinity + Femininity = Princess(왕자님 – 남자 + 여자 = 공주님).

요컨대 왕자님으로부터 '남자'라는 요소를 뽑고, 거기에 '여자'라는 요소를 더함으로써 '공주님'이 된다는 것입니다.

 

감정 분석

Word2vec에서는 글을 통해서 글쓴이의 감정을 읽어가는 '감정 분석'을 할 수도 있습니다.

예를 들어 미국의 심리학자인 폴 에크먼(Paul Ekman)이 제창한 분노, 혐오, 두려움, 행복, 슬픔, 놀람이라는 6가지 기본 감정과 문장 내 단어 간의 의미 벡터의 크기를 비교함으로써 그 문장이 6가지 기본 감정에 대해서 어느 정도 근처에 있는지 추측해 나가는 것입니다.

 

문장 생성과 요약

Word2vec는 RNN(재귀형 신경망) 과의 조합에 의해 문장의 자동 생성이나 요약도 실현 가능합니다.

예를 들어, 한강 작가의 작품을 학습시킴으로써 '한강 작가의 문장에 가까운 분위기를 가진 문장'을 새롭게 만들어 낼 수 있습니다. RNN을 활용함으로써 한강 작가의 '단어 정렬'이나 '많이 사용되는 표현'이라는 버릇까지 재현할 수 있게 되는 것입니다.


Word2vec 활용 사례

그렇다면 Word2vec는 실제로 어떤 장소에서 활용되고 있을까요? 지금부터는 Word2vec의 활용 사례에 대해서 자세히 알아보겠습니다.

 

추천 시스템

일반적인 추천 시스템에서는 '협업 필터링'이라는 알고리즘이 활용되고 있습니다. 이 필터링이란, '상품 A에 흥미를 나타내는 사람은 상품 B에도 흥미를 나타내는 경향이 있기 때문에, 상품 A에 흥미를 나타낸 유저에게는 상품 B를 추천한다'라고 나타낼 수 있는 구조입니다.

다만 인터넷 공간에서는 엄청난 수의 사용자와 상품이 있기 때문에 이 협업 필터링을 구현하기 위해서는 많은 양의 처리를 해야 합니다. 그런 경우에, 상품 ID나 유저 ID의 데이터에 Word2vec를 활용해서 상품 ID와의 벡터의 크기는 권장 정도와 갔다 와 같이 나타낼 수 있게 됩니다.

즉, 본래라면 방대한 처리가 필요한 시스템을 간략화할 수 있게 된다는 것입니다.

 

대화형 AI

챗봇이나 보이스봇과 같은 질의응답을 실시할 수 있는 '대화형 AI'에서는 Word2vec가 사용되고 있습니다. 그 대표적인 예로 꼽히는 것은 여고생 AI 로봇으로 큰 주목을 받은 '린나'입니다.

린나는 2015년 중순에 커뮤니케이션 앱 'LINE'에 의해서 처음 등장했습니다. 또한 같은 해 12월에는 Twitter에서도 서비스를 개시하였습니다. 린나는 LINE에서 등장하고 나서부터 1개월도 안되어 약 130만 유저를 기록했습니다. LINE의 린나에서는 채팅상에서 말을 걸면, 여고생이라고 하는 설정에 따른 대화를 즐길 수 있습니다.

고객 서포트로 활약하는 성실하고 정중한 챗봇과는 달리, "정말?", "웃어~"라고, 린나는 친숙한 말투까지 여고생 그 자체로 많은 유저들에게 놀라움을 안겨주었습니다. 또, 단순한 대화만으로는 금방 질려 버리기 때문에 '끝말잇기' 등의 간단한 게임을 하거나 일기를 써 주는 기능들이 탑재되어 있습니다.

 

리뷰 분석

위에서 Word2vec는 감정 분석을 가능하게 한다고 말씀드렸습니다. 이 Word2vec가 가진 '감정 분석'의 기술을 활용하면, 리뷰 분석을 실시하는 것도 가능합니다. 리뷰의 감정을 파악할 수 있게 되기 때문에 대량의 리뷰를 읽지 않아도 '대략적인 감정의 경향'을 파악할 수 있게 되는 것은 큰 특장점이라고 할 수 있습니다.

최근에는 다양한 분야에서 리뷰의 중요도가 높아지고 있기 때문에 향후는 상품 개선, 신상품 개발, 유행 예측 등에도 활용될 가능성이 있습니다.

 

기계 번역

Word2vec가 할 수 있는 것 중 하나로 '기계번역'도 들 수 있습니다. Word2vec의 개발자인 토마스 미콜로프(Tomáš Mikolov)는 Word2vec의 기술을 기계 번역에 응용할 수 있지 않을까 느끼고 기계 번역에 대한 응용에도 착수했습니다.

그 결과 딥러닝과 결합함으로써 Word2vec 주위의 단어에서 특정 단어를 예측하는 시스템에서 '기계 번역의 정확도'를 크게 높이는 데 성공한 것입니다.

참고로 구글이 개발한 'TensorFlow'라는 딥러닝 프레임워크 공식 튜토리얼에서는 TensorfFlow와 Word2vec를 조합하여 스페인어에서 영어로 번역하는 모델 구축을 경험할 수 있습니다.


이상으로 자연어 처리에 중요한 Word2vec의 기술을 활용함으로써 구현해낼 수 있는 영역과 활용 사례에 대해서 알아보았습니다.

 

단순 로봇 취급을 받던 AI에게 감정의 인식을 쥐여준 Word2vec. 앞으로의 Word2vec의 발전도 기대가 됩니다.