본문바로가기
표지이미지

- 청구기호: 303.483-24-55

- 서명: 미래 언어가 온다 : AI가 인간의 말을 지배하는 특이점의 세상

- 편/저자: 조지은

- 발행처: 미래의창()

서평
 과거와 현재를 잇는 언어의 미래를 짐작하다.
서평자
 조은경,서강대학교 글로벌한국학과 교수
발행사항
 704 ( 2024-11-20 )

목차보기더보기

프롤로그 미래 언어, 답은 인간에게 있다
1. 언어의 경계가 무너진다
2. 한류의 언어
3. 사유화되는 언어들
4. 멀티 모달 교육
5. AI와 언어 학습
6. 미래 세대의 문해력
7. 스크린 너머의 세상으로
8. 새로운 정체성의 시대
9. 1퍼센트의 인간다움
에필로그 미래 세대가 ‘말’을 잃어버리지 않도록

서평보기더보기

“이미 도래한 인공지능 시대에 기존 산업의 수많은 분야가 존폐의 기로에 서거나 새로운 기회에 들떠 있는 상황이다. 언어학자의 관점에서 보자면 언어 교육, 외국어 학습, 의사소통 문화가 뿌리째 흔들리는 상황이 온 것만은 분명하다. 디지털 중독을 걱정하면서도 우리는 아이들에게 스마트폰과 아이패드를 쥐여주었다. 그 폐해를 알면서도 SNS 세상 속으로 뛰어들었다. 우리가 두려워하는 것들은 사실 다 우리가 만든 것이다.” - 12~13쪽 이 책은 과거와 현재에 기반한 미래의 언어에 대해 대체로 긍정적 전망을 하고 있다. 또한 경험적 지식을 잘 읽히는 문체로 썼다는 점에서 누구에게나 잘 읽힐 듯하다. 저자는 과거와 현재 언어의 잠재력을 AI를 지렛대 삼아 그 미래를 짐작한다. 현재 시제의 제목 『미래 언어가 온다』의 본문은 수많은 추정 양태와 미래 시제인 ‘-을 것이다’의 문장으로 되어 있다. 저자는 코리안 디아스포라이기도 한 그녀의 딸, 제시를 키우면서 보게 되는 디지털 네이티브의 학습 방식과 과거 세대 학습 방식의 차이를 말하며 미래 세대의 학습이 어떻게 달라질지 가늠한다. 또 그가 지적한 AI의 한국어 울렁증, 인칭과 감정 표현의 어려움 등은 기계에 인간적 감성을 투영한 언어 기술의 한계를 말한다. 이 책을 읽다 보면 우리 모두가 지구 어딘가에서 미래 언어의 형체에 작은 파편을 더하며 살고 있다는 것을 깨닫게 된다. 저자는 그의 경험을 바탕으로 옥스퍼드 사전 편찬 과정에 한국의 문화가 반영된 언어를 매우 실감 나게 알려준다. 한국식 영어 단어 ‘스킨십’과 한국어 비표준어 신조어 ‘치맥’이 그 예이다. 언어적 전파가 얼마나 언어학의 범위를 넘어서는지 말하고 있다. 또 한류의 단어 ‘막내’, ‘아저씨’, ‘떡볶이’ 등도 등재될 준비를 하고 있다니 기쁘다. 우리가 영어로 알고 있는 ‘케첩’이 알고 보면 중국에서 온 단어이고 ‘커피’는 아랍과 터키에서 온 단어라는 이야기는 지구상의 문물이 어떻게 글로벌 확장이 되었는지를 알려준다. 언어의 역사가 어느 한 나라나 세대가 아닌 광범위한 영향을 주고받음을 일깨워주는 이야기들이다. 이 책은 세상의 빠른 변화를 담아내지 않는 국어사전의 문제점도 지적한다. 외국어 학문 용어를 한국어 용어로 번역하는 중에는 정교하지만, 어려운 한자를 빌려서 어렵게 읽히고 해석되는 단어를 만드는 경우를 종종 본다. 외래 신어를 한자의 뜻을 빌려 쓰는 것이나 한글로 음차하여 쓰는 것이나 뭐가 다른가 싶다. 이런 점에서 저자의 다국어 포용적 생각을 옹호한다. 한글은 소리글자이다. 어떤 언어든 글자로 적을 수 있다. AI 언어모델을 만드는 전형적인 방법으로 부정 대조 학습(negative contrastive learning)이 있다. 목적 범주를 학습하기 위해 대조되는 범주의 특징을 학습하는 것이다. 영어 모델과 다른 한국어 모델이 잘 만들어지려면 한국적 특징이 데이터에 잘 내포되어 학습되어야 한다. AI 언어모델이 한국적인 특성을 잘 표현하려면 데이터가 한국적 특성을 잘 보유하고 있어야 하기 때문이다. 따라서 한국어 문법학자, 사전학자, 국어순화 운동가의 활동은 비록 보수적으로 보일지라도 한국의 정체성을 지켜나가려는 것일 뿐만 아니라 한국어 AI 언어모델에 보탬이 되는 것이기도 하다. 저자는 이렇게 말한다. “기성세대는 미래 세대가 AI 네이티브라는 사실을 분명히 알아야 한다. … AI 네이티브 세대들은 기성세대가 상상하지 못했던 방식으로 학습하고 있다.” 그러나 우리는 AI 언어모델이 주는 서비스만 볼 것이 아니라 그것의 긍정적 부정적 작용을 같이 볼 수 있으면 좋겠다. 생성 언어모델의 알고리즘인 다음 단어 추정(NTP : Next Token Prediction)은 적합한(legitimate) 생성만 하는 것이 아니라 착오(hallucination) 생성도 한다. 마치 좋은 의도로 만든 정책이 부작용도 있듯이 말이다. 사람의 창의적인 활동이나 문제의 해법을 고안해 내는(figure it out) 힘은 무에서 유를 창조하는 것이 아니라, 과거부터 현재까지 배운 것을 이해한 것에 바탕을 둔다. 생성 언어모델을 활용함에 있어 거의 코딩하지 않고도 언어모델의 광범위한 어휘력을 바탕으로 해법을 만들어가는 생각 고리(chain of thoughts) 프롬프팅(prompting)이란 것이 있다. 이는 언어모델에 단계적 해결의 문장을 학습시키는 것이다. 이 방식은 인간의 미래 언어 교육에도 유용할 것이다. AI 언어모델을 훈련하기 위해 또 잘 활용하기 위해 어떻게 절차적 지식을 잘 만들어가느냐의 문제이기 때문이다. 이는 저자가 정의하고 일컫는 AI 네이티브가 AI 기술 발전의 수혜자에 머물기보다 능동적으로 그 발전을 같이 이끌어갈 한 방안이 아닌가 한다. 다층 신경망이니 고성능 하드웨어 같은 기술 분야로 뛰어들지 않고서 말이다.