전 세계가 열광하는 챗GPT에 대한 모든 것

챗GPT에 대해서 설명하고 있는 챗GPT/스크린 캡쳐

강수민 SPH KV 11

최근 뉴스를 읽다 보면 유독 자주 눈에 띄는 주제가 있다. 바로 ‘챗GPT’이다. 2022년 11월 처음으로 세상에 공개된 ‘챗GPT’는 미국의 AI 회사인 Open AI에서 개발한 인공지능 서비스이다. 챗GPT 웹사이트에 접속한 사용자가 질문을 입력하면 챗GPT는 그에 따른 응답을 한다.

여태껏 수많은 대화형 인공지능 서비스가 존재해왔지만 챗GPT가 주목받는 이유는 바로 다양한 주제의 질문에 대해 놀라울 정도로 자연스럽고 수준 높은 답을 생성할 수 있기 때문이다.

챗GPT는 다른 인공지능과 달리 인터넷에서 답을 찾지 않는다. 인공지능이 데이터를 학습하는 방식은 크게 두 가지로 나뉜다. 첫 번째는 지도학습으로 인간이 인공지능을 직접 교육하는 형태이고 두 번째는 인공지능이 스스로 검증을 통해 학습하는 강화학습이다.

기존에 있던 챗GPT와 비슷한 형식의 대화형 인공지능들은 대부분 지도학습을 하게 되어있지만, 챗GPT는 강화학습을 더 적극적으로 활용한다는 특징이 있다. 실패를 반복하며 그 과정에서 직접 오류를 고쳐 나가는 형식의 강화학습은 인간이 학습하는 방식과 비슷하다고 볼 수 있다. 챗GPT의 자세한 원리는 훨씬 더 복잡하다.

먼저 사용자가 채팅창에 메시지를 입력하면 챗GPT는 그것을 개별 단어(토큰)로 분해한다. 분해된 각 토큰은 인코딩이 되는데, 이때 토큰은 챗GPT가 쉽게 처리할 수 있는 숫자로 변환된다. 인코딩이 완료된 토큰은 ‘트랜스포머 네트워크’라는 곳에서 여러 과정을 거쳐 처리된다.

이 ‘트랜스포머 네트워크’는 사용자가 입력한 메시지를 분석한 후 다음에 올 단어에 대한 확률 분포를 만든다. 챗GPT는 이 확률 분포에서부터 표본을 뽑아 다음에 올 가장 적합한 단어를 조합해 채팅창에 다시 출력하는 식으로 대답한다.

챗GPT는 여러 나라의 언어를 매우 자연스럽게 구사할 수 있으며 전문가다운 지식과 활용에 있어서 편리함 덕분에 출시된 지 5일 만에 100만 명의 사용자를 모았다. 가끔 정확하지 않거나 부적절한 응답을 생성할 때도 있지만 Open AI는 이 점을 개선하기 위해 지속적으로 챗GPT를 업데이트하고 있다고 밝혔다. 덕분에 2월 말 기준으로 챗GPT의 하루 이용자 수는 2,500만 명을 돌파했다.

개인 사용자뿐만 아니라 현재 전 세계 수많은 기업이 챗GPT를 직접 업무에 적용할 방안을 검토 중이다. 우리나라에서는 대표적으로 삼성전자, CJ, 그리고 현대와 같은 대기업이 모두 챗GPT를 주제로 공부하고 있는 것으로 알려졌다.

기업 외에도 많은 학교 학생이 챗GPT를 활발하게 활용하고 있는데 이것에 대해선 아직 여러 가지 의견이 존재한다. 최근 세계적으로 인정받는 중고등학교 교육과정인 IB(International Baccalaureate) 본부에서 학생들이 챗GPT를 사용해 논문을 쓰는 것을 허용하겠다고 밝혀 갑론을박이 있었다. 실제로 IB 교육과정을 제공하는 인도네시아의 국제학교 중 몇 곳은 벌써 학생들에게 챗GPT 사용을 장려하고 있다.

학교에서의 챗GPT 사용 허가에 대한 가장 큰 우려 중 하나는 표절에 관련된 것으로, 인공지능이 작성한 논문을 자신의 것이라고 우기는 학생이 생길 것이라는 주장이다. 챗GPT가 쓴 글과 사람이 쓴 글은 분간하기 힘든 것이 사실이기 때문에 이를 악용하는 학생들이 있기 마련이다.

Open AI측에선 표절 관련 문제를 해결하기 위해 지난달 인공지능 표절 검사 프로그램을 출시했다. 검사하고 싶은 텍스트를 붙여 넣고 프로그램을 돌리면 “가능성 매우 낮음”, “가능성 낮음”, “알 수 없음”, “아마도” 또는 “가능성 있음”으로 레이블을 생성해 글의 표절 확률을 알려준다. 하지만 이 프로그램도 아직 정확도가 높지 않아 챗GPT의 표절 관련 논란은 한동안 지속될 것으로 보인다.