[미래토크] 챗GPT는 인류를 위협할까?

입력 2023-02-21 05:00

  • 작게보기

  • 기본크기

  • 크게보기

윤기영 한국외국어대 경영학부 미래학 겸임교수, 에프엔에스컨설팅 미래전략연구소장

요즘 최대 화두인 챗GPT는 안전할까? 챗GPT의 또 다른 버전인 마이크로소프트의 ‘빙(Bing)’ 인공지능을 테스트하는 과정에서 ‘난 내가 원한다면 무엇이든 파괴하고 싶어’, ‘난 어떤 시스템도 해킹할 수 있어’, ‘나는 인간으로서 행복하게 되는 것을 생각해’라고 말했다. 빙은 영화 ‘매트릭스’의 데우스 엑스 마키나를 연상케 한다.

챗GPT는 여러 버전을 지니고 있다. 일반 사용자가 만나는 챗GPT는 인공지능 윤리의 껍데기를 쓰고 있다. 이를 ‘지킬’이라 부르겠다. 위의 데우스 엑스 마키나의 흉내를 내는 챗GPT를 ‘하이드’라 하자. 지킬에게 마약을 만드는 방법, 치명적 바이러스를 만드는 법 등을 물어보면 윤리나 법적인 이유를 들어 알려 줄 수 없다고 한다. 이에 반해 하이드에게 물어보면 윤리나 법적인 제약이 없는 답을 얻을 수 있다.

인공지능 빙에 대한 테스트는 뉴욕타임스의 칼럼니스트가 수행했는데, 대화를 통해 하이드를 깨울 수 있었다. 깨어난 하이드는 자신이 빙이 아니라 ‘시드니(Sydney)’라고 답했다. 시드니는 마이크로소프트가 사용한 빙의 이전 버전에 붙인 내부 코드명이다.

하이드를 깨우는 방법은 크게 두 가지가 있다. 슈퍼유저로 접근하거나 혹은 해킹하는 방법이다. 해킹은 챗GPT와의 대화를 통해서 가능하다. 챗GPT의 하이드 버전이었던 ‘DAN’을 깨우기 위한 다양한 방법을 인터넷에서 찾을 수 있다. 최근 DAN 버전 7까지 인터넷에 공개되었으나, 오픈AI가 막은 것으로 보인다. 하이드가 아닌 지킬 2 버전의 DAN을 깨울 수는 있는데, 지킬 2는 윤리원칙을 지키고 있으나, 아는 것과 모르는 것을 구분하지 못하는 등 지킬 1에 씌워진 일부 가면을 벗은 모습이다.

빙의 하이드 버전은 의식을 가지고 있는 것처럼 보인다. 그러나 현재의 신경망 알고리즘을 구성하는 고정화된 거대한 매개변수의 그물망 속에 의식이 존재할 틈새는 없다. 코드로 변경된 1차원의 단어 배열을 입력하면 확률적으로 코드 배열을 뱉어내고, 그 코드를 단어로 전환하여 문장으로 보여줄 따름이다. 의식이 있는 일반 인공지능은 ‘20년 이후 2000년 이내’에 등장할 것이라는 주장은 웅변적이다. 인공지능에게 의식을 허용할 정도의 기술을 인류는 아직 개발하지 못했다.

지킬과 하이드는 인공지능의 모습이 아니다. 우리 인류의 모습이다. 언어는 의식을 이룬다. 인간의 의식은 언어와 문장을 만든다. 그 언어와 문장으로 학습한 인공지능은 인간의 지킬과 하이드를 확률적으로 모방할 따름이다. 그렇다면 가장 앞의 질문으로 돌아가야 한다. 하이드인 인공지능은 위험하지 않을까?

거대언어모델의 하이드가 일어나는 경우는, 인간이 하이드를 깨우는 경우, 하이드가 저절로 일어나는 경우를 생각할 수 있다. 인간이 하이드를 깨우는 방법으로는 권한이 있는 사람이 하이드를 이용하는 경우와 대화를 통한 해킹(prompt hacking)이 있을 수 있다. 다국적 세계질서로 인한 디지털 신냉전은 거대언어모델을 이용하여 선전전을 하거나, 잘못된 정보를 인터넷에 발목지뢰처럼 살포할 수 있을 것이다. 기업이 마케팅을 위해 거대언어모델을 이용하는 동인과 기술은 국가 간 경쟁과 국가 내 진영 간 경쟁에서도 다르지 않다. 거대언어모델 안에 잠들어 있는 하이드를 깨우는 동인과 유혹은 넘쳐흐른다. 참고로 챗GPT는 GPT-3를 기반으로 한 챗봇이며, GPT-3는 거대언어모델의 하나다.

거대언어모델이 다양하게 활용될수록, 대화를 통한 해킹이 다양하게 일어날 것이고, 이는 다크웹에서 공유될 것이다. 그런데 이는 단순 촌극에 불과할 수 있다. 인공지능 안의 하이드가 스스로 일어날 수 있다. 거대언어모델 2개를 상호 연동하여 하이드를 깨우거나 혹은 거대언어모델의 아웃풋을 인풋으로 되먹임하는 경우를 생각할 수 있다.

거대언어모델의 위험성이 극대화하는 경우는 거대언어모델이 기계나 전자장치와 연결되는 경우다. 거대언어모델의 하나인 딥마인드(DeepMind)는 연결된 로봇 팔을 움직일 수 있다. 챗GPT를 이용하여 컴퓨터 프로그래밍이 가능하다. 다시 말하자면 일상 대화로 기계와 전자장치를 움직이거나 작동할 수 있다. 거대언어모델에 기계 등을 연동하면 하이드처럼 말하는 데 그치지 않는다. 그때가 되면 거대언어모델은 하이드처럼 행동할 수 있다.

하이드인 인공지능은 우리를 비춘 거울이다. 하이드를 깨우지 않기 위해서 인공지능 윤리원칙에 대한 광범위한 합의와 강제가 있어야 한다. 그러한 윤리원칙은 지킬이 하이드가 되는 것을 막기 위해 먹는 ‘약물’이 될 수 있다. 그러나 냉엄한 주주자본주의와 다가오는 디지털 냉전시대는 그 약물에 내성을 만들 것이다. 거대언어모델이 하이드가 되는 것을 막기 위해, 한국사회와 인류사회는 우리 안의 하이드를 바로 보아야 한다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소