‘챗GPT 아버지’, 샘 알트만의 GPT-4와 AGI에 대한 대담

2023/04/20   |  4 mins
‘챗GPT 아버지’, 샘 알트만의 GPT-4와 AGI에 대한 대담
 
  • 헤일리 (콘텐츠 커뮤니케이션)

  • ChatGPT, GPT-4, AGI가 궁금하신 분

    미래의 AI에 대한 샘 알트만의 견해가 궁금하신 분

  • OpenAI의 CEO인 샘 알트만이 렉스 프리드먼의 팟캐스트에 출연해 AI에 대한 대담을 나눴습니다. GPT-4와 ChatGPT 그리고 인간의 일반적인 지능을 가진 AGI에 이르기까지, AI의 발전이 가져올 미래의 모습을 상상하게 하는 샘 알트만의 견해를 정리해 봅니다.

  • ✔️ GPT-4와 ChatGPT로 보는 AI의 미래

    ✔️ ChatGPT와 RLHF

    ✔️ GPT-4와 AGI

OpenAI의 CEO이자 챗GPT의 아버지인 샘 알트만(Sam Altman)이 인공지능 연구자 렉스 프리드먼(Lex Fridman)의 팟캐스트에 출연해 GPT-4와 AGI(Artificial General Intelligence)에 대한 이야기를 나누었습니다. 이번 콘텐츠에서는 AI의 발전이 가져올 미래의 모습을 상상하게 하는 샘 알트만의 대담을 정리해 봅니다.





GPT-4와 ChatGPT로 보는 AI의 미래

샘 알트만은 머지않은 미래에 사람들이 GPT-4를 아주 초기의 인공지능으로 생각하게 될 날이 올 것이라고 말합니다. GPT-4는 아직 많은 작업을 완벽하게 수행하기에 한계가 있긴 하지만, 앞으로 점차 발전한다면 우리의 삶에 중요한 역할을 하는 무언가로 자리 잡게 될 거라구요. 이는 컴퓨터가 처음 세상에 출시되었을 때도 마찬가지였습니다. 과거에 비해 오늘날의 컴퓨터 성능은 획기적으로 발전하였고, 이제 컴퓨터가 없는 일상을 상상하기 어렵게 된 것처럼 말입니다.


그렇다면 50년 뒤 인공지능의 역사를 다루는 위키피디아 페이지에 현 시점의 AI 발전의 전환점을 꼽는다면 어떤 GPT 모델이 역사에 기록될 수 있을까요? 이 질문에 샘 알트만은 ‘ChatGPT’를 꼽았습니다. 그는 AI의 발전이 마치 지수함수와 같아서 어떠한 특정 사건을 전환점으로 꼽는것보다 연속적인 곡선의 형태로 발전한다고 보는 것이 적절할 것이라고 말합니다. 다만 현재까지 출시된 모델 중에서 ChatGPT를 꼽을 수 있는 이유는 “사용성”이 중요하다 생각했기 때문이라고 덧붙였습니다. 물론 기본 모델도 중요하지만 RLHF(휴먼피드백강화학습·Reinforcement Learning with Human Feedback)와 인터페이스도 모두 중요한 요소이기 때문입니다.


ChatGPT와 RLHF

ChatGPT는 대규모 텍스트 데이터를 이용해 사전학습된 모델로, 대화형 인터페이스가 적용되어 다양한 자연어 처리 태스크에 활용할 수 있습니다. ChatGPT는 사용자가 입력한 문장을 이해 및 분석하고, 이를 기반으로 다음 단어를 예측합니다. 이렇게 다음 단어를 예측하는 과정이 모이면 문장이 완성되고 이것이 사용자에게 답변으로 전송되는데요. 따라서 언어를 표현하고 구사하는 것에 특화되어 있습니다.

이러한 원리로 작동하는 ChatGPT는 ‘RLHF(Reinforcement Learning from Human Feedback)’를 활용해 성능을 고도화했습니다.


RLHF는 인간 피드백 기반 강화 학습으로, 사람의 피드백을 통해 언어 GPT-4와 같은 대규모 언어 모델의 정확도와 관련성, 공정성을 높이는 것입니다. 예를 들어 딥러닝 모델이 대규모 텍스트 데이터셋으로 학습을 하여 이를 기반으로 모델이 두 가지 결과물을 보여주면, 어떤 결과물이 더 나은지 사람이 피드백을 하는 형식입니다. Open AI는 더 나은 모델을 만들기 위해 다양한 소스에서 사전 훈련 데이터를 모으는데 큰 노력을 기울이고 있다고 합니다.


ChatGPT가 사용자의 질문을 이해하고 자연스러운 대화가 가능한 것도 RLHF가 긍정적인 역할을 했습니다. 샘 알트만은 ChatGPT와 같은 RLHF 모델을 만드는 것이 이제 시작인 단계이지만, 이러한 강화 학습을 통해 이전보다 적은 데이터로 모델을 훨씬 강력하게 만들 수 있는 것이 특징이라고 언급했습니다. 또한, 이 과정을 거치면 딥러닝 모델을 조금만 훈련시킨 상태에서도 추후 완전히 훈련 되었을 때의 특징을 미리 파악할 수 있는데, 이것은 마치 한 살 아기가 미래에 SAT 시험에서 어떤 성적을 거둘 것인지 알 수 있는 것과 같습니다. 그만큼 모델의 다양한 측면을 자세히 조사하고 분석하기 때문에 가능한 일이기도 하죠.



GPT-4와 AGI

“GPT-4는 인류가 만들어낸 가장 복잡한 소프트웨어이다.”라는 말이 있습니다. 실제로 GPT-3와 GPT-3.5는 1,750억 개의 파라미터(매개변수)를 통해 운영되고 있으며, GPT-4의 파라미터 수는 공개되지 않았지만 이보다 훨씬 많은 양을 기반으로 하고 있을 것으로 보입니다.

언어 모델의 크기 (출처: Dr Alan D. Thompson, LifeArchitect.ai (Apr/2023))


하지만 샘 알트만은 몇십 년 후에는 이런 수천억 개의 파라미터를 가진 모델이 누구나 일상에서 쉽게 만들 수 있는 사이즈가 될 수 있을 것이라고 말합니다. 물론 이것은 GPT가 학습을 통해 인터넷상에 있는 인류의 모든 것을 압축한 것과 다름없기 때문에 아직까지는 이 파라미터의 사이즈를 조정하는 것이 굉장히 복잡한 일입니다. 이처럼 방대한 양의 온라인 데이터를 통해 AI를 학습시키면 어느 정도까지 인간과 비슷하게 만들 수 있을까요? 인간이 할 수 있는 어떠한 지적인 업무도 성공적으로 해낼 수 있는, 인간의 일반적인 지능을 가진 인공지능을 ‘AGI(Artificial general intelligence)’라고 부릅니다.

샘 알트만은 앞으로 AGI를 만드는데 여러 가지가 필요하겠지만 ‘LLM(Large Language Model)’이 일부 역할을 담당하게 될 것이라고 말했습니다. GPT의 패러다임을 확장해야 과학적으로 새로운 발견이 가능하다는 것입니다. 앞으로 GPT가 더욱 발전하여 우리 사회에 깊숙이 스며들게 된다면 어떻게 될까요? 이미 GPT를 활용해 프로그래밍하는 등 우리 일상 곳곳에 AI가 들어와 있긴 하지만, 앞으로 AI는 우리의 능력을 더욱 증폭시킬 수 있는 가장 유용한 도구가 될 것이며 많은 태스크의 자동화를 이룰 것입니다.


이로써 우리 삶의 질은 어마어마하게 향상 되겠지만, 한편 AGI에 대한 우려의 시선도 존재합니다. 미국의 인공지능 연구가인 엘리저 유드코스키(Eliezer Yudkowsky)는 AI가 초지능을 갖게 된다면 AI를 설계자의 목적이나 선호도에 맞게 조정하는 AI alignment가 거의 불가능할 것이라고 말합니다. 이에 대해 샘 알트만은 이러한 우려 상황이 발생할 수 있다는 가능성을 인정하는 것은 중요하다며, 잠재적 위협을 해결하기 위해 새로운 기술을 연구하고 개발해야 한다고 말했습니다.

AI의 빠른 발전 속도로 인해 ‘AI takeoff’라는 용어도 등장했는데요. 현재의 AI Safety는 아직 충분히 업데이트 되지 않았기에 사람들의 기술에 대한 이해도를 높이고 개선하고 시도하며 AI alignment를 대비하는 것의 중요성을 강조하기도 했습니다.

ChatGPT와 그 외 온라인 서비스가 백만 명의 사용자를 모으기까지 걸린 시간 (출처: https://www.statista.com/chart/29174/time-to-one-million-users/)

ChatGPT와 그 외 온라인 서비스가 백만 명의 사용자를 모으기까지 걸린 시간 (출처: https://www.statista.com/chart/29174/time-to-one-million-users/)

전 세계에 AI 열풍을 가져온 ChatGPT는 백만 명의 사용자를 모으기까지 단 5일이 걸렸습니다. 이는 역사상 가장 빠르게 성장한 온라인 서비스라는 대기록인데요. 하루가 다르게 발전하는 AI로 인해 우리의 일상은 앞으로 어떻게 변화하게 될까요? 우리는 이제 AGI의 구체적인 정의가 중요해지는 단계에 접어들고 있습니다. 샘 알트만이 이번 대담에서 언급하였듯이 더 나은 AI 모델을 만들어감과 동시에 급속한 발전으로 인해 일어날 수 있는 상황들에 대비할 수 있도록 안전한 AI 모델 개발 방식과 지침을 구축하는 것을 함께 고민하는 것이 필요해 보입니다.

 
 
 
  • 2020년 10월 설립한 업스테이지는 이미지에서 원하는 정보를 추출해 이용할 수 있는 OCR기술을 비롯, 고객 정보와 제품 및 서비스 특징을 고려한 추천 기술, 의미기반 검색을 가능케하는 자연어처리 검색기술 등 최신 AI 기술을 다양한 업종에 맞춤형으로 손쉽게 적용할 수 있는 노코드-로코드 솔루션 ‘Upstage AI Pack’을 출시, 고객사들의 AI 혁신을 돕고 있다. Upstage AI Pack을 이용하면 데이터 가공, AI 모델링, 지표 관리를 쉽게 활용할 수 있을 뿐 아니라 지속적인 업데이트를 지원, 상시 최신화 된 AI 기술을 편리하게 사용할 수 있다. 더불어, AI 비즈니스 경험을 녹여낸 실습 위주의 교육과 탄탄한 AI 기초 교육을 통해 AI 비즈니스에 즉각 투입될 수 있는 차별화된 전문 인재를 육성하는 교육콘텐츠 사업에도 적극 나서고 있다.

    업스테이지는 구글, 애플, 아마존, 엔비디아, 메타, 네이버 등 글로벌 빅테크 출신의 멤버를 중심으로 NeurlPS를 비롯, ICLR, CVPR, ECCV, WWW, CHI, WSDM 등 세계적 권위의 AI 학회에 다수의 우수 논문을 발표하고, 온라인 AI 경진대회 캐글(Kaggle)에서 국내 기업 중 유일하게 두 자릿수 금메달을 획득하는 등 독보적인 AI 기술 리더십을 다지고 있다. 업스테이지 김성훈 대표는 홍콩과학기술대학교 교수로 재직하면서 소프트웨어공학과 머신러닝을 융합한 버그 예측, 소스코드 자동생성 등의 연구로 최고의 논문상인 ACM Sigsoft Distinguished Paper Award 4회 수상, International Conference on Software Maintenance에서 10년 동안 가장 영향력 있는 논문상을 받은 세계적인 AI 구루로 꼽히며, 총 700만뷰 이상을 기록한 ‘모두를 위한 딥러닝’ 강사로도 널리 알려져 있다. 또한, 업스테이지의 공동창업자로는 네이버 Visual AI / OCR 을 리드하며 세계적인 성과를 냈던 이활석 CTO와 세계 최고의 번역기 파파고의 모델팀을 리드했던 박은정 CSO가 참여하고 있다.

    업스테이지 홈페이지 바로가기

 
Previous
Previous

New, AskUp - 사랑받는 브랜드 리뉴얼하기 (리브랜딩)

Next
Next

Data-Centric AI와 Real-World