ChatGPT는 사람들이 막연하게 상상하던 AI를 완전히 구체적인 모습으로 바꿔놨습니다. IT서비스 역사 상 가장 빠르게 월간 이용자 수 1억 명을 돌파했고 숨 돌릴 틈 없이 ChatGPT 4.0 버전 출시 소식이 들리고 있습니다. 아직 OpenAI 홈페이지에서는 3.5 버전이 제공됩니다만, 곧 4.0 버전도 제공될 계획이 있다고 합니다.
ChatGPT4.0이 또 얼마나 사람들을 놀라게 할 물건인지 주요Spec과 3.5 버전 기준 사용예시를 정리했습니다. AI시대가 준비기간도 없이 생활 속으로 훅 들어오고 있는데요. IT서비스에 관심이 없더라도 왜 우리가 이 시점에 AI에 주목해야 하는지 한번 가볍게 읽어보시기 바랍니다.
목차
ChatGPT4.0의 놀라운 기능
▣ 미묘해 보이지만 놀라운 업그레이드
뭔가 눈에 보이는 부분이 화려하게 변하는 것을 기대하셨다면 실망할 수 있습니다. 회사 블로그에서도 '일상적인 대화에서 ChatGPT3.5와 ChatGPT4.0의 차이는 미묘할 수 있다'라고 기능 소개를 시작하는데요. 하지만, 전체적인 성능을 살펴보면 ChatGPT4.0이 훨씬 더 안정적이고 창의적이며 똑똑해졌음을 알 수 있습니다.
ChatGPT 성능을 우리가 이해하기 쉽도록 어려운 시험이나 자격증 및 지식수준으로 기준으로 설명한 것인데요. ChatGPT4.0의 주요한 성능개선사항을 알 수 있는 예시들은 아래와 같습니다.
- 미국 변호사 시험 (Uniform Bar Exam) 상위 10% 성적으로 통과: GPT3.5는 하위 10%성적으로 통과했습니다만, GPT4.0은 상위 10%로 성적이 올랐습니다. 정말 변호사가 줄어드는 시대가 올지도 모릅니다.
- SAT 수학시험 800점 만점에 700점: GPT3.5는 670점이었습니다.
- 생물학 올림피아드 (AP Biology) 상위 1%
- 의학지식 자가진단 프로그램 학습률 75%: GPT3.5는 53%였습니다. 이젠 의사들도 지금과는 다른 일을 해야 하는 시대가 올지 모릅니다.
- MMLU(57개 과목에 대한 객관식 문제 모음)에서 정답률 86.4%: 정확한 비유는 아닙니다만 고차원적인 일반상식퀴즈라고 할 수 있는데요. 일반인보다 훨씬 나은 수준이라고 합니다.
가장 놀라운 점은 ChatGPT는 수학, 의학, 생물학, 변호사시험 등 각각의 학문을 별도로 공부하거나 학습하도록 프로그래밍되지 않았다는 것입니다. 우리가 이세돌9단과의 바둑대결로 잘 알고 있는 알파고(AlphaGo)는 바둑만을 위해 학습된 AI라면, ChatGPT는 그냥 다양한 웹문서들을 학습한 결과로 위와 같은 인간의 시험을 통과했습니다.
▣ 훨씬 좋아진 다양한 언어학습 및 이해력
위에서 말씀드린 MMLU (쉽게 말하자면 57개 과목에 대한 고차원 상식시험)을 영어로 풀었을 때, ChatGPT3.5는 약 70% 정답률을 보였다면, ChatGPT4.0은 85.5% 정답률을 보였습니다. ChatGPT4.0은 위 이미지와 같이 다양한 언어로도 GPT3.5보다 좋은 정답률을 보여줬는데요. 그만큼 언어인식도 GPT4.0에서 획기적으로 좋아졌다 볼 수 있겠습니다. 이전보다 한글도 잘 이해한다는 말이죠.
▣ 훨씬 더 많은 텍스트와 이미지를 이해
요구사항을 입력할 때 기존 ChatGPT3.5가 약 3천 단어를 한 번에 입력할 수 있었다면, ChatGPT4.0은 약 2만 5천 단어를 입력할 수 있습니다. 2만 5천 단어는 일반적인 책 반권 정도의 분량을 한 번에 넣을 수 있다고 생각하시면 되겠습니다.
그리고 GPT4.0은 사용자가 텍스트가 아닌 이미지를 입력하고 이미지에 적힌 글자나 수식을 인식하게 하거나, 이미지 자체를 이해하고 이를 기반으로 사용자의 질문을 답할 수 있도록 업그레이드되었습니다.
사용자가 위와 같은 사진을 GPT4.0에게 입력하고 특이한 점이 무엇이냐고 물었을 때, GPT4.0은 "움직이는 택시 지붕에 부착된 다리미판에서 남자가 옷을 다림질하고 있다는 점이 특이하다"라고 답합니다. 이미지 자체를 사람처럼 센싱하고 사람의 기준에서 이상한 점을 답변할 수 있는 능력이 있다는 말입니다.
부가기능과 제한사항
▣ 말투, 어조, 스타일 변경
영화 '인터스텔라'의 숨은 주인공, 타스 로봇은 인간과 대화할 수 있도록 솔직함이나 유머지수를 설정할 수 있습니다. 적절한 유머와 거짓을 섞는 대화방식은 대표적인 인간다움을 표현하는 특성인데요. 제가 부가기능이라 표현했지만 인간형 안드로이드가 상품화되려면 생각보다 인간스러운 대화기능 제공은 매우 중요합니다.
아직은 완전하지 않겠지만, ChatGPT4.0부터는 말투나 어조, 대화 스타일을 미리 설정하거나 작업에 맞춰 설정할 수 있다고 합니다. 예를 들어, 수학문제 풀이법을 알려주는 작업 시에는 교사의 대화법, 개발코드를 짜는 개발작업에서는 개발자의 대화법을 써서 사용자와 대화를 할 수 있게 설정할 수 있다고 하네요.
▣ 제한사항
역시 가장 큰 제한사항은 아직 100% 신뢰할 수 없다는 것입니다. 즉, 언제든지 틀린 답을 제시할 수 있다고 염두에 두어야 합니다. 또한, 사회적 위험성이 있는 행위들은 제한됩니다. 예를 들어, 해킹코드를 만들거나 폭탄제조법을 안내하는 것은 ChatGPT가 할 수 있지만 제한되고 있습니다. (아직 많은 허점이 있다고 합니다만)
ChatGPT 실제 사용예시
▣ 간단한 사용법
https://chat.openai.com/chat 로 접속 후 간단한 회원가입/로그인 과정만 거치면 ChatGPT를 사용할 수 있습니다. 현재 3.5 버전입니다만 조만간 4.0 버전도 제공한다고 하며, 무료로도 기본적인 기능은 충분히 사용해 볼 수 있습니다.
▣ ChatGPT로 수학능력시험 문제 풀기
실제 수학능력시험 기출문제를 ChatGPT에게 풀어달라고 해봤는데요. 결과는... 수학 선생님처럼 너무 친절하게 잘 풀어줍니다. (물론, 아직 이미지 인식기능을 써보지 못해서 풀 수 없는 수학문제도 있습니다.)
수학문제만 풀 수 있는 게 아닙니다. 아래와 같은 영어기출문제도 풀어달라고 해 봤습니다.
문제를 풀고 설명해 달라고 했더니, 아래와 같이 답을 제시했습니다.
한국사도 잘 풀어줍니다. 실제로 해 보니 더 놀랍습니다.
마무리
이미 많은 서비스들이 ChatGPT API를 이용하여 새로운 기능들을 제공하고 있습니다. 마이크로소프트는 Office365제품에 ChatGPT와 같은 AI기능을 제공한다고 발표했는데요. 이것도 사용 예시가 환상적입니다. 더 이상 파워포인트를 직접 만들지 않아도 되고, 엑셀파일로 어렵게 데이터를 분석할 필요가 없어집니다.
AI시대가 열리고 있습니다. 곧 AI기술들은 스티브잡스가 아이폰을 들고 나와 모바일로 세상을 바꾸었던 것처럼, 순식간에 많은 것들을 바꾸게 될 것 같습니다. 물론 위 기사처럼 아직 보완되어야 할 부분들이 많습니다만 이 기술이 다소 허상적이고 말만 많았던 다른 사례들과 좀 다르다는 것을 이해하시면 좋겠습니다.
댓글