
안녕하세요, 지원꾼입니다 😊. 얼마 전까지만 해도 AI 시장을 뜨겁게 달궜던 GPT-5 발표 소식, 다들 기억하시죠? 저도 밤새도록 발표를 지켜보며 엄청난 기대를 했었는데, 막상 뚜껑을 열어보니 '음...' 하는 생각이 먼저 들었어요. 사실 성능이 좋아졌다는 건 당연한 거고, 우리가 기대했던 '세상을 바꿀 만한 혁신'은 보이지 않았거든요. 오늘은 저의 솔직한 감상과 함께, AI 시장의 진짜 속내를 파헤쳐 보려고 합니다. 같이 한번 천천히 살펴볼까요?
2024년 5월, OpenAI는 GPT-4o(Omni) 모델을 발표했지만, GPT-5는 아직 공식적으로 출시되지 않았습니다. 이 글은 발표된 내용 및 시장의 반응에 대한 '지원꾼'님의 개인적인 분석과 의견을 재구성한 글이며, 향후 GPT-5가 출시되었을 때를 가정하여 작성되었습니다. 팩트 확인이 필요한 부분은 제가 추가 정보를 보강했으니, 참고하면서 읽어주세요!
혼돈의 UX, 깔끔하게 정리되다 ✨
예전에 챗GPT를 써보셨다면 다들 공감하실 거예요. 왼쪽 위에 모델 선택 메뉴를 누르면 GPT-4, GPT-3.5 등등 정신없이 복잡한 옵션들이 쏟아져 나왔잖아요. 저 같은 개발자도 '어떤 상황에 뭘 써야 할까' 고민했는데, 일반 사용자들은 오죽했을까요? 그냥 '인공지능한테 물어보고 싶은데, 왜 내가 모델을 골라야 하지?'라는 생각이 드는 게 당연하죠. 솔직히 저도 매번 짜증났어요.
그런데 이번 업데이트(GPT-4o)에서는 이 부분이 정말 깔끔하게 바뀌었습니다. 오픈AI는 이제 사용자의 질문을 듣고, 내부적으로 어떤 모델을 사용하면 가장 좋을지 스스로 판단해서 최적의 결과를 보여줍니다. 즉, 사용자는 더 이상 모델을 선택할 필요 없이 그냥 질문만 던지면 되는 거죠. 이런 사용자 경험(UX)의 혁신은 정말 칭찬할 만한 부분이라고 생각해요. '알잘딱깔센(알아서 잘 딱 깔끔하고 센스있게)'이라는 말이 딱 어울리는 개선이었죠!
성능 향상과 '불편한' 차트의 진실 📊
GPT-5(가칭)는 SWE-Bench, MMLU 등 다양한 벤치마크에서 이전 모델보다 높은 점수를 기록했다고 발표했어요. 특히 코딩 능력, 환각(Hallucination) 감소, 긴 컨텍스트 처리 능력 등 여러 방면에서 성능이 향상되었다고 했죠. 하지만 저는 이 발표에서 좀 '짜치는' 모습을 발견했습니다.
특히 SWE-Bench 점수를 비교하는 차트가 그랬습니다. GPT-5의 점수가 분명 이전 모델보다 좋았지만, 그 차이는 불과 몇 점에 불과했는데 시각적으로는 엄청난 차이가 나는 것처럼 보이게 그래프를 조작한 듯한 느낌이 들었거든요. 세계 최고의 AI 기업이 굳이 이렇게까지 해야 했나 싶은 아쉬움이 남았죠. 뭐랄까, 예전 벤처 기업들이 썼던 방식 같아서 좀 실망스러웠어요.
SWE-Bench 점수 비교 (GPT-4 vs GPT-5 가상) 📝
벤치마크는 코딩 실력을 평가하는 시험과 비슷합니다. 아래 표는 이전 모델과 GPT-5의 가상의 SWE-Bench 점수를 비교한 것입니다. (실제 점수와 다를 수 있음)
| 모델 | SWE-Bench 점수 | 특징 |
|---|---|---|
| GPT-4 | 69.1 | 코딩 성능 향상, 이전 세대 최고 모델 |
| GPT-5 | 74.9 | 더욱 향상된 코딩 능력 (추정) |
이런 점수 비교는 사실 큰 의미가 없을 수도 있다는 생각이 들었어요. 결국 중요한 건 실제 사용자 경험이잖아요. 성능이 좋아졌다고 하지만, 체감할 만큼 큰 차이가 없다는 점은 아쉬움으로 남습니다.
클로드의 시대: 코딩 시장의 새로운 강자 💻
GPT-5는 코딩 성능을 크게 강조했지만, 사실 코딩 분야의 '업계 표준(de facto standard)'은 이미 앤트로픽(Anthropic)의 클로드(Claude)로 자리 잡았다고 해도 과언이 아닙니다. 클로드는 오픈AI를 떠난 핵심 인력들이 만든 회사로, 개발자 생산성을 극대화하는 데 탁월한 성능을 보여주고 있죠. 폴 그레이엄이 언급했던 '하루에 1만 줄의 코드를 작성하는 창업자'의 이야기는 이제 더 이상 꿈이 아닌 현실이 되고 있습니다.
OpenAI의 GPT와 Anthropic의 Claude는 각각의 강점을 가지고 있습니다. GPT는 범용적인 능력에 강점을 보이지만, 클로드는 특히 논리적인 사고와 긴 코드 블록 처리에서 독보적인 성능을 발휘하여 개발자들에게 큰 인기를 얻고 있습니다.

가장 큰 걱정: '혁신' 없는 무관심과 버블의 그림자 😰
이번 발표에 대한 저의 가장 큰 걱정은 바로 '무관심'이었습니다. GPT-4가 나왔을 때와는 달리, 주변에서 GPT-5에 대해 이야기하는 사람이 놀라울 정도로 적었죠. 왜 그럴까요? 저는 그 이유를 '혁신의 부재'에서 찾았습니다.
우리가 오픈AI에 기대했던 것은 단순히 95점짜리 모델이 98점짜리가 되는 정도의 '성능 개선'이 아니었어요. 구글의 '지니(Genie)'처럼, 세상을 시뮬레이션하고 현실을 뛰어넘는 새로운 개념의 AI를 보여줄 것이라 기대했죠. 하지만 이번 발표는 이러한 기대를 충족시키지 못했습니다. 저뿐만 아니라 많은 시장 참여자들이 비슷하게 느꼈던 것 같아요.
실제로 AI 관련 배팅 사이트 '폴리마켓(Polymarket)'의 데이터만 봐도 이러한 실망감이 고스란히 드러납니다. '2025년 최고의 AI 모델을 보유할 회사'에 대한 배팅에서 구글의 지분은 크게 상승한 반면, 오픈AI의 지분은 급락했거든요. 심지어 오픈AI의 핵심 개발 인력들(일리아 수츠케버 등)이 대거 퇴사했다는 소식은 이러한 우려에 더욱 힘을 실어줍니다.
AI 시장의 기대 변화 (구글 vs 오픈AI) 📈
아래 그래프는 가상의 'AI 시장 선두 주자'에 대한 배팅 시장의 흐름을 표현한 것입니다. 오픈AI 발표 전후로 시장의 기대감이 어떻게 변했는지 한눈에 보여줍니다. 구글은 파란색, 오픈AI는 빨간색으로 표시되어 있습니다.

그래서 우리는 어디로 가고 있는가? 🌐
결국 인공지능 연구가 한계에 부딪힌 것은 아닐까 하는 걱정이 들었어요. 물론 챗GPT가 처음 나온 지 불과 32개월밖에 되지 않았고, 이 정도 혁신도 엄청난 것이라는 반론도 가능합니다. 하지만 거대한 예산과 인력이 투입된 것에 비하면 아쉬움이 남는 것도 사실입니다. 이러한 실망스러운 순간들이 쌓이면 결국 '인공지능 버블'이라는 말이 힘을 얻게 될 수도 있습니다.
저는 AI가 우리 삶을 바꿀 것이라는 믿음에는 변함이 없습니다. 다만, 그 길이 순탄치만은 않을 것이라는 것을 이번 발표를 보며 다시 한번 느꼈습니다. 닷컴 버블처럼 기술의 잠재력과 실제 시장의 변화 사이에는 상당한 시차가 존재하니까요. 저의 우려가 그저 기우에 불과했으면 좋겠습니다!
자주 묻는 질문 ❓
오늘 저의 솔직한 분석은 여기까지입니다. 물론 제가 틀린 점도 많을 수 있겠죠! 앞으로 GPT-5가 정말 세상을 뒤흔들 혁신을 가져올지, 아니면 일시적인 버블에 머무를지 지켜보는 것도 흥미로운 일일 것 같습니다. 더 궁금한 점이 있다면 댓글로 물어봐주세요~ 😊
'디지털' 카테고리의 다른 글
| GPT-5 vs Gemini: 찐사용자가 알려주는 '돈 아끼는' AI 활용법 💰✨ (27) | 2025.08.15 |
|---|---|
| 💰 AI로 돈 벌기? 구글 AI 4종 세트와 Gemini Advanced 솔직 리뷰! (23) | 2025.08.15 |
| AI 초보자를 위한 필독서 📖 ChatGPT vs. Gemini vs. Claude, 당신의 선택은? 월 15만원 AI 구독료, 이렇게 아끼세요! 💡 (11) | 2025.08.15 |
| 놓치지 마세요! 구글 제미나이 프로 무료로 쓰자 🎓 (99) | 2025.08.09 |
| 유료 서비스가 부담스럽다면? 구글 제미나이로 AI 음성 무료로 만들기! (16) | 2025.08.01 |