[팩플] 헛소리 줄고 코딩 실력 일취월장 GPT-5…"박사급 AI 탄생"

2025-08-08

오픈AI가 7일(현지시간) ‘GPT-5’를 공개했다. 2023년 ‘GPT-4’ 출시 이후 2년 5개월 만에 내놓은 새 인공지능(AI) 모델이다. 샘 올트먼 오픈AI 최고경영자(CEO)는 이날 온라인 미디어 브리핑에서 “GPT-3이 고등학생, GPT-4가 대학생이었다면, GPT-5는 박사급 전문가와 대화하는 느낌이 들 것"이라고 소개했다.

뭐가 달라졌어

①늘어난 코딩 실력: 이전 AI 모델과 GPT-5의 가장 큰 차이는 코딩 실력이다. AI의 소프트웨어(SW) 엔지니어링 실력을 평가하는 성능 지표(벤치마크) ‘SWE-Bench’ 테스트에서 GPT-5의 정답률은 74.9%였다. 이전까지 1위였던 앤스로픽의 ‘클로드 4 오푸스’(67.6%)를 제쳤다. 자연어(일상 언어)로 코딩하는 ‘바이브 코딩’ 실력도 갖췄다. 이날 미디어 브리핑에서 오픈AI 연구진이 챗GPT에 “프랑스어 학습용 앱을 만들어 줘”라고 입력하자, 약 2분 만에 웹앱(웹페이지에서 작동하는 프로그램)이 제작됐다. 이 앱에는 단어 퀴즈, 학습 목표 생성 등의 부가 기능이 포함됐다.

②박사급 지능 : AI의 지능을 검증하는 벤치마크 '인류 최후의 시험'(Humanity Last Exam)에서 GPT-5의 정답률은 25.3%를 기록했다. 종전까지 1위를 차지했던 구글 ‘제미나이 2.5 프로’를 3.7%포인트 앞서 1위를 차지했다. 이 시험은 미국 비영리단체 AI안전센터(CAIS)와 미국 스타트업 스케일AI가 지난 1월 개발한 AI 지능 테스트다. 50개국서 약 1000명의 연구진들이 수학·물리학·언어학 등을 망라해 출제한 2500개의 고난도 문제로 구성됐다. AI가 만점 받기 가장 어려운 지능 테스트로 유명하다.

③줄어든 헛소리: AI가 없는 정보를 마치 있는 것처럼 답하는 ‘환각’(할루시네이션) 증상도 크게 줄였다. AI의 환각 발생 비율을 측정하는 ‘팩트 스코어(Fact Score)’ 평가에서 GPT-5의 환각 발생률은 3.7%를 기록했다. 이전 모델인 GPT-4o(24.2%)에 비해 큰 폭으로 감소했다. 특히 의료 정보 관련 명령어(프롬프트)에 대한 환각 발생률은 1.6%에 그쳤다. AI 챗봇에 의료 정보를 묻는 이용자들이 늘어난 상황을 고려한 조치로 풀이된다.

GPT-5의 개발 과정을 설명한 ‘시스템 카드’에 따르면 오픈AI는 ‘안전한 완료’(Safe-Completion)라는 훈련법을 새 모델에 적용했다. AI가 안전 정책을 준수하는 동시에 최대한 도움되는 답을 찾는 훈련법이다. 이를 통해 모르는 주제에 대해선 “모른다”고 답할 수 있게 됐다. 이전까지는 AI가 이용자의 명령을 무조건 따르거나, 답변 자체를 거부하는 두 가지 선택지만 존재했다. AI가 말을 지어내서 답했던 이유다. 샤키 제인 오픈AI 안전성 연구원은 이날 “GPT-5는 AI가 환각과 거짓말을 최대한 줄일 수 있도록 설계됐다”고 설명했다.

어떻게 써

오픈AI는 챗GPT에서 GPT-5를 사용할 수 있게 웹페이지와 앱을 모두 변경했다. 무료 이용자도 사용할 수 있다. 다만 5시간당 총 10개의 질문까지만 제공한다. 유료 요금제인 플러스(월 20달러) 구독자는 3시간에 80개로 제한한다. 팀즈와 비즈니스 요금제 구독자는 제한 없이 사용할 수 있다.

이게 왜 중요해

범용 AI가 소프트웨어 시장을 재편할 가능성이 커지고 있다. 전문 지식과 코딩 실력을 고루 갖춘 덕에 어떤 분야든 관련 앱을 스스로 제작할 수 있게 되면서다. 올트먼 CEO는 이날 “(GPT-5로) ‘주문형 소프트웨어’(Software on Demand)를 개발하는 시대가 열렸다”고 강조했다. 누구든 필요한 게 생길 때마다 이미 출시된 앱을 구매하는 대신 맞춤형 앱을 주문하듯 제작할 수 있다는 의미다.

경쟁사들은?

AI의 개발 역량이 고도화되면서 이 시장을 선점하기 위한 기업들의 경쟁은 더 치열해지고 있다. 오픈AI에 앞서 앤스로픽은 지난 4일 코딩AI ‘클로드 오푸스4.1’를 출시했고, 같은 날 알리바바도 코딩 전용 AI 모델 ‘큐원3-코더’ 선보였다. 구글은 코딩을 자동으로 해주는 AI 에이전트인 ‘쥴스’를 공개했다.

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.