AI

GPT-5.4가 뭔가요? 새로운 기능과 달라진 점 정리

choido-yoon 2026. 3. 18. 16:31

GPT-5.3 나온 지 이틀 만에 또 나왔어요 — 실제로 뭐가 바뀐 건지 [2026년 3월 기준]

GPT-5.4가 2026년 3월 5일에 출시됐어요. GPT-5.3 Instant가 나온 지 이틀 만이에요.

출시 전 신호들 — 2월 말부터 Codex 풀 리퀘스트 유출이 있었는데 실제였어요 — 을 추적하다가 정식 출시 이후 실제로 달라진 것들을 정리했어요. 마케팅 문구 말고 실제로 뭐가 바뀌었는지, 누구에게 의미가 있는지를 중심으로요.

GPT-5.4가 뭔가요?

OpenAI가 공식적으로 "전문 업무를 위한 가장 유능하고 효율적인 프론티어 모델"이라고 설명하는 최신 모델이에요. 독립된 모델 패밀리가 아니라 2025년 8월 원래 GPT-5가 출시된 이후 빠르게 반복 개발해온 GPT-5 시리즈의 최신 버전이에요.

GPT-5 패밀리에서의 위치

GPT-5 라인이 빠르게 움직여왔어요.

버전 출시 특징
GPT-5 2025년 8월 원래 프론티어 모델
GPT-5.2 Thinking 이후 추론 특화
GPT-5.3-Codex 이후 코딩 특화
GPT-5.3 Instant 2026년 3월 3일 일상 대화 최적화
GPT-5.4 2026년 3월 5일 프론티어 코딩 + 깊은 추론 + 네이티브 컴퓨터 사용 통합

GPT-5.4는 GPT-5.3-Codex의 프론티어 코딩, Thinking 시리즈의 깊은 추론, 네이티브 컴퓨터 사용을 단일 패키지로 처음 통합한 모델이에요. 이 통합이 5.3에서 5.4로 버전이 올라간 이유예요.

언제 출시됐고 어떻게 접근하나요?

2026년 3월 5일 ChatGPT, API, Codex 전반에 걸쳐 출시됐어요.

접근 방법 조건
GPT-5.4 Thinking ChatGPT Plus($20/월), Team, Pro
GPT-5.4 Pro ChatGPT Pro($200/월), Enterprise 전용
무료 사용자 시스템 자동 라우팅만 가능, 수동 선택 불가
API + Codex 지금 사용 가능, 최대 1M 토큰 컨텍스트

API 가격: OpenRouter 기준 입력 $2.50/1M, 출력 $20.00/1M (OpenAI 직접 API 청구는 티어에 따라 다를 수 있음).

GPT-5.2 Thinking은 유료 사용자에게 2026년 6월 5일까지 레거시 옵션으로 유지돼요.

GPT-5.4에서 뭐가 새로워졌나요?

핵심 변화 세 가지

  1. 네이티브 컴퓨터 사용 — 범용 모델 최초

진짜 새로운 거예요. GPT-5.4는 네이티브 컴퓨터 사용 기능이 외부 레이어로 추가된 게 아니라 내장된 OpenAI 최초의 범용 모델이에요. Codex와 API에서 모델이 컴퓨터를 작동하고, 애플리케이션 간 이동하고, 단계 사이에 사람 개입 없이 멀티 스텝 워크플로우를 실행할 수 있어요. 에이전트를 데모에서 인상적인 게 아니라 실제로 유용하게 만드는 아키텍처 변화예요.

  1. API에서 1M 토큰 컨텍스트

컨텍스트 상한이 100만 토큰으로 올라갔어요. 중요한 주의사항: 입력이 272K 토큰을 초과하면 OpenAI가 토큰당 두 배를 청구해요. 전체 코드베이스를 집어넣기 전에 예산을 미리 계산하세요.

  1. 에이전트 워크플로우를 위한 Tool Search

에이전트가 대규모 커넥터 생태계 전반에서 올바른 툴을 찾아 사용하도록 도와주는 새 API 기능이에요 — 모든 툴 호출을 미리 정의하지 않아도요. 멀티 툴 파이프라인을 만드는 개발자에게 이건 상당한 프롬프트 엔지니어링 보일러플레이트를 조용히 대체하는 종류의 기능이에요.

환각 수치 (OpenAI 발표 기준)

  • 개별 주장이 GPT-5.2 대비 33% 적게 거짓
  • 전체 응답이 18% 적게 에러 포함
  • 내부 지식 업무 벤치마크에서 44개 직업에 걸쳐 83% 비교에서 업계 전문가와 동등하거나 초과

OpenAI 자체 수치이니 방향성 신호로 보세요.

속도, 컨텍스트, 가격 변화

효율성 이야기는 실재해요. GPT-5.4는 GPT-5.2보다 문제를 해결하는 데 토큰을 크게 적게 써요 — 일부 태스크에서 최대 47% 적게요. 출력 토큰당 가격이 올라가도 API 비용 계산에서 의미가 있어요.

ChatGPT 사용자에게: GPT-5.4 Thinking이 이제 전체 출력에 커밋하기 전에 미리 추론 계획을 보여줘요. 중간에 방향을 수정할 수 있어요. 기다리다가 모델이 엉뚱한 방향으로 갔다는 걸 발견하는 시간이 줄어들어요.

변하지 않은 것

  • ChatGPT(비 API)의 컨텍스트 창은 GPT-5.2 Thinking과 동일
  • GPT-5.3 Instant는 일상적인 대화 쿼리의 기본값으로 유지 — GPT-5.4가 대체하지 않음
  • 라우터 시스템은 ChatGPT 아래에서 계속 동작; GPT-5.4가 유일하게 맞닥뜨리는 모델이 아님

GPT-5.4 vs GPT-5 vs GPT-4o 빠른 비교

  GPT-4o GPT-5 GPT-5.4
컨텍스트 창 128K 128K 1M (API)
네이티브 컴퓨터 사용
Tool Search
API 출력 가격 낮음 $10.00/1M $20.00/1M
추론 깊이 기본 기본 고급 (Thinking)

GPT-4o는 당장 사라지지 않아요. OpenAI는 API에서 GPT-4o 지원 종료 계획을 현재 발표하지 않았어요. 비용이 민감하고 추론이나 컴퓨터 사용이 필요 없다면 여전히 좋은 선택이에요.

실제로 GPT-5.4가 필요한 사람은 누구인가요?

업그레이드가 의미 있는 유즈케이스

GPT-5.4는 특정 사용자 프로파일에 최적화됐어요. 아래에 해당하면 현재 셋업 대비 벤치마크를 해볼 가치가 있어요.

에이전트를 만드는 개발자 — Tool Search + 네이티브 컴퓨터 사용 + 1M 토큰 컨텍스트가 단일 모델에 있는 건 처음이에요. 멀티 스텝 워크플로우를 오케스트레이션하거나 Codex 기반으로 만들고 있다면, 현재 셋업 대비 벤치마크를 해볼 가치가 있어요.

금융과 법률 업무 — OpenAI 내부 투자 은행 벤치마크가 GPT-5의 43.7%에서 GPT-5.4 Thinking의 88%로 올라갔어요. Mercor의 법률·금융 전문 기술 APEX-Agents 벤치마크에서 GPT-5.4가 선두를 했어요. 재무 모델, 계약 분석, 투자자 메모 같은 장기 산출물에서 이 수치는 진지하게 볼 만해요.

현재 Thinking 모드를 쓰는 사람 — 미리 계획을 보여주는 기능이 실제 시간을 아껴주는 방식으로 인터랙션 모델을 바꿔요. 전체 출력을 기다렸다가 모델이 엉뚱한 방향으로 갔다는 걸 발견하지 않아도 돼요.

GPT-4o나 GPT-5에 남아 있는 게 나은 경우

주요 유즈케이스가 일상적인 Q&A, 빠른 초안 작성, 중간 길이의 문서라면 GPT-5.3 Instant가 더 빠르고 충분해요. GPT-5.4의 개선사항은 전문적이고 에이전트적인 업무에 집중돼 있어요 — 일반 ChatGPT 대화에서는 차이가 느껴지지 않아요.

API 사용자: 계산을 잘 하세요. GPT-5.4의 출력 $20.00/1M은 GPT-5의 $10.00/1M 대비 대략 두 배예요. 토큰 효율성 향상은 실제지만 모든 태스크 타입에 걸쳐 그 격차를 완전히 상쇄하진 않아요.

자주 묻는 질문

GPT-5.4는 무료인가요?

부분적으로요. 무료 ChatGPT 사용자는 자동 라우팅으로 GPT-5.4 응답을 받을 수 있지만 수동으로 선택할 수 없어요. GPT-5.4 Thinking에 의도적으로 접근하려면 최소 Plus 구독($20/월)이 필요해요.

GPT-5를 대체하나요?

아니요. GPT-5는 발표된 지원 종료 일정 없이 API에서 계속 사용 가능해요. GPT-5.4는 구체적으로 Plus+ 사용자를 위해 ChatGPT 모델 피커에서 GPT-5.2 Thinking을 대체해요. 이전 모델들이 사라지진 않아요 — 적어도 아직은요.

GPT-5.3은 어떻게 됐나요?

GPT-5.3은 두 가지로 존재했어요: GPT-5.3-Codex(코딩 특화)와 GPT-5.3 Instant(2026년 3월 3일 출시, 일상 채팅용). GPT-5.4는 5.3-Codex의 코딩 능력을 흡수하고 추론과 컴퓨터 사용을 올려놨어요. GPT-5.3 Instant와 GPT-5.4는 다른 레인을 차지해요 — 같은 슬롯을 두고 경쟁하는 게 아니에요.

정리

GPT-5.4는 에이전트, 코딩, 또는 고위험 전문 문서 작업이 포함된다면 의미 있는 업그레이드예요. 네이티브 컴퓨터 사용, Tool Search, 1M 토큰 컨텍스트가 이전에는 여러 모델을 저글링해야 했던 것을 통합해요. 일부 태스크에서 47% 토큰 효율성 향상도 이전 추론 모델 대비 경제성을 높여요.

일상적인 ChatGPT 사용에서는 GPT-5.3 Instant와의 차이가 작아요. 표준 Q&A나 글쓰기 태스크에서는 대부분의 사용자가 차이를 못 느낄 거예요.

주목할 버전은 GPT-5.4 Pro예요. 복잡한 전문 업무에서 OpenAI의 벤치마크 주장이 자체 테스트 환경 밖에서도 유지된다면, 엔터프라이즈 워크플로우에서 Claude와 Gemini에 대한 실질적인 경쟁적 움직임이에요.

궁금한 점 있으면 댓글로 남겨주세요 🙌

태그: #GPT54 #OpenAI #LLM #AI업데이트 #에이전트 #컴퓨터사용 #AI개발 #2026AI #ChatGPT #프론티어모델