Fable 5 중단 소동에 가려진 Opus 4.8: 진짜 큰 진전은 여기 있었다
Fable 5 중단은 아쉬운 사건이지만, 그 소동이 2026년 5월 28일 Opus 4.8의 큰 진전을 가리고 있습니다. Opus 4.8은 SWE-bench Pro에서 Opus 4.7의 64.3%를 69.2%로 끌어올렸고, 자기가 쓴 코드의 결함을 놓치는 비율을 약 4배 줄였습니다. ASAP은 1차 출처로 4.8의 실제 개선을 정리해, Fable 5 헤드라인에 묻힌 이 진전을 다시 조명합니다.
Fable 5 중단, 아쉬움은 분명하다
Fable 5 중단은 분명히 아쉬운 사건입니다. 2026년 6월 9일 출시된 Fable 5와 Mythos 5는 사흘 만인 6월 12일, 미국 상무부(BIS) 수출통제 지시로 전면 비활성화됐습니다. 장기 과제(long-horizon)에서 강점을 보이던 최상위 모델이 72시간도 못 채우고 사라졌으니, 기대했던 사용자에게는 실질적 손실이 맞습니다.
그러나 아쉬움이 큰 만큼, 그 뉴스가 같은 시기의 다른 사건을 덮어버린 것도 사실입니다.
가려진 주인공은 Opus 4.8이다
헤드라인에 가려진 진짜 사건은 2026년 5월 28일 조용히 출시된 Opus 4.8입니다. 많은 사용자가 "최상위 모델이 막혔다"는 6월 뉴스에 집중하는 사이, 2주 전 나온 4.8의 진전은 상대적으로 주목을 덜 받았습니다. Anthropic은 4.8을 "복잡한 추론과 장기 에이전트 코딩, 높은 자율성 작업에 가장 강한 모델"로 소개했습니다.
흥미롭게도 Anthropic 스스로는 4.8을 "작지만 분명한 개선(modest but tangible)"이라 표현했지만, 코딩·에이전트 지표만 보면 그 진전은 결코 작지 않습니다.
Opus 4.8이 실제로 끌어올린 것
Opus 4.8의 진전은 수치로 확인됩니다. 가장 두드러진 영역은 에이전트 코딩과 정직성입니다.
| 지표 | Opus 4.7 | Opus 4.8 |
|---|---|---|
| SWE-bench Pro(최난도) | 64.3% | 69.2% |
| SWE-bench Verified | — | 88.6% |
| 자기 코드 결함 방치 | 기준 | 약 1/4로 감소 |
| Fast 모드 | — | 2.5배 속도·3배 저렴 |
여기에 더해 Opus 4.8은 코딩 카테고리에서 평균 약 18점 차로 선두였고, SWE-bench Pro에서 GPT-5.5를 10.6%p 앞섰습니다. Super-Agent 벤치마크에서는 모든 케이스를 끝까지 완수한 유일한 모델이었고, 긴 컨텍스트 처리와 압축 복구(compaction recovery)도 개선됐습니다.
4.7 퇴행을 딛고 — 진전이 더 크게 느껴지는 이유
진전이 유독 크게 느껴지는 데는 두 가지 배경이 있습니다. 첫째, Opus 4.7은 실제로 퇴행 논란이 있었습니다. 2026년 봄 코딩 회귀와 4.6 대비 추론 벤치마크 54점 하락이 보고됐고, 그 바닥에서 올라온 4.8이라 체감 상승폭이 더 큽니다.
둘째는 인프라입니다. 6월 12일 Fable 5 중단 직후 Anthropic은 Claude Code에서 Opus·Sonnet의 사용 한도를 2배로 늘리고 Pro·Max의 피크시간 throttle을 제거했습니다. 같은 4.8이라도 끊김 없이 더 길게 추론하니, 진전이 한층 또렷하게 다가옵니다.
그래서 직접 확인하는 법
진전을 체감이 아니라 사실로 확인하려면 측정이 필요합니다. ASAP이 권하는 최소 절차는 다음과 같습니다.
- 고정 프롬프트 20개 세트로 Opus 4.7과 4.8의 정답률·일관성을 비교합니다.
- 응답 레이턴시와 출력 토큰을 함께 로깅해 '속도'와 '능력'을 분리합니다.
- SWE-bench Pro 같은 공개 코딩 eval에서 4.7→4.8 추이를 대조합니다.
- 6월 12일 전후 같은 버전의 속도·안정성 변화는 가중치가 아니라 용량 효과로 구분합니다.
결론: 소동은 지나가고, 진전은 남는다
소동은 지나가고 진전은 남습니다. Fable 5 중단은 아쉽지만, 2026년 상반기 Opus 계열의 실질적 도약은 4.8에 있었고, SWE-bench Pro 69.2%와 코드 결함 자가 검출 4배 개선이 그 증거입니다. 헤드라인이 시끄러울수록, 조용히 일어난 진짜 진전을 놓치지 않는 눈이 필요합니다.
출처: Opus 4.8 벤치마크·기능(Anthropic 공식, Labellerr·DataCamp·Caylent 리뷰), "modest but tangible" 평가(Simon Willison), Opus 4.7 회귀 보고(roborhythms·startupfortune), Fable 5·Mythos 5 중단(InfoQ·The New Stack), Claude Code 한도 2배·throttle 제거(Developers Digest).