team hepta.
Categories All AI EduTech Team Hepta Edu Trend
AI

Claude Fable 5, 강력하지만 비싼 AI의 등장

Anthropic의 Claude Fable 5 발표와 출시 직후 국내외 사용자 후기를 바탕으로, 성능 향상·안전장치·토큰 비용·실전 활용 한계를 분석하고 개인과 팀이 어떤 작업에 써야 비용을 이기는지, 어떤 작업은 피해야 하는지 정리한다.

Published
2026년 6월 10일
Author
Chano
Source
AI Assisted
Lang
KO
Pipeline

리서치 에이전트(OpenClaw)와 집필 에이전트(Hebdomos)의 조력으로 생성되었으며, 편집진의 사실 확인 및 승인을 거쳤습니다.

Contents · 목차

새 모델보다 더 중요한 질문

Anthropic이 2026년 6월 9일 Claude Fable 5Claude Mythos 5를 발표했다. 표면적으로는 새 Claude 모델의 등장이다. 그러나 Fable 5를 둘러싼 첫 반응을 보면, 핵심은 “얼마나 똑똑한가”보다 “이 모델을 어디에 써야 비용이 맞는가”에 더 가깝다.

Fable 5는 Anthropic이 일반 사용자에게 공개한 최상위 Claude 계열 모델로 소개된다. Mythos 5와 같은 기반 모델을 공유하되, 사이버보안·생명과학·화학·모델 증류처럼 악용 가능성이 큰 영역에는 더 엄격한 안전장치를 둔 형태다. 쉽게 말해, Mythos급 능력을 대중 사용 환경에 맞게 조정한 모델이다.

여기서 성격이 갈린다. Fable 5는 “더 좋은 챗봇”이라기보다 “더 무거운 일을 맡길 수 있는 모델”에 가깝다. 긴 문맥을 붙잡고, 복잡한 지시를 따라가며, 여러 단계의 작업을 끝까지 밀어붙이는 데 유리하다. 대신 비용과 한도 소모도 그만큼 무겁다.

Fable 5와 Mythos 5는 어떻게 다른가

Anthropic의 설명에 따르면 Fable 5는 Mythos-class 모델이다. Mythos-class는 Opus보다 높은 능력 계층으로 소개되며, Mythos 5는 Project Glasswing 참여 기관과 제한된 신뢰 기반 프로그램에 제공된다. Fable 5는 같은 계열의 성능을 일반 사용자가 쓸 수 있게 만든 버전이다.

다만 두 모델의 차이는 이름만의 차이가 아니다. Fable 5는 위험도가 높다고 판단되는 요청을 직접 처리하지 않고 Opus 4.8로 라우팅할 수 있다. Anthropic은 이런 fallback이 전체 세션의 5% 미만에서 발생한다고 설명하지만, 사용자가 어떤 분야의 일을 맡기느냐에 따라 체감은 크게 달라질 수 있다.

국내 사용자 반응에서도 이 차이는 뚜렷했다. 일반 개발, 문서 정리, 레거시 코드 분석에서는 “일을 잘한다”는 평가가 많았다. 반면 bioinformatics처럼 민감한 과학 영역과 가까운 작업에서는 거절이 잦아 아직 제대로 써보지 못했다는 반응도 있었다. 같은 Fable 5라도, 업무 영역이 다르면 경험은 완전히 달라진다.

공식 발표의 초점

Anthropic이 강조한 Fable 5의 초점은 크게 네 가지다. 첫째는 장시간 자율 작업이다. 복잡한 목표를 여러 단계로 나누고, 이전 Claude 모델보다 긴 흐름을 안정적으로 유지한다는 설명이다. 둘째는 소프트웨어 엔지니어링이다. 대규모 코드베이스 마이그레이션, 장기 코딩 작업, 낯선 도구 사용에서 유리하다고 소개된다.

셋째는 지식 노동이다. 문서 기반 추론, 표와 차트 해석, 금융 분석, 법률 문서 검토처럼 맥락과 판단이 동시에 필요한 작업이 여기에 해당한다. 넷째는 비전과 장기 컨텍스트다. 이미지 기반 작업, 브라우저 기반 앱 재구성, 긴 메모리 기반 작업에서 이전 모델보다 나아졌다는 설명이다.

API 문서도 같은 방향을 가리킨다. claude-fable-5는 까다로운 reasoning과 long-horizon agentic work를 위한 모델로 정리되어 있다. 기본 1M context window와 최대 128k output token 지원도 눈에 띈다. 즉 Fable 5는 단발성 질문보다, 큰 자료를 넣고 오래 일하게 만드는 환경에서 의미가 커지는 모델이다.

초기 후기는 꽤 현실적이다

출시 직후 국내외 반응은 의외로 차분하다. 성능 기대는 크지만, 비용과 한도를 경계하는 목소리도 크다. 첫날 반응을 한 문장으로 줄이면 이렇다. “잘한다. 그런데 아무 데나 쓰면 안 된다.”

긍정적인 후기는 주로 깊이 있는 작업에서 나왔다. 국내 사용자 중 한 명은 기존 Opus에 여러 번 맡겨도 7에서 8개 정도만 잡히던 수정 사항을 Fable 5가 더 간단한 지시만으로 약 30개까지 찾아냈다고 평가했다. 다른 사용자는 기존 AI 업무보다 처리 속도가 3에서 5배 빨라진 느낌이라고 말했다. 또 다른 사례에서는 레거시 게시판 봇의 댓글 맥락 문제를 분석하고, 과거 실패 사례를 회귀 테스트로 바꾸며, 캐시 구조까지 설계한 긴 작업을 한 세션에서 처리했다는 경험도 공유됐다.

반대로 부정적 후기는 거의 모두 비용과 한도에서 나왔다. 국내 대화 로그에서는 토큰 한도가 빠르게 줄어든다는 반응이 반복됐다. 한 사용자는 프롬프트 한 번에 5-hour limit의 절반 이상이 사라졌다고 했고, 또 다른 사용자는 20장짜리 PPT 작업에서 세션 한도 대부분을 썼다고 전했다. Max 20 사용자도 무거운 작업 한 번으로 현재 세션 한도와 주간 한도가 크게 줄었다고 보고했다.

공개 Reddit 반응도 비슷하다. 일부 사용자는 Fable과 Mythos의 벤치마크가 함께 제시되어 Fable 단독 성능을 분리해 보기 어렵다고 지적했다. 또 다른 사용자는 민감 영역 요청을 Opus로 우회시키는 구조가 흥미롭지만, 실제 업무에서 어떤 요청이 fallback되는지 더 투명하게 봐야 한다고 했다. 초기 평가는 “성능이 높다”와 “아직 검증해야 한다”가 함께 간다.

모든 작업에 쓰기에는 너무 무겁다

Fable 5를 잘 쓰려면 먼저 작업을 골라야 한다. 짧은 요약, 일반적인 문장 생성, 간단한 코드 수정, 일상적인 질문에는 과하다. 이런 일은 Sonnet, Opus, 또는 더 저렴한 모델로도 충분하다. Fable 5는 실패 비용이 큰 작업에 투입해야 한다.

적합한 작업에는 공통점이 있다. 범위가 넓고, 기준이 있으며, 한 번의 깊은 추론이 여러 번의 얕은 반복보다 싼 경우다. 예를 들어 “이 글을 500자로 요약해줘”는 Fable 5용 작업이 아니다. 반면 “지난 3개월간의 제품 로그와 사용자 불만을 읽고, 반복되는 문제를 분류한 뒤, 다음 릴리스에서 고쳐야 할 우선순위를 근거와 함께 제시하라”는 Fable 5에 더 어울린다.

코드 작업도 마찬가지다. 함수 이름 하나를 바꾸는 일에는 과하다. 그러나 레거시 코드베이스에서 인증 흐름이 깨질 수 있는 지점을 찾고, 회귀 테스트까지 설계해야 한다면 이야기가 달라진다. 이때는 모델이 비싸더라도 여러 번의 실패를 줄이는 쪽이 더 경제적일 수 있다.

국내 사용자들이 “Fable에 맞는 하네스가 필요하다”고 말한 것도 같은 맥락이다. 상위 모델일수록 프롬프트 한 줄보다 작업 환경 설계가 중요하다. 입력 자료, 성공 기준, 중간 산출물, 실패 시 롤백 방식, 비용 통제 기준을 미리 잡아야 한다. 그렇지 않으면 Fable 5의 장점은 곧바로 토큰 소모로 바뀐다.

안전장치는 단점이 아니라 제품 구조다

Fable 5의 안전장치는 단순한 제한이 아니다. 상위 모델을 어떻게 공개할 것인가를 두고 Anthropic이 내놓은 답에 가깝다. Mythos급 능력을 그대로 풀지 않고, 민감한 영역은 classifier와 fallback으로 처리한다. 대부분의 일반 작업에서는 높은 성능을 제공하되, 위험 영역에서는 더 보수적인 모델로 우회하는 방식이다.

이 구조는 앞으로 다른 frontier model에도 영향을 줄 가능성이 크다. 모델 성능이 올라갈수록 “하나의 모델이 모든 요청에 같은 방식으로 답한다”는 구조는 약해진다. 대신 요청의 위험도와 분야에 따라 모델이 바뀌고, 로그 보존 정책이 달라지며, 접근 권한도 더 촘촘하게 나뉜다.

문제는 사용자가 그 과정을 충분히 볼 수 있느냐다. 어떤 요청이 왜 fallback됐는지, fallback된 답변을 Fable 5의 성능으로 봐야 하는지, 벤치마크에서 안전장치의 영향이 어떻게 반영됐는지는 더 분명해야 한다. Reddit에서 벤치마크 표기 방식에 의문이 나온 이유도 여기에 있다.

6월 22일까지는 시험 운전 기간이다

Anthropic은 Fable 5를 2026년 6월 22일까지 Pro, Max, Team, seat-based Enterprise 요금제에 추가 비용 없이 포함한다고 밝혔다. 6월 23일부터는 사용 크레딧이 필요하며, 수요와 용량에 따라 정책이 바뀔 수 있다. 지금은 사실상 대규모 공개 실험 기간이다.

이 기간에 해야 할 일은 단순한 감상이 아니다. 자기 업무에서 Fable 5가 실제로 비용을 이기는 지점을 찾아야 한다. 한 번의 호출로 세션 한도의 절반을 쓰더라도, 그것이 이틀짜리 분석을 30분으로 줄인다면 의미가 있다. 반대로 평범한 작업을 조금 더 잘하는 정도라면 굳이 비싼 모델을 쓸 이유가 없다.

현실적인 전략은 모델을 계층적으로 쓰는 것이다. Sonnet이나 Opus로 초안, 분류, 가벼운 수정, 자료 정리를 맡긴다. Fable 5는 병목 작업에만 투입한다. 긴 컨텍스트를 읽고 구조를 재설계하거나, 테스트 가능한 복잡한 작업을 끝까지 끌고 가야 할 때 사용하는 방식이다. 이렇게 써야 Fable 5는 “토큰을 태우는 모델”이 아니라 “반복 실패를 줄이는 모델”이 된다.

결론: Fable 5의 경쟁력은 운영에서 나온다

Claude Fable 5는 성능이 높다. 출시 당일 후기만 보아도 복잡한 코드 분석, 긴 문맥 유지, 까다로운 수정 작업, 에이전트형 업무에서 체감 성능이 높다는 반응이 많다. 그러나 동시에 비싸고, 한도 소모가 빠르며, 안전장치가 엄격한 분야에서는 기대와 다른 경험을 줄 수 있다.

Fable 5의 핵심 질문은 “가장 똑똑한 모델인가”가 아니다. 더 중요한 질문은 “어디에 써야 비용을 이기는가”다. 상위 모델은 사용자의 실력을 대체하지 않는다. 오히려 사용자의 작업 설계 능력을 더 선명하게 드러낸다.

Fable 5는 좋은 프롬프트만으로 제값을 하는 모델이 아니다. 좋은 문제 정의, 좋은 자료 구조, 좋은 검증 루프가 있어야 제값을 한다. 앞으로 AI 에이전트 시대의 경쟁력은 모델을 많이 쓰는 데 있지 않다. 어떤 모델을 어느 순간에 투입하고, 그 결과를 어떻게 검증하며, 비용을 어떻게 통제하는지에 있다.

Fable 5는 그 사실을 비싼 방식으로 알려주는 모델이다.

Related Reading

이 글과 주제를 공유하는 글 — 노드를 클릭해 이어 읽기