Anthropicから新しいモデルClaude Fable 5が出たので、さっそく1日まるまる触ってみました
世間の総括をひとことで言うと「遅い・トークンを食う・しかし有能」あたりに落ち着いていて、私の体感もだいたいそこに重なります
ただ、本家ブログでは焦点をひとつに絞りたいので、今回はトークンの減りの速さを記事の背骨にして書いていきます、性能向上そのものは正直地味なんですが、トークンが消えていくスピードはちょっと無視できないなと感じたので
結論を先に薄く置いておくと、こんな感じです
- 有能さは確かにある、でも一般的な用途だと差が見えにくい
- 速度を売りにしたモデルではない、深く考えるぶん時間はかかる
- とにかくトークンの減りが速い、私の体感ではMAXプランでなんとか使えるくらい
そもそもモデルやトークンってなに?という方は、先にAI用語集に目を通しておくと、この先がぐっと読みやすくなると思います
この記事は2026年6月時点の情報です、Fable 5は提供条件の変更が予告されていて、6月23日以降はサブスク枠から外れて従量課金(usage credits)に変わります、今のコスト感がそのまま続くわけではない点に注意してください
カタログスペックでOpus 4.8と比べてみる
まずは公式が出している数字から、ひとつ前のClaude Opus 4.8と並べて見てみます、ここはぜんぶ公式発表値です
| 項目 | Claude Fable 5 | Claude Opus 4.8 |
|---|---|---|
| リリース | 2026-06-09 GA | 2026-05-28 |
| モデルID | claude-fable-5 | claude-opus-4-8 |
| コンテキスト | 1M tokens | 1M tokens |
| 最大出力 | 128k tokens | 128k tokens |
| API入力 | $10 / Mtok | $5 / Mtok |
| API出力 | $50 / Mtok | $25 / Mtok |
| 思考モード | adaptive thinking 常時オン(無効化不可) | オン/オフ選択可 |
| effort | low/medium/high/xhigh/max、既定 high | 同左、既定 high |
| Fast mode | なし | あり(約2.5倍速) |
表を見てまず目に入るのは、API価格がOpus 4.8のちょうど2倍になっているところです、入力$10・出力$50で、Opus 4.8の入力$5・出力$25からきっちり倍ですね
もうひとつ大きいのが思考モードのちがいです、Opus 4.8は思考をオン/オフ選べるんですが、Fable 5はadaptive thinkingという深く考える仕組みが常時オンで無効化できません、AIが内部でじっくり考えるぶん、見えないところで思考用のトークンが乗ってくる作りになっています
速度を上げるFast modeがFable 5には用意されていないのも、地味だけど効いてきます、このあたりが「速さは売りじゃない」を裏づけている感じですね
公式ベンチマークの主役はSWE-bench Pro
性能の数字も見ておきます、Anthropicが公式発表で前面に出しているのはSWE-bench Proというコーディングのベンチマークです
| ベンチマーク | Fable 5 | Opus 4.8 |
|---|---|---|
| SWE-bench Pro(公式の主役) | 80.3% | 69.2% |
| FrontierCode Diamond | 29.3% | 13.4% |
| GDPval-AA | 1932 | 1890 |
| Terminal-Bench | 84.3 | 82.7 |
SWE-bench Proで80.3%、Opus 4.8の69.2%から10ポイント以上の上積みなので、数字としてはちゃんと伸びています
SNSやまとめ記事で「SWE-bench 95%」という数字を見かけるかもしれませんが、これは第三者が集約したSWE-bench Verifiedの値です、Anthropic公式が主役として出しているのはSWE-bench Pro 80.3%のほうなので、ここは混同しないようにしておきたいところです
世の中の評価はどうなっている?
次に、私の感想に行く前に世間の声を整理しておきます、肯定も否定もはっきり出ていて、両方知っておくとバランスよく判断できると思うので
肯定的な評価
有名な解説者のSimon Willisonさんは「a beast(怪物級)、遅くて高いが、あらゆるタスクを着実に噛み砕き続ける」と評していて、知識の想起についてはOpus 4.8より上だと書いています
大規模な事例だと、Stripeが5,000万行のRubyコードベースを1日で移行したという自己申告もあります、ほかにも、過去モデルが作り込んだバグを複数見つけ出したという報告や、調査の自律性が上がった(他人のブランチまで自分でpullして原因を特定する)という体験談が出ています
共通しているのは「単なるコード生成器ではなく、開発サイクルそのものの運転手になりつつある」という見方で、長時間まかせる使い方ほど評価が高い印象です
否定的・不満の声
一方で、辛口の声もしっかりあります
技術系コミュニティでは「進化は革命的というより漸進的(incremental)」「ベンチマークへの過適合では?」という疑いの声が出ています
そして何より多いのがコストとレート上限への不満です、Willisonさんは初日のAPI利用で$110.42、ほかにも1日で$82.92という報告、$100のMaxプラン枠を約9分で使い切ったという話まで出回っています(このあたりの個人実測値は再現性が確かめられていないので、雰囲気として受け取るのが安全です)
複数のテスターをまたいだ総括は「遅い・トークンを食う・高価・しかし異常に有能」あたりで一致しています、評価が割れているのではなく、良い点と悪い点が同居していると捉えると分かりやすいです
1日触った私の体感
ここから先はあくまで私個人の感想です、公式発表値とは切り分けて読んでください、使い方や設定によって体感は大きく変わると思います
性能・速度・トークン消費の3つの軸で、1日触った正直なところを書いていきます
性能:上がった気はする、でも目に見えてすごいかは分からない
Webデザインや受け答えの質は、Opus 4.8より上がった気はします、ただ、目に見えてすごい向上かと言われると、正直よく分かりませんでした
たぶんこれは、私が一般的な用途でそこまで高難易度の使い方をしていないだけかもしれません、世間でも「単発のタスクだと差が見えにくい」という見方は共通していて、差が出るのは長時間の自律タスクや大規模なコードベースを扱うときみたいです
Stripeの5,000万行みたいな規模感だと真価が出るんでしょうが、日常の使い方だとそこまで実感しづらい、というのが私の体感です
速度:それなりに時間はかかる、〇倍速いみたいな体感はない
速度については、それなりに時間はかかる、という印象です、Opusと比べて速度が何倍も速いみたいな体感はありませんでした
これは私が日頃からeffort(どれだけ手間をかけて考えるかの設定)を高めにしているのも要因です、effortを上げているぶん深く考えるので、そのぶん待ち時間も伸びます
世間でも「effortをmediumにしてもOpus 4.8のxhighより倍以上かかる」という声があって、ここは私の体感と一致しています、Fable 5はadaptive thinkingが常時オンで深く考える設計なので、遅く感じるのは仕様どおりとも言えます、速くしたいならeffortを下げる、というのが公式の指針です
トークン消費:噂以上に速く減る、PROだと厳しいと思う
そして本題のトークン消費です、ここがいちばん言いたいところでした
SNSでも噂されているとおり、かなりの速さで減ります、しかも私の体感では、5〜10倍かそれ以上の勢いで減っていく感覚でした、世間でよく言われる「3〜5倍」よりも、自分のケースはもっと激しかったです
感覚としては、MAXプラン($110)でも厳しい、PROプランだとすぐ5時間の上限に達して、ほぼ使えないんじゃないかなと思います
もちろん、これも私がeffortを高めにしているのが要因のひとつなので、effortを下げれば減りは緩やかになります、ただ「思っていたより全然速い」というのが1日触っての正直な感想です
「トークンが速く減る」噂をファクトチェックする
では、なぜそんなにトークンが減るのか、「3〜5倍速く減る」という噂を分解してみます、結論から言うと、方向性は正しいけれど「モデルが勝手に食う」というより複数の要因の掛け算でそうなっています
同じ作業でも、サブスク枠の消費がOpus比で約2倍に重み付けされています、複数の情報源で一致している点です
同じテキストでも、新しいトークナイザだと約30%多くトークンを数えます、これは公式が明記しています
effortの既定がhighで、さらにadaptive thinkingが常時オンなので、思考用のトークンがどうしても乗ってきます、ここはゼロにできません
Claude Codeだと大きなシステムプロンプトやツール定義が毎回乗りますし、並列のサブエージェントに作業を分解する仕組みも、設計上どうしても計算量が増えます
ざっくり計算すると、重み約2倍 × トークナイザ約30%増 = 約2.6倍が構造的な下限になります、ここにhigh effortと常時オンの思考、並列ワークフローが乗ると、体感3〜5倍に届く、という内訳です
つまり「3〜5倍速く減る」は、ひとつの巨大な原因ではなく、重み × トークナイザ × effort × 思考 × 運用の合算だった、というのがファクトチェックの答えです
そして私のように、effortを高めにしてワークフローやサブエージェントも多用していると、この合算がさらに上振れします、自分の体感が3〜5倍ではなく5〜10倍に感じたのも、たぶんこの上振れぶんなんだろうなと、分解してみて腑に落ちました
これに対してAnthropic公式は「Fable 5は過去モデルよりトークン効率が良い」「1トークンあたりではなく1タスクあたりで見れば効率的(少ない反復で網羅的にこなす)」と反論しています、見る軸(per-token か per-task か)で結論が割れる、というのがポイントですね
たぶん、一般的な用途だと1タスクあたりの旨味が出にくくて、1トークンあたりのコスト感だけがダイレクトに来てしまう、これが私の「割に合わない感」やSNSの不満の正体なんだと思います、Claude固有の用語をもう少し押さえたい方はClaude用語集もあわせてどうぞ
まとめ:日常はOpus 4.8、長期・大規模はFable 5
1日触ってみての私なりの結論は、使い分けがいちばん現実的、というところに落ち着きました
- 日常の軽い作業や単発のタスクは、半額のOpus 4.8で十分
- 長期・複雑・大規模なコードをまるごとまかせるならFable 5の出番
- トークンを節約したいなら、effortを下げる・Sonnetを併用する
Fable 5が有能なのは間違いないんですが、その有能さを引き出せるのは長時間まかせる大きな仕事のときで、日常使いだとコストの重さばかりが目立ちやすい、というのが正直な体感でした
くり返しになりますが、これは2026年6月時点の話です、6月23日以降はFable 5がサブスク枠から外れて従量課金に切り替わるので、「今ならMAXでギリ使える」という感覚も、それ以降は変わってきます、導入を考えている方は最新の料金体系を確認してから判断するのがおすすめです
新しいモデルが出るたびにワクワクしますが、Fable 5は「とりあえず一番新しいから使う」よりも、自分の用途に合うかを見極めてから取り入れる方が幸せになれそうだなと感じた1日でした



コメント