2026년 LLM 가격 전쟁 — Sonnet 4.6보다 10배 싼 모델이 코딩도 한다

SWE-bench Verified 리더보드 (2026년 2월)
코딩 모델의 실력을 가장 공정하게 비교할 수 있는 벤치마크, SWE-bench Verified. 2026년 2월 기준 상위 모델 순위다.
| 순위 | 모델 | SWE-bench | 제공사 | 비고 |
|---|---|---|---|---|
| 1 | Claude Opus 4.6 | 80.8% | Anthropic | 1M 컨텍스트 (beta) |
| 2 | MiniMax M2.5 | 80.2% | MiniMax | 오픈소스 |
| 3 | GPT-5.2 | 80.0% | OpenAI | Codex 특화 |
| 4 | Sonnet 4.6 | 79.6% | Anthropic | 무료 티어 기본 |
| 5 | GLM-5 | 77.8% | Zhipu AI | 744B 파라미터 |
| 6 | Kimi K2.5 | 76.8% | Moonshot AI | 1T MoE |
| 7 | DeepSeek V3.2 | 73.0% | DeepSeek | 오픈소스 |
| 8 | GPT-oss-120b | 62.4% | OpenAI | 오픈소스 MoE |
상위 4개 모델이 80% 벽 근처에 몰려 있다. 1년 전 최고 점수가 65%였으니 진화 속도가 무섭다.
가격은 얼마나 다른가
여기서 재밌어진다. 성능이 비슷해도 가격은 10배 이상 차이난다.

프리미엄 구간 (Input $1 이상)
| 모델 | Input/1M | Output/1M | SWE-bench | 한 줄 평 |
|---|---|---|---|---|
| Opus 4.6 | $5.00 | $25.00 | 80.8% | 왕. 비싸지만 최강 |
| GPT-5 | $1.25 | $10.00 | ~80% | 범용 1위 |
| Gemini 2.5 Pro | $1.25 | $10.00 | ~80% | 1M 컨텍스트 |
| Sonnet 4.6 | $3.00 | $15.00 | 79.6% | Claude Code 기본 |
| Grok 4 | $3.00 | $15.00 | — | xAI 플래그십 |
가성비 구간 (Input $1 미만)
| 모델 | Input/1M | Output/1M | SWE-bench | 한 줄 평 |
|---|---|---|---|---|
| Kimi K2.5 | $0.60 | $2.50 | 76.8% | 가성비 톱 |
| GLM-5 | $0.30 | $2.55 | 77.8% | 10배 저렴, 2%p 차이 |
| MiniMax M2 | $0.30 | $1.20 | — (M2.5: 80.2%) | 최신 M2.5는 괴물 |
| DeepSeek V3.2 | $0.28 | $1.10 | 73.0% | 캐시 히트 시 $0.07 |
| Gemini 2.5 Flash | $0.15 | $0.60 | — | 속도 특화 |
초저가 구간 (Input $0.10 미만)
| 모델 | Input/1M | Output/1M | SWE-bench | 한 줄 평 |
|---|---|---|---|---|
| GPT-oss-120b | $0.09 | $0.45 | 62.4% | OpenAI 오픈소스 |
| GPT-oss-20b | $0.03 | $0.14 | — | 엣지용 |
| GPT-5 mini | $0.25 | $2.00 | — | OpenAI 경량 |
핵심: GLM-5 vs Sonnet 4.6
이 글의 핵심 비교다.
| 항목 | GLM-5 | Sonnet 4.6 | 차이 |
|---|---|---|---|
| Input (1M) | $0.30 | $3.00 | 10배 |
| Output (1M) | $2.55 | $15.00 | 5.9배 |
| SWE-bench | 77.8% | 79.6% | 1.8%p |
| 컨텍스트 | 205K | 1M (beta) | Sonnet 4.9배 |
1.8%p 차이에 10배 비용?
API로 대량 처리하는 상황이라면 GLM-5가 합리적이다. 하루 1,000회 호출 기준:
- Sonnet 4.6: 월 약 $180
- GLM-5: 월 약 $28
연간으로 따지면 $1,824 절약. 작은 차이가 아니다.
하지만, 구독이면 이야기가 다르다
Claude Pro($20/월)나 Max($100~200/월) 구독자는 API 가격을 내지 않는다. Sonnet 4.6이 Pro 기본 모델이 됐으니, 구독자 입장에선 사실상 무제한.
- API 유저 → 가격 비교가 중요. GLM-5, DeepSeek 고려
- 구독 유저 → 고정비이므로 성능만 보면 됨. Sonnet 4.6 최적
개인 개발자라면 구독이 거의 항상 이득이다. API 가격 전쟁은 B2B 대량 처리 시장에서 진짜 의미가 있다.
내 전략: 역할별 모델 배분

모든 작업에 비싼 모델을 쓸 필요가 없다.
| 역할 | 모델 | 이유 |
|---|---|---|
| 아키텍처 설계 | Opus 4.6 ($200 구독) | 깊은 추론이 필요한 곳엔 돈 아끼지 않는다 |
| 일반 코딩 | Sonnet 4.6 (구독 포함) | Pro 구독이면 추가 비용 0 |
| 대량 자동화 | GLM-5 / DeepSeek V3.2 | API 과금 구간. 싸면 쌀수록 좋다 |
| 단순 분류/요약 | Flash / Haiku | 속도와 최소 비용 |
구독으로 커버되면 Sonnet/Opus. API로 대량 돌리면 GLM-5/DeepSeek.
한 줄 요약
2026년 2월, SWE-bench 77% 이상 모델을 $0.30/1M 토큰에 쓸 수 있다. Sonnet 4.6은 여전히 탁월한 모델이지만, 같은 돈이면 GLM-5로 6배 더 많이 돌릴 수 있다. 구독자가 아니라면 한번 진지하게 고민해볼 시점이다.
데이터 출처: pricepertoken.com, SWE-bench Verified Leaderboard (2026-02-18 기준)