2026년 LLM 가격 전쟁 — Sonnet 4.6보다 10배 싼 모델이 코딩도 한다

LLM 가격 대비 코딩 성능 분포

SWE-bench Verified 리더보드 (2026년 2월)

코딩 모델의 실력을 가장 공정하게 비교할 수 있는 벤치마크, SWE-bench Verified. 2026년 2월 기준 상위 모델 순위다.

순위	모델	SWE-bench	제공사	비고
1	Claude Opus 4.6	80.8%	Anthropic	1M 컨텍스트 (beta)
2	MiniMax M2.5	80.2%	MiniMax	오픈소스
3	GPT-5.2	80.0%	OpenAI	Codex 특화
4	Sonnet 4.6	79.6%	Anthropic	무료 티어 기본
5	GLM-5	77.8%	Zhipu AI	744B 파라미터
6	Kimi K2.5	76.8%	Moonshot AI	1T MoE
7	DeepSeek V3.2	73.0%	DeepSeek	오픈소스
8	GPT-oss-120b	62.4%	OpenAI	오픈소스 MoE

상위 4개 모델이 80% 벽 근처에 몰려 있다. 1년 전 최고 점수가 65%였으니 진화 속도가 무섭다.

여기서 재밌어진다. 성능이 비슷해도 가격은 10배 이상 차이난다.

가성비 비교

모델	Input/1M	Output/1M	SWE-bench	한 줄 평
Opus 4.6	$5.00	$25.00	80.8%	왕. 비싸지만 최강
GPT-5	$1.25	$10.00	~80%	범용 1위
Gemini 2.5 Pro	$1.25	$10.00	~80%	1M 컨텍스트
Sonnet 4.6	$3.00	$15.00	79.6%	Claude Code 기본
Grok 4	$3.00	$15.00	—	xAI 플래그십

모델	Input/1M	Output/1M	SWE-bench	한 줄 평
Kimi K2.5	$0.60	$2.50	76.8%	가성비 톱
GLM-5	$0.30	$2.55	77.8%	10배 저렴, 2%p 차이
MiniMax M2	$0.30	$1.20	— (M2.5: 80.2%)	최신 M2.5는 괴물
DeepSeek V3.2	$0.28	$1.10	73.0%	캐시 히트 시 $0.07
Gemini 2.5 Flash	$0.15	$0.60	—	속도 특화

모델	Input/1M	Output/1M	SWE-bench	한 줄 평
GPT-oss-120b	$0.09	$0.45	62.4%	OpenAI 오픈소스
GPT-oss-20b	$0.03	$0.14	—	엣지용
GPT-5 mini	$0.25	$2.00	—	OpenAI 경량

이 글의 핵심 비교다.

항목	GLM-5	Sonnet 4.6	차이
Input (1M)	$0.30	$3.00	10배
Output (1M)	$2.55	$15.00	5.9배
SWE-bench	77.8%	79.6%	1.8%p
컨텍스트	205K	1M (beta)	Sonnet 4.9배

1.8%p 차이에 10배 비용?

API로 대량 처리하는 상황이라면 GLM-5가 합리적이다. 하루 1,000회 호출 기준:

연간으로 따지면 $1,824 절약. 작은 차이가 아니다.

Claude Pro($20/월)나 Max($100~200/월) 구독자는 API 가격을 내지 않는다. Sonnet 4.6이 Pro 기본 모델이 됐으니, 구독자 입장에선 사실상 무제한.

개인 개발자라면 구독이 거의 항상 이득이다. API 가격 전쟁은 B2B 대량 처리 시장에서 진짜 의미가 있다.

역할별 AI 모델 배분

모든 작업에 비싼 모델을 쓸 필요가 없다.

구독으로 커버되면 Sonnet/Opus. API로 대량 돌리면 GLM-5/DeepSeek.

2026년 2월, SWE-bench 77% 이상 모델을 $0.30/1M 토큰에 쓸 수 있다. Sonnet 4.6은 여전히 탁월한 모델이지만, 같은 돈이면 GLM-5로 6배 더 많이 돌릴 수 있다. 구독자가 아니라면 한번 진지하게 고민해볼 시점이다.

데이터 출처: pricepertoken.com, SWE-bench Verified Leaderboard (2026-02-18 기준)