CH.01 LLM · 모델
Claude
Sonnet 4.6
Advisor Tool
Claude Code
// Claude Sonnet 4.6 — 2026.05 W3 업데이트 로그
이번 주 Claude 업데이트 LLM 패치노트는 Anthropic 중심으로 굴러갔다. Sonnet 4.6이 Free·Pro 플랜 기본 모델로 공식 자리를 잡았고, Opus와 Sonnet을 조합해 쓰는 Advisor Tool 베타가 풀렸다. Claude Code에는 목표 달성까지 알아서 돌아가는 /goal 모드도 추가됐다. 한 마디로, “비싼 거 안 써도 이제 충분하다”는 흐름이 본격화됐다.
이번 주 Claude 업데이트 — Sonnet 4.6 관련 주요 내용을 정리했다.
Sonnet 4.6, Free·Pro 기본 모델로 확정 — Opus급 성능을 Sonnet 가격에
Sonnet 4.6 SWE-bench
Opus 4.6 SWE-bench
Sonnet vs Opus 가격비
개발자 Sonnet 선호율
Anthropic이 Claude Sonnet 4.6을 Free·Pro 플랜의 공식 기본 모델로 전환했다. 이번 Claude 업데이트에서 가장 중요한 변화다. 코딩·컴퓨터 사용·장문 추론·에이전트 플래닝 전 분야에서 전작 Sonnet 4.5 대비 성능이 올랐다. 가격은 Sonnet 4.5와 동일하게 입력 100만 토큰당 $3, 출력 $15로 유지된다.
수치가 이 변화를 가장 잘 보여준다. SWE-bench(실제 코딩 능력 벤치마크) 기준으로 Opus 4.6이 80.8%, Sonnet 4.6이 79.6%로 격차가 겨우 1.2%p다. Claude 역사상 Opus와 Sonnet 사이의 성능 격차가 가장 좁아진 순간이다. 그런데 가격 차이는 출력 토큰 기준으로 Opus가 5배 더 비싸다. 개발자 선호도 조사에서도 이전 플래그십이었던 Opus 4.5보다 Sonnet 4.6을 선택한 비율이 59%였다. 숫자가 말하는 건 하나다. 이제 대부분의 작업에서 Sonnet이 먼저다.
추가로, 100만 토큰 컨텍스트 창이 API 베타로 지원된다. 일반적인 책 한 권 분량의 텍스트를 한 번에 넣고 작업할 수 있는 규모다.
기존에 Opus를 쓰던 업무(보고서 초안, 데이터 분석)를 Sonnet 4.6으로 전환하면 비용을 80% 절감하면서 거의 같은 품질을 확보할 수 있다.
Free 플랜에서도 이제 Sonnet 4.6이 기본이므로, 별도 설정 없이 더 나은 답변을 받을 수 있다. 아무것도 안 해도 된다.
긴 글 초안, 다국어 콘텐츠 작업에 100만 토큰 컨텍스트를 API 베타로 써볼 수 있다. API 키가 있다면 지금 바로 테스트 가능.
Advisor Tool 베타 — Sonnet이 일하고, Opus가 감수한다
Anthropic이 Advisor Tool을 API 베타로 공개했다. 개념은 간단하다. Sonnet 4.6이 실행자(executor)로 코드를 짜거나 작업을 수행하고, Opus 4.6이 감수자(advisor)로 올라타서 매 단계마다 “이게 맞냐”고 검토한다. 2개의 모델이 협력하는 구조다.
왜 이게 의미 있냐면, Sonnet 단독으로 쓰는 것보다 더 높은 품질을 내면서, Opus 단독보다 훨씬 저렴기 때문이다. SWE-bench 다국어 코딩 테스트에서 Sonnet 단독 대비 Sonnet+Advisor 조합이 눈에 띄게 높은 점수를 기록했다. API에서 사용하려면 헤더에 anthropic-beta: advisor-tool-2026-03-01을 추가하면 된다.
복잡한 코드 리뷰나 법무 문서 검토처럼 2중 확인이 필요한 작업에, Sonnet이 초안을 잡고 Opus가 감수하는 파이프라인을 API로 구성할 수 있다.
지금 당장 직접 쓸 기능은 아니지만, 이 구조가 Claude 앱 내부에 점점 녹아들 예정이므로 “더 꼼꼼해지는 Claude”를 기대하면 된다.
자동화 워크플로를 API로 구성하는 경우, Advisor 조합을 붙이면 오류율을 낮춘 고품질 아웃풋을 더 저렴하게 뽑을 수 있다.
Claude Code /goal 모드 — 목표 달성까지 멈추지 않는 자율 루프
Claude Code 2.1.139 업데이트에 /goal 명령어가 추가됐다. 한 줄로 설명하면 이렇다. “완료 조건을 적어두면, 조건이 충족될 때까지 Claude가 스스로 계속 작업한다.” 그 사이에 사람이 개입할 필요가 없다.
작동 방식은 이렇다. 사용자가 /goal 테스트 전체 통과처럼 완료 조건을 적으면, Claude가 코드를 수정하고, 라운드가 끝날 때마다 소형 고속 모델(기본값: Haiku)이 자동으로 호출돼 조건이 충족됐는지 판단한다. 아직이면 다음 라운드를 이어가고, 충족되면 제어권을 사용자에게 돌려준다. OpenAI Codex가 먼저 같은 이름의 기능을 출시했고, Anthropic이 한 달여 만에 대응한 모양새다.
/goal 모드를 쓰기 전에 알아야 할 6가지
- 명령어 형식 — /goal <조건 텍스트> 형태로 대화 중에 바로 입력한다. 설정 파일 수정이나 사전 준비가 필요 없다.
- 평가는 별도 모델이 한다 — 작업을 수행하는 모델(Sonnet 등)과 완료 여부를 판단하는 모델(기본값 Haiku)이 분리돼 있다. 자기 자신이 “나 다 했어”라고 판단하지 않아서 더 정확하다.
- 현재 세션에만 유효하다 — /goal은 현재 대화 세션에만 적용된다. 다른 세션에 영향을 주지 않으므로 임시·단발성 작업에 적합하다.
- 매 라운드 끝마다 평가한다 — Claude가 한 번 작업을 완료할 때마다 즉시 평가가 돌아간다. 통과하면 종료, 아니면 다음 라운드 시작.
- 조건은 최대 4,000자까지 — 단순한 한 줄부터 상세한 검수 기준까지 길게 쓸 수 있다. “테스트 통과”보다 “유닛 테스트 32개 전부 통과, 빌드 에러 0개” 같이 구체적일수록 정확하게 작동한다.
- 종료 방법은 3가지 — 조건 자동 통과 / /goal clear로 수동 해제 / Ctrl+C로 강제 중단. 언제든 멈출 수 있다.
반복적인 코드 수정·테스트 사이클에 /goal을 걸어두면, 자리를 비운 사이에도 Claude가 조건 만족까지 알아서 돌아간다. 퇴근 전에 걸고 다음 날 결과 확인하면 된다.
Claude Code를 처음 쓰는 경우라면 /goal보다 기본 채팅 모드부터 익히는 게 낫다. 자율 루프는 맥락을 파악한 후에 써야 효과적이다.
블로그 자동화, 콘텐츠 파이프라인처럼 단계가 많은 작업에 완료 조건을 걸면 중간 개입 없이 결과물까지 가져올 수 있다.
“비싼 모델 안 써도 된다”는 흐름이 수치로 증명됐다. Sonnet 4.6이 Opus 성능의 99%를 1/5 가격에 제공하고, Advisor Tool이 그 격차마저 좁힌다. Claude Code는 이제 알아서 끝까지 간다.
→ CH.02 AI 도구 — Cursor Teams 연동, Perplexity 원클릭 슬라이드
→ CH.03 MCP·에이전트 — Cowork GA, MCP 서버 4,100개 돌파
→ CH.04 AI 산업 — Anthropic 합작사 설립, 게이츠 재단 투자