CH.01 LLM · 모델
Claude
GPT-5
Gemini
기준글
이 글은 상태창 CH.01의 첫 번째 기준글이다. 다음 주부터는 매주 월요일, 지난 7일간의 변화를 패치노트로 올린다. 지금 이 글은 그 시작점 — Claude, GPT, Gemini 세 진영이 어떤 경로로 지금 여기까지 왔는지를 정리한다. “이걸 모르면 다음 주 업데이트가 왜 중요한지 모른다”는 게 이 글의 존재 이유다. LLM 모델 흐름을 이 채널에서 추적한다.
LLM 모델 최신 동향 — 2026년 기준 정리
Anthropic Claude — 채팅 모델에서 작업 시스템으로
LLM 모델 시장에서 Claude 4가 처음 등장한 건 2025년 5월이었다. Opus 4와 Sonnet 4가 동시에 출시됐고, 코딩 능력과 에이전트 작업이 핵심이었다. “Claude는 글 잘 쓰는 AI”라는 인식이 “개발자 워크플로 도구”로 바뀌기 시작한 시점이다.
같은 해 하반기, Sonnet 4.5(9월) · Haiku 4.5(10월) · Opus 4.5(11월)가 잇달아 출시됐다. 특히 Opus 4.5는 가격을 67% 낮추면서 성능은 오히려 높였다. 이 시점부터 Claude가 일상 도구로 쓰이기 시작했다.
2026년 2월, 진짜 변곡점이 왔다. Opus 4.6과 Sonnet 4.6이 12일 간격으로 연속 출시됐는데, Sonnet 4.6이 이전 세대 Opus 4.5보다 코딩·문서 이해력에서 앞서는 결과가 나왔다. 1M 토큰 컨텍스트 창도 이때 정식 GA로 전환되어 추가 과금 없이 표준 요금으로 사용 가능해졌다.
4월 16일, Opus 4.7 출시. 비전 해상도 3배 향상, 법률·금융 벤치마크 최고점 기록. 현재 Claude 최상단 모델이다. 주의: 원조 Claude 4.0 모델(20250514 날짜 문자열)은 2026년 6월 15일 API에서 은퇴 예정이다.
기존에 Opus로 쓰던 업무(보고서 초안, 긴 문서 분석)를 Sonnet 4.6으로 전환하면 비용 80% 절감에 품질은 거의 동일하다. 예: “이 계약서 50페이지 핵심 리스크 정리해줘” → Sonnet 4.6으로 충분.
Claude.ai 무료 플랜이면 Sonnet 4.6 기반. 아무것도 안 해도 이미 업그레이드되어 있다. 예: 과제 피드백, 이메일 초안 작성, 유튜브 스크립트 요약을 그냥 써도 된다.
1M 토큰 컨텍스트를 활용해 긴 원고 전체를 한 번에 넣고 편집 요청 가능. 예: 책 초고 5만 자를 통째로 올리고 “챕터별 흐름 다듬어줘” 같은 작업이 가능하다.
OpenAI GPT — 하나의 슈퍼모델로 통합한 GPT-5, 그리고 5.5까지
LLM 모델 경쟁에서 GPT-5가 공식 출시된 건 2025년 8월 7일이다. 이전까지는 GPT-4o, o1, o3를 용도에 따라 따로 써야 했는데, GPT-5는 이 모든 걸 하나로 통합했다. 빠른 답변과 단계적 추론을 자동으로 선택하고, 사실 오류도 GPT-4o 대비 45% 줄었다.
출시 초반엔 재미있는 사건이 있었다. GPT-4o의 따뜻한 톤에 익숙했던 유저들이 GPT-5를 “직장인 같다”, “감성이 없다”며 불만을 터뜨렸고, 복원 청원까지 올라왔다. Sam Altman이 “우리가 과소평가했다”고 직접 인정하며 톤 업데이트를 진행했을 정도였다.
이후 GPT-5.2 · 5.3 · 5.4가 연속으로 나오며 추론·코딩·컴퓨터 사용 능력이 보강됐다. 2026년 4월 23일엔 GPT-5.5 출시. 복잡한 멀티스텝 작업을 계획·실행·검증하는 에이전트 능력이 특히 강화됐고, 현재 OpenAI 최상단 모델이다.
ChatGPT Plus($20/월)로 GPT-5.5 접근 가능. Canvas 편집 환경이 글쓰기 작업에 특히 강하다. 예: 제안서 초안을 넣고 Canvas에서 실시간으로 섹션별로 다듬는 방식.
무료 플랜도 GPT-5 계열 사용 가능(제한적). 예: 수학 문제 풀이 과정 단계별로 설명 요청, 영어 글쓰기 피드백, 실시간 번역 통역 기능 활용.
GPT-5.5의 에이전트 코딩 능력으로 자동화 스크립트 제작 가능. 예: “내 Notion 데이터베이스에서 이번 달 완료 항목만 뽑아 주간 보고서 만들어줘” 같은 복합 작업.
Google Gemini — 2.5에서 3, 그리고 3.1까지 18개월의 질주
Google의 Gemini는 LLM 모델 기준으로 18개월 만에 세 세대를 넘어왔다. Gemini 2 · 2.5 · 3 · 3.1이 차례로 나왔고, 각 세대마다 Pro(최고 성능) · Flash(속도·비용 최적화) · Flash-Lite(대규모 처리)의 3계층 구조를 유지했다.
가장 주목할 구간은 Gemini 2.5 Pro다. 2025년 상반기 등장한 이 모델은 코딩 분야에서 개발자들에게 인기가 높았고, WebDev Arena와 LMArena 리더보드 1위를 기록했다. “Deep Think” 추론 모드가 도입되어 수학·과학 벤치마크에서도 경쟁력을 보였다.
2026년 기준 최신 모델은 Gemini 3.1 Pro Preview로, ARC-AGI-2 벤치마크 77.1% 기록. 멀티모달(영상·오디오·이미지 동시 처리)과 1M 컨텍스트, 컴퓨터 사용 기능을 갖추고 있다. API 가격 경쟁력이 다른 프론티어 모델 대비 높은 편이다.
Google Workspace 쓰는 조직이라면 Gemini 연동이 가장 자연스럽다. 예: Gmail에서 받은 고객 문의 10개를 한 번에 요약하고, Sheets에서 판매 데이터를 자동 분석하는 워크플로.
NotebookLM과 함께 쓰면 강의 자료 정리·시험 준비에 강하다. 예: 교수님 강의 PDF를 NotebookLM에 올리고 “이 내용으로 예상 문제 10개 만들어줘” 요청.
영상·이미지·텍스트를 한 번에 넣고 분석하는 멀티모달 처리 능력 활용. 예: 유튜브 영상 링크를 넣고 “이 영상 핵심 내용으로 블로그 글 써줘” 같은 작업.
세 LLM 모델 진영 모두 방향이 같다. 더 싸게, 더 길게, 더 자율적으로. Sonnet이 Opus를 잡았고, GPT-5가 모델 선택 고민을 없앴고, Gemini는 Google 생태계 안에서 조용히 확장 중이다. 다음 주부터 이 흐름 위에 쌓이는 변화를 추적한다.