AI 비서 트렌드, Sonnet 4.6, 그리고 내가 요즘 하고 있는 3가지 일

이 글은 아래 유튜브 영상의 내용을 정리한 포스트입니다.

AI 비서, 왜 갑자기 이렇게 뜨거운가

최근 AI 비서 생태계가 빠르게 확장되고 있다. OpenClaw를 필두로 nanobot, picoclaw, zeroclaw 같은 경량화 대안들이 속속 등장하면서, "AI가 내 컴퓨터를 대신 조작해준다"는 컨셉이 점점 현실에 가까워지고 있다.

AI 비서 트렌드와 OpenClaw 창시자 Peter Steinberger의 OpenAI 합류 소식

특히 OpenClaw를 만든 Peter Steinberger가 OpenAI에 합류한 것이 큰 화제였다. OpenClaw는 독립적인 오픈 프로젝트로 이어질 예정이지만, 창시자가 OpenAI로 갔다는 것 자체가 이 분야의 가능성을 보여준다.

Sonnet 4.6, Opus 없이도 충분한가

Claude Sonnet 4.6이 출시되면서 자연스럽게 Opus 4.6과의 비교가 이루어졌다. 전체 벤치마크 기준으로 Sonnet 4.6이 Opus 4.6을 넘어서지는 못하며, 대체로 Opus 4.5와 비슷한 수준이다.

하지만 AI 비서 용도로 보면 이야기가 달라진다.

Sonnet 4.6 벤치마크 비교표 — Agentic computer use, Financial, Office 항목이 하이라이트되어 있다

주목할 부분은 다음 세 가지다.

항목	Sonnet 4.6	Opus 4.6	비고
Agentic computer use	72.5%	72.7%	거의 동일
Agentic financial analysis	63.3%	60.1%	Sonnet이 더 높음
Office tasks	1633	1606	Sonnet이 더 높음

컴퓨터 조작 성능은 Opus 4.6과 거의 동일하면서, 재무 분석과 사무 작업에서는 오히려 Sonnet이 앞선다. 여기에 더 적은 토큰과 빠른 속도까지 고려하면, AI 비서 용도로는 굳이 Opus를 쓸 필요가 없다. Sonnet 4.6이면 충분하다.

Dev Log — 요즘 하고 있는 3가지 일

벌써부터 정신없는 2026년이다. 새로운 모델이 쏟아지면서 개발이 쉬워진 건 사실이지만, 그만큼 동시에 처리해야 할 것도 늘어났다. 요즘 만들고 있는 세 가지 프로젝트를 소개한다.

1. Claude Hook Logger — 작업 추적 도구

Claude Code로 병렬 작업을 하다 보면 집중력이 흐트러진다. 여러 세션을 동시에 돌리면서 "내가 지금 뭘 하고 있었지?" 싶은 순간이 자주 온다. 이 문제를 해결하기 위해 만든 것이 Claude Hook Logger다.

Claude Hook Logger 대시보드 — 세션별 이벤트 타임라인과 도구 사용 빈도를 시각화한다

현재 작업 상태와 세션별 대화 내용을 추적하고, 사용된 스킬(Skill)의 빈도를 시각화해서 보여준다. 날짜별 로그 파일이 저장되기 때문에 하루 작업량을 관리하기에도 좋다.

여기에 커스텀 커맨드(Skill)도 붙여서 반복 작업을 자동화했다.

Test Commit Push Clean: 테스트 실행부터 PR 생성, 작업 정리까지 한 번에 수행
Smart Commit: 여러 작업이 섞여 있을 때 변경 사항을 분석해서 한 번에 커밋

MCP 기반 채팅 기능도 연동했다. 직접 만든 MCP(Model Context Protocol)를 통해 "최근 30분 활동 요약해줘"처럼 하루 작업 내용이나 미완료 작업을 채팅으로 브리핑받을 수 있다.

2. CC Bot — 텔레그램 AI 비서

텔레그램에서 작동하는 개인 맞춤형 봇이다. 새로운 세션 실행, 기존 대화 요약 저장, 이미지 생성, 음성 메시지 변환, 할 일 관리, GitHub 프로젝트 관리까지 다 들어 있다.

CC Bot 도움말 화면과 Playwright CLI 스킬 기반 테스트 환경

특히 크론(Cron) 작업 기능이 재밌다. "1분마다 아무 아이디어 하나를 제안해줘" 같은 반복 작업을 등록하면, 봇이 알아서 주기적으로 응답을 보내준다.

크론 작업 등록 후 1분마다 아이디어를 제안하는 CC Bot

테스트 환경도 개선했다. 기존에 쓰던 브라우저 테스트(Chrome MCP 등)는 토큰 소모가 크고 느렸는데, Playwright CLI를 스킬로 사용하는 방식으로 바꾸면서 훨씬 효율적인 브라우저 테스트 환경을 구축할 수 있었다.

3. 러닝 마라톤 맵 서비스

취미인 러닝과 관련된 서비스다. 전국 마라톤 대회 정보를 지도 기반으로 보여주는 웹앱을 만들고 있다.

러닝 대회 지도 서비스 — 접수 상태, 거리별 필터링과 대회 리스트를 함께 제공한다

배포는 되어 있지만 아직 초기 단계다. 데이터 업데이트 자동화를 테스트하고 있는 중이다.

AI와 함께 일한다는 것

새 모델이 나올 때마다 개발이 쉬워지는 건 맞다. 하지만 그렇다고 할 일이 줄어들지는 않았다. 오히려 동시에 처리할 수 있는 일이 늘어나면서 더 정신없어지는 역설적인 상황이 되기도 한다.

AI 비서가 유용한 영역은 분명히 있다. 버스 도착 시간 알림 같은 생활 편의 기능이나, 크론 작업을 통한 백그라운드 테스트 대행은 실제로 편하다.

하지만 복잡한 개발 자체를 AI에게 통째로 맡기는 건 아직 효율이 떨어진다. 직접 하면 30분에서 1시간이면 끝날 일을 AI는 3시간 동안 처리하기도 한다. 원격 환경 같은 특수한 상황이 아니라면, 개발은 직접 주도하고 AI는 보조 도구(테스트, 정리, 반복 작업 등)로 활용하는 것이 현재로선 더 효과적이다.