개발 도구/AI 코딩 도구

Quail 2·Cursor·Claude Code 셋을 한 주 같이 굴려본 맥북 워크플로

stackD 2026. 6. 11. 18:00

 

세 개를 동시에 쓰면 세 배 빨라질 줄 알았는데, 막상 머지 시간만 36% 줄고 버그 회귀율은 오히려 11%에서 16.7%로 늘었습니다.

 

지난 한 주(5/18~5/24)에 M3 Pro 36GB 맥북 한 대에서 안드로이드 스튜디오(Android Studio) Quail 2 Canary, 커서(Cursor) 2.5, 클로드 코드(Claude Code) CLI를 동시에 굴려본 한 주 정리예요. 한 마디로 말하면 도구가 늘었다고 코드가 더 좋아지는 건 아니더라고요.

 

M3 Pro 36GB 맥북에서 세 AI 코딩 도구 동시 실행

idle 상태에서만 메모리 사용량이 22GB 근처에 머물렀습니다. Quail 2의 JVM, 커서의 Electron 두 프로세스, 클로드 코드 CLI까지 띄우면 16GB 모델은 스왑이 시작됐을 분량이에요. 36GB가 어느 정도냐면, 메인 모니터에 Compose 빌드 띄워두고 보조 모니터에 커서로 라우터 코드 짜고 백그라운드로 클로드 코드 서브에이전트 3개를 돌려도 팬이 막 돌지 않는 수준입니다.

 

지난 월~수(5/18~20) 사흘간 총 19시간 작업 중 IDE Agent Mode가 8시간, 클로드 코드가 7시간, 커서가 4시간을 점유했어요. 근데 진짜 충격적이었던 건 "어느 도구로 이 작업을 시킬까" 고민하는 데에만 따로 잰 시간이 40분이었다는 점입니다. 결정 피로가 진짜라는 걸 처음으로 체감했습니다.

 

Quail 2·Cursor·Claude Code 역할 분담을 도메인별로 끊은 방식

처음엔 셋이 다 똑같이 코드를 짜니까 같은 작업을 두 도구에 동시에 시켜서 결과를 비교해봤어요. 그러다 토큰만 일주일에 14달러 정도 더 태우고 품질 차이는 거의 없다는 결론이 나서, 도메인별로 끊었습니다.

 

1. Quail 2 Agent Mode: 설정·Firebase·Gradle 담당

AGP 업그레이드, Crashlytics SDK 도입처럼 Gradle sync가 필수인 작업에 압도적이었어요. 빌드 에러가 나면 평균 2.3회 루프 안에 자가 수정으로 돌아옵니다.

 

2. 클로드 코드: 리팩터링·테스트·Ktor 백엔드 담당

refactor-kotlin, test-writer, pr-reviewer 서브에이전트 3개를 YAML로 정의해두고 CLI로 위임했습니다. UseCase 12개를 일괄 변환할 때 토큰이 38% 절약됐고, 테스트 커버리지도 71%에서 84%까지 올랐어요.

 

3. 커서 컴포저(Cursor Composer): 빠른 화면 구현과 Ktor 라우터

30분 내외의 짧은 작업에 강하더라고요. 인라인 diff와 자동완성 손맛이 진짜 강점이라 "프론트 페어 코더" 자리로 굳혔습니다.

 

 

개인적으로는 커서를 "옆자리 페어 코더", 클로드 코드를 "야간에 돌아가는 백오피스 매크로"로 부르고 있어요. 한쪽은 같이 타이핑하는 친구, 한쪽은 일감 던져두고 자고 일어나면 결과가 와 있는 도구라는 느낌이라 머릿속에서 안 헷갈립니다.

 

Cursor·Android Studio 단축키 충돌과 Git 충돌 사고

첫 사고는 단축키였습니다. 커서의 ⌘I와 안드로이드 스튜디오의 ⌘I가 같은 키였어요. 두 IDE를 빠르게 오가다가 엉뚱한 창에서 인라인 편집 패널이 열리는 일이 하루 열 번씩 났습니다. Quail 2 쪽 단축키를 ⌘⇧I로 옮기고 근육 기억을 다시 잡는 데만 이틀 걸렸네요.

 

더 아팠던 건 Git 충돌이었어요. 클로드 코드와 커서가 같은 시간에 build.gradle.kts를 동시에 수정해버렸거든요. rebase 충돌 풀고 포맷팅 차이 복구하는 데 45분이 그대로 날아갔습니다. 이때 이후로 "한 번에 한 도구만 write" 원칙을 세우고, 빌드 스크립트 계열 파일은 무조건 Quail 2 Agent Mode 전용으로 못박았어요.

 

 

비용 쪽에서 한 가지 건진 게 있는데요, 커서와 클로드 코드가 같은 Postgres MCP 서버를 공유하도록 설정해두니까 토큰 비용이 약 18% 떨어졌습니다. 두 도구에 같은 스키마를 각자 설명해주던 토큰이 통째로 빠진 결과로 보입니다.

 

PR 6개로 본 머지 시간 36% 단축과 회귀율 16.7%

한 주 마무리 시점에 머지된 PR 6개를 돌아봤습니다.

 

머지까지 평균 6.2시간. 4월에 비슷한 규모로 작업했을 때는 9.8시간이 걸렸으니 36% 단축이에요. 다만 앞서 말한 "도구 선택 결정 시간" 1시간 50분을 빼고 보면 실질 단축은 26% 정도로 줄어듭니다. 숫자만 봐서는 분명히 빨라졌어요.

 

 

문제는 버그 회귀율이었습니다. 4월 11%에서 이번 주 16.7%로 올랐는데(머지된 PR 중 1주일 내 회귀 핫픽스가 들어간 비율, 4월은 27개 중 3개·이번 주는 6개 중 1개 기준), 추적해보니 거의 다 커서 자동완성이 Compose의 Modifier 순서를 잘못 끼워 넣은 경우였어요. padding 다음에 clickable이 들어가야 할 자리에 반대로 들어가서 터치 영역이 줄어드는 식이었습니다. 빠르게 짜주는 도구일수록 리뷰 검수를 더 빡세게 걸어야 한다는 걸 다시 배운 한 주였습니다.

 

Android CLI 1.0으로 가는 다음 주 실험 계획

이번 주에 정리한 3축 조합은 그대로 가져갑니다. Quail 2는 빌드·설정, 클로드 코드는 리팩터링·테스트·문서화, 커서는 인라인 편집과 빠른 신규 파일 생성. 그리고 분명히 버려야 할 습관 하나가 잡혔는데, 같은 작업을 두 도구에 동시에 시켜서 결과를 비교하는 짓이에요. 한 주에 14달러 토큰을 더 태우는 동안 사람이 인지할 만한 품질 차이는 없었습니다.

 

 

다음 주에는 클로드 코드 서브에이전트에 Quail 2 Canary 와 연동되는 Android CLI 1.0(Google I/O 2026 stable, 5/19 출시)을 물려서, IDE를 아예 띄우지 않고 CLI 만으로 안드로이드 빌드 루프가 도는지 시험해볼 생각이에요. 그게 되면 새벽 회귀 테스트를 백그라운드로만 돌려두는 그림이 나오니까요. 거기까지 닿으면 36% 단축 숫자가 어디까지 더 깎이는지, 회귀율은 다시 한 자릿수로 내려오는지 다음 주 글에서 숫자 그대로 풀어볼 생각입니다.