2026년 1월 31일 4 min read 인공지능 제품개발과 조직운영

에이전트를 오래 + 잘 돌리기 위한 컨텍스트 관리 미세팁 4개 (+ 참고자료 12개)

에이전트 및 워크플로우 개발에 작은 도움이 되길 바랍니다.

최근 정보 수집 - 스펙 작성 - 스펙 리뷰 - 구현 - 코드 리뷰 - 회고 - PR 작성을 한큐에 진행하는 저만의 하네스를 만들어, 열심히 테스트하며 개선하고 있습니다. 아직까지는 만족스러운데 조만간 한계에 부딪히면 다른 유명한 하네스를 참고하려고 해요.

랄프 플러그인처럼 무한루프를 도는 건 아니지만 전체 다 돌면 보통 몇십분 이상 걸리는데 당연히 컨텍스트 문제가 있습니다. 그래서 이참에 롱-러닝 에이전트의 컨텍스트 관리에 도움이 되는 미세팁을 4개 뽑아봤어요.

참고로 저도 잘 알아서 쓰는 게 아니라 공부하려고 이런 글 쓰는 거니 자나깨나 환각 조심하시길!

1. 최초 로드되는 컨텍스트 최소화

최상위 AGENTS.md는 무조건 로드되니 less is more, progressive disclosure 원칙에 따라 꾸준히 압축하고 리팩토링합니다. MCP 도구 정의도 매번 컨텍스트에 올라가므로 정말 필요할 때만 켭니다.

2. 모델이 할 필요 없는 일은 스크립트로

API 호출, 포맷 변환, 린터 등 결정론적인 알고리즘으로 더 빠르고 정확한 결과를 낼 수 있는 일들이 많습니다. MCP도 의외로 쉽게 대체할 수 있고요. 스킬에 이런 스크립트를 패키징해두고, 모델은 실행만 하면 되게끔 합니다.

3. 서브에이전트로 핸드오프 + 파일로 맥락 전달

병렬로/독립적으로 돌릴 수 있는(돌리면 좋은) 작업들은 적극적으로 위임하여 메인 오케스트레이터의 컨텍스트를 아낍니다. 어쩔 수 없는 compact 이후나 핸드오프 시 맥락이 잘 전달되도록, '이 파일 하나만 읽으면 다음에는 뭘 왜 해야 하는지, 뭘 주의해야 하는지 알 수 있음' 같은 계획/작업 상태/교훈이 담긴 파일을 잘 관리합니다.

4. 회고하며 개선 반복

작업 과정에서의 교훈을 읽고, 비효율적이거나 의도대로 동작하지 않았던 순간들을 에이전트와 함께 회고합니다. 내 프롬프팅 습관, 하네스 구조, 코드베이스 구조, AGENTS.md 등에서 개선점을 찾아 반영하고 다시 실험합니다.

더 알아보고 싶은 분들을 위한 참고자료들

위 팁들을 더 깊이 파고 싶거나, 직접 하네스를 만들 때 참고할 만한 링크를 Anthropic과 Vercel의 공식 엔지니어링 블로그 위주로 골라봤습니다.

컨텍스트 엔지니어링 전반

Effective context engineering for AI agents (Anthropic) — "가장 작은 고신호 토큰 집합 찾기"라는 원칙의 이론적 프레임워크. 5가지 팁 전체의 배경이 되는 글.

팁 1 (컨텍스트 최소화 + `AGENTS.md` 잘 쓰기)

AI 시대 소프트웨어 프로젝트 문서화 — 코르카 테크 어드바이저 강규영님이 쓰신 훌륭한 가이드.
Writing a good CLAUDE.md — HumanLayer의 CLAUDE.md/AGENTS.md 작성 가이드.

팁 2 (스크립트 활용)

Equipping agents for the real world with Agent Skills (Anthropic) — Progressive disclosure 설계 원칙. 스크립트 실행 시 코드가 컨텍스트에 안 올라가고 출력만 토큰 소비.
We removed 80% of our agent's tools (Vercel) — 대부분의 도구를 bash+SQL 2개로 줄이니 성공률 80%→100%. "모델이 추론할 수 있는 걸 우리가 제약하고 있었다"는 교훈.
Testing if "bash is all you need" (Vercel) — 위 글의 후속 검증. 구조화된 데이터엔 SQL이 낫고, 탐색/검증엔 bash가 낫다는 nuance. 하이브리드가 최적.

팁 3 (핸드오프 + 파일 기반 메모리)

How we built our multi-agent research system (Anthropic) — 서브에이전트는 격리된 컨텍스트 윈도우를 쓰고, 오케스트레이터에게 관련 정보만 반환. 단일 에이전트 대비 90% 성능 향상.
Effective harnesses for long-running agents (Anthropic) — claude-progress.txt 패턴의 원전. Initializer agent + Coding agent 분리. "효과적인 소프트웨어 엔지니어가 매일 하는 일에서 영감을 얻었다."
ralph-orchestrator — 랄프 플러그인의 자율 에이전트 버전.

팁 4 (회고하며 개선)

Demystifying evals for AI agents (Anthropic) — Task, trial, transcript, outcome, grader 용어 정리. 회고를 체계적으로 하려면 eval부터.
session-wrap — 팀 어텐션 정구봉님의 세션 회고 스킬.
compounding-engineering plugin — Every 팀의 매번 이자를 쌓아나가는 회고가 포함된 워크플로우.

1. 최초 로드되는 컨텍스트 최소화

2. 모델이 할 필요 없는 일은 스크립트로

3. 서브에이전트로 핸드오프 + 파일로 맥락 전달

4. 회고하며 개선 반복

더 알아보고 싶은 분들을 위한 참고자료들

컨텍스트 엔지니어링 전반

팁 1 (컨텍스트 최소화 + AGENTS.md 잘 쓰기)

팁 2 (스크립트 활용)

팁 3 (핸드오프 + 파일 기반 메모리)

팁 4 (회고하며 개선)

You might also like...

[일주일프/05] vibe-pizza: 8살 딸을 위한 나만의 피자 가게 게임

순정으로 시작해 내게 딱 맞는 워크플로우를 자라나게 하는 방법

우리는 왜 코드를 이해하려고 하는가? (feat. 코드 읽기를 그만뒀더니 코드 리뷰가 더 좋아졌다)

Codex에서도 서브에이전트를 사용해봅시다

OpenAI Multi-Agent Workflows 해커톤 참여 후기 (feat. OpenAI 엔지니어가 Codex를 사용하는 방법)

팁 1 (컨텍스트 최소화 + `AGENTS.md` 잘 쓰기)