통제에서 공생으로: 하니스(Harness), 도구(Tool), 그리고 에이전트
하니스는 도구와 어떻게 다른가?
AI와 관련된 글에서 자주 등장하는 생소한 용어로 하니스(Harness)라는 게 있습니다. 하니스의 사전적 의미는 (마차를 끄는) 말에 다는 마구(馬具)입니다. 굴레와 고삐 등으로 구성되며, 원하는 방향으로 말이 움직이도록 통제하는 데 쓰입니다.
저는 하니스라는 말을 들으면 머릿속에서 '도구를 더 잘 쓰기 위한 메타 도구' 정도로 치환하곤 했는데, 사실 Tool이라는 용어 또한 AI 영역에서 자주 사용되다 보니 좀 헷갈리더군요. 이는 제 머릿속 '도구'의 이미지가 상당히 넓기 때문이기도 했습니다.
- 사용자(인간 에이전트, AI 에이전트 등)의 목적에 부합하도록 사용될 수 있다면 모두 도구다. 에이전트 자신도 도구가 될 수 있다.
- 도구의 조합(프레임워크), 도구를 더 잘 사용하기 위한 도구(메타 도구), 프레임워크의 조합과 메타 도구의 조합도 모두 도구다.
헷갈린 김에 LLM과 대화를 나눠봤어요. 요즘 종종 시도해보는 프롬프팅 방식인데, 먼저 최소 2개 모델에게 2가지 버전(나의 의견을 담은 것과 담지 않은 것)을 쥐어주고 비교해보는 것입니다. Claude Opus 4.5, Gemini 3.0 Pro에게 물어봤습니다.
버전 1: AI 영역에서 harness 라는 단어가 자주 등장하는데, 이게 tool과 어떻게 다른 것이지?
버전 2: AI 영역에서 harness 라는 단어가 자주 등장하는데, 이게 tool과 어떻게 다른 것이지? tool을 더 잘 쓰기 위한 tool 처럼 생각해도 무방한가? 환경을 사용자에게 더 유리하게 만들어주는 도구 같기도 하고.
이렇게 돌려받은 응답 4개를 읽고, 그룹 대화방에서 이 주제를 꺼내보기도 하면서 생각한 바를 다시 정리하며 질의했습니다.
비유 1
- 말 = AI 모델
- 편자 = 모델이 필요에 따라 사용하는 tool (더 적절한 상징물이 있을까?)
- 마부 = 개발자 또는 사용자
- 마차 = AI Application
- 도로 (또는 세상) = 환경. 꼭 이 말/마차 조합을 위해 인위적으로 설계된 건 아님.
- 마구 = Harness. AI 모델을 개발자 또는 사용자가 더 잘 통제하기 위해 사용하는 도구, 도구의 조합, 도구의 배치 등. 인위적으로 설계한 것
비유 2 -> 이렇게 확장할 수 있을라나?
- 말 = 에이전트 (인간 에이전트, AI 에이전트 포함)
- 편자 = 에이전트가 사용하는 tool
- 마부 = 에이전트의 사용자 (인간 에이전트, AI 에이전트 포함)
- 마차 = AI Application
- 도로 (또는 세상) = 에이전트가 놓인 상황/환경. 꼭 그 에이전트만을 위해 설계된 건 아님.
- 마구 = 에이전트가 다른 에이전트를 더 잘 통제하기 위해 사용하는 도구들. 인위적으로 설계한 것.
위 비유에 대해 어떻게 생각해? Harness와 Tool의 차이에 대해 생각하다가 여기까지 왔네. 더 적절하게 설명하기 위해 고민 중이야. 한편, 이 비유는 'AI 모델은 인간이 통제 가능한/통제해야하는 존재다' 라는 전제되어있다는 면에서는 좀 마음에 들지 않아. 에이전트는 능동적으로 tool을 사용하는데, 이게 '편자'와는 어울리지 않는 것도 그렇고. (말이 편자를 능동적으로 선택해서 쓰는 게 아니니까)
미래의 AI 에이전트에 대한 상상
대화를 나누다 보니 능동적으로 툴을 호출하는 에이전트는 '말과 마차'로 비유하기 어렵다는 걸 깨닫게 됐어요. 그래서 이런 그림을 만들며 미래의 AI 에이전트에 대한 상상을 해봤습니다.

과거의 AI 모델(GPT-3.5 등)은 인간이 통제하기 어려운 말과 같아서 수많은 하니스(시스템 프롬프트와 가드레일, 응답 평가 프레임워크 등)로 옭아매야 했습니다. 말이 딴길로 새지 않으면서(환각 방지), 마부의 의도대로 움직이게(명령 준수) 해야 원하는 목적지에 도달할 수 있었죠. 이 당시의 툴(코드 인터프리터, 웹 서치 등)은 말에 편자를 달듯, AI 모델을 아래에서 받쳐줌으로써 특정 환경과 더 잘 상호작용할 수 있도록, 그래서 결과적으로 목적을 잘 달성할 수 있도록 도왔습니다.
미래의 AI 에이전트는 느낌이 상당히 다릅니다. 에이전트가 본인에게 주어진 툴을 수동적으로 사용하는 게 아니라 능동적으로 선택하고, 때론 즉석에서 필요한 툴을 만들어 조합하며, 다른 에이전트를(때로는 인간도) 툴로 사용하기도 합니다. 이를 통해 통제된 환경뿐 아니라 훨씬 다양한 환경과 자유롭게 상호작용합니다. AI-개발자-사용자(말-마부-마차 승객)가 분리되어 존재하는 게 아니라 반쯤 융합되어 공생하며, 개발자와 사용자의 경계가 희미해집니다. 마찬가지로 하니스도 인터페이스나 대시보드 수준으로 얇아집니다.
사실 이렇게 AI와 공생 가능하다는 것조차 순진한 상상일 수도 있습니다. 주인과 노예의 딜레마, 즉 '주인이 노예에 지나치게 의존하면 사실상 주인이 곧 노예고 노예가 곧 주인이다'라는 말은 인간과 AI의 관계에도 아주 잘 적용됩니다. 이미 위 그림에서도 맨눈이 아니라 에이전트가 보여주는 화면을 본다는 것이 꽤 의미심장하죠. 생성형 UI로 즉석에서 개인화된 텍스트와 이미지를 보며, AI가 이끄는 대로 생각과 행동이 유도되는 세상. 하물며 초지능이 등장한다면?
상상이 증폭될수록 두렵지만, 이런 세상이 하룻밤 사이에 오진 않을 겁니다. 1년 전 오늘과 비교하면 너무 많은 게 바뀌었지만, 어쨌든 하루하루 일상은 연속적으로 일어나는 스펙트럼이죠. 그러니 어떻게든 적응하며 살아가리라는 자신감도 있습니다. 그러기 위해서는 꾸준히 최고의 도구인 뇌를 단련해야만 하겠죠. AI의 큰 도움 없이 긴 글을 자꾸 쓰려는 것도 그 일환이라고 볼 수 있겠습니다.
Member discussion