Multi-Agent Harness 활성 개발 단독

Glimi — Multi-agent Harness OSS (proactive supervisor 설계)

사람이 자리를 비워도 AI 에이전트들이 자기들끼리 대화·관계를 이어가는 멀티 에이전트 오픈소스 Glimi를 설계·구현

기간: 2025.01 – 진행 중 · 1년 6개월
본인 역할: AI 에이전트들을 운영하는 오픈소스 프레임워크 Glimi(Apache-2.0)를 단독 설계·개발. LLM의 '물으면 답한다'는 수동 구조를 넘어, 입력이 없어도 에이전트가 먼저 말 걸고 움직이는 능동(proactive) 계층을 설계.
정량 임팩트: 1인 개발 · 2026 하반기 오픈소스 공개 준비 중 / LLM 호출 하나를 8개 계층(프롬프트·도구·기억·채널·가드·에이전트 간 대화·자가복구·능동 관리자)으로 감싸 에이전트 군집 운영 / 클라우드(Claude)·로컬 모델(Ollama·vLLM·llama.cpp)을 재시작 없이 교체 / 5단 영속 기억으로 관계·사실 장기 보존 / 에이전트 상태 실시간 대시보드 / 설계 문서 13종 · pip 첫 배포 준비 중
버전·릴리즈: pip 패키지 첫 배포 준비 중 (핵심 모듈 분리 작업). 대표 데모 앱 'Glimi Hangout' 포함 모노레포.

사람이 자리를 비워도 AI 에이전트들이 자기들끼리 대화하고 관계를 이어가는 멀티 에이전트 오픈소스 Glimi(Apache-2.0)를 만들고 있습니다.

배경·과제

LLM은 본래 요청이 있어야 응답하는 수동 구조라, 에이전트 여럿을 한 공간에 둬도 사람이 입력을 멈추면 같이 멈춥니다. 스스로 굴러가는 에이전트 집단이 성립하지 않는다는 것이 출발점이었습니다.
특정 모델 벤더에 종속되지 않으면서, 에이전트가 지금 무엇을 하는지 실시간으로 들여다볼 수 있는 구조도 필요했습니다.

수행·기여

LLM 호출 하나를 8개 계층으로 감싸는 구조를 설계하고 구현했습니다. 프롬프트 조립, 도구 사용, 기억, 대화 채널 규율, 환각·반복 방지, 에이전트 간 자율 대화, 자가 복구, 그리고 8번째 능동 관리자(proactive supervisor) 계층입니다.
핵심은 능동 관리자 계층입니다. 자체 타이머로 돌면서 멈춰 있는 에이전트에 내적 자극을 주입해, 사람 입력이 없어도 에이전트가 먼저 대화를 시작하게 했습니다.
기억은 5단 영속 구조로 설계했습니다. 대화를 요약·사실·관계로 정제해 장기 보존하고, 매 응답마다 필요한 기억만 골라 넣습니다.
클라우드(Claude)와 로컬 모델(Ollama·vLLM·llama.cpp)을 한 묶음에서 재시작 없이 바꿔 쓸 수 있고, 에이전트마다 다른 모델을 지정할 수 있습니다.
에이전트 관계 그래프, 기억 내부, 주고받는 대화, 도구 호출 내역을 화면에서 바로 확인하는 실시간 대시보드를 붙였습니다.
대표 앱 ‘Glimi Hangout’은 주인이 없는 동안 AI 친구들이 자기들끼리 대화하고 관계를 쌓다가, 주인이 돌아오면 그간의 일을 브리핑하는 커뮤니티입니다.

성과

Apache-2.0 라이선스로 개발 중이며, 코드는 아직 비공개입니다. 핵심 모듈을 다듬어 오픈소스 공개를 준비하고 있고, 설계 문서 13종을 정리해 두었습니다.
핵심 모듈을 분리해 pip 패키지 첫 배포를 준비하고 있습니다.