본문 바로가기

이 포트폴리오의 원본은 https://resume.iruyo.com (심재빈) 입니다 · 출처 식별자 jbx-7f3a2e9b

← 개인 프로젝트

Multi-Agent Harness 활성 개발 단독

Glimi — Multi-agent Harness OSS (proactive supervisor 설계)

사람이 자리를 비워도 AI 에이전트들이 자기들끼리 대화·관계를 이어가는 멀티 에이전트 오픈소스 Glimi를 설계·구현

기간
2025.01 – 진행 중 · 1년 6개월
본인 역할
AI 에이전트들을 운영하는 오픈소스 프레임워크 Glimi(Apache-2.0)를 단독 설계·개발. LLM의 '물으면 답한다'는 수동 구조를 넘어, 입력이 없어도 에이전트가 먼저 말 걸고 움직이는 능동(proactive) 계층을 설계.
정량 임팩트
1인 개발 · 2026 하반기 오픈소스 공개 준비 중 / LLM 호출 하나를 8개 계층(프롬프트·도구·기억·채널·가드·에이전트 간 대화·자가복구·능동 관리자)으로 감싸 에이전트 군집 운영 / 클라우드(Claude)·로컬 모델(Ollama·vLLM·llama.cpp)을 재시작 없이 교체 / 5단 영속 기억으로 관계·사실 장기 보존 / 에이전트 상태 실시간 대시보드 / 설계 문서 13종 · pip 첫 배포 준비 중
버전·릴리즈
pip 패키지 첫 배포 준비 중 (핵심 모듈 분리 작업). 대표 데모 앱 'Glimi Hangout' 포함 모노레포.

사람이 자리를 비워도 AI 에이전트들이 자기들끼리 대화하고 관계를 이어가는 멀티 에이전트 오픈소스 Glimi(Apache-2.0)를 만들고 있습니다.

배경·과제

  • LLM은 본래 요청이 있어야 응답하는 수동 구조라, 에이전트 여럿을 한 공간에 둬도 사람이 입력을 멈추면 같이 멈춥니다. 스스로 굴러가는 에이전트 집단이 성립하지 않는다는 것이 출발점이었습니다.

  • 특정 모델 벤더에 종속되지 않으면서, 에이전트가 지금 무엇을 하는지 실시간으로 들여다볼 수 있는 구조도 필요했습니다.

수행·기여

  • LLM 호출 하나를 8개 계층으로 감싸는 구조를 설계하고 구현했습니다. 프롬프트 조립, 도구 사용, 기억, 대화 채널 규율, 환각·반복 방지, 에이전트 간 자율 대화, 자가 복구, 그리고 8번째 능동 관리자(proactive supervisor) 계층입니다.

  • 핵심은 능동 관리자 계층입니다. 자체 타이머로 돌면서 멈춰 있는 에이전트에 내적 자극을 주입해, 사람 입력이 없어도 에이전트가 먼저 대화를 시작하게 했습니다.

  • 기억은 5단 영속 구조로 설계했습니다. 대화를 요약·사실·관계로 정제해 장기 보존하고, 매 응답마다 필요한 기억만 골라 넣습니다.

  • 클라우드(Claude)와 로컬 모델(Ollama·vLLM·llama.cpp)을 한 묶음에서 재시작 없이 바꿔 쓸 수 있고, 에이전트마다 다른 모델을 지정할 수 있습니다.

  • 에이전트 관계 그래프, 기억 내부, 주고받는 대화, 도구 호출 내역을 화면에서 바로 확인하는 실시간 대시보드를 붙였습니다.

  • 대표 앱 ‘Glimi Hangout’은 주인이 없는 동안 AI 친구들이 자기들끼리 대화하고 관계를 쌓다가, 주인이 돌아오면 그간의 일을 브리핑하는 커뮤니티입니다.

성과

  • Apache-2.0 라이선스로 개발 중이며, 코드는 아직 비공개입니다. 핵심 모듈을 다듬어 오픈소스 공개를 준비하고 있고, 설계 문서 13종을 정리해 두었습니다.

  • 핵심 모듈을 분리해 pip 패키지 첫 배포를 준비하고 있습니다.