멀티 에이전트 법률 시스템에서 발생하는 문맥 표류(Context Drift)를 분산 시스템 관점에서 분석하고, 이를 제어하기 위한 동기화 프로토콜의 설계와 한계를 고찰합니다.
초록 멀티 에이전트 LLM 시스템은 복잡한 법률 분석 및 계약서 검토를 자율적으로 분담 수행하는 아키텍처로 주목받고 있으나, 협업 과정에서 에이전트 간 지식 상태의 불일치로 인한 '문맥 표류(Context Drift)' 현상이 새로운 환각의 원인으로 지목되고 있습니다. 본 칼럼에서는 분산 시스템 관점에서 문맥 표류의 발생 원인을 규명하고, 이를 정량화하는 문맥 분산 점수(Context Divergence Score, CDS)와 공유 상태 검증 프로토콜(Shared State Verification Protocol, SSVP)의 메커니즘을 분석합니다. 나아가 이 프로토콜이 가지는 통신 오버헤드와 일관성 보장 간의 트레이드오프를 검토하고, 법마디 OS(Lawmadi OS)의 다중 에이전트 계약 검토 파이프라인에 적용하기 위한 구체적인 시스템 아키텍처를 제안하여 법률 AI의 실무적 무결성을 확보하는 방안을 논증합니다.
복잡한 대형 로펌의 M&A 실사 과정이나 수천 페이지에 달하는 계약서 검토 작업을 상상해 보십시오. 단일 거대 언어 모델(LLM)에 이 방대한 문맥을 모두 밀어 넣는 것은 컨텍스트 윈도우의 물리적 한계와 주의집중 분산으로 인한 정보 누락을 초래하기에, 최근의 리걸테크 아키텍처는 이를 전문화된 서브 에이전트들로 분할하여 협업하는 멀티 에이전트 시스템으로 진화하고 있습니다. 그러나 이 에이전트들이 상호 작용하며 메시지를 주고받는 과정에서, 각 에이전트가 보유한 동적 메모리와 중간 추론 상태가 점진적으로 일그러지는 현상이 발생합니다. 마치 어린 시절 '말 전하기 놀이'를 할 때 마지막 사람의 메시지가 완전히 왜곡되는 것처럼, 에이전트 간의 미세한 지식 불일치가 누적되어 시스템 전체가 그럴듯하지만 완전히 왜곡된 법률적 결론을 도출하는 '문맥 표류(Context Drift)' 현상이 관찰되는 것입니다. 이는 개별 모델의 지식 부족이 아닌, 분산 협업 아키텍처 자체의 구조적 결함에서 기인하는 새로운 형태의 환각(Hallucination)이며, 법률과 같이 극도의 정밀성을 요구하는 도메인에서는 단 한 번의 표류로도 치명적인 법적 리스크를 초래할 수 있습니다.
멀티 에이전트 시스템에서 에이전트들이 협업 및 메시지 전달을 반복함에 따라 각 에이전트의 내부 컨텍스트와 지식 상태가 점진적으로 어긋나며 전체 시스템의 일관성이 깨지는 현상입니다.
협업 중인 에이전트들 간의 지식 상태 불일치를 공간적, 시간적, 작업 차원에서 정량화하여 실시간으로 측정하는 가벼운 스칼라 지표입니다.
에이전트들이 주기적으로 압축된 상태 요약을 교환하고, CDS가 임계값을 초과할 때 전체 동기화를 강제하여 분산 시스템의 일관성을 유지하는 합의 규약입니다.
멀티 에이전트 법률 시스템에서 각 에이전트는 독립적인 시스템 프롬프트, 도구 사용 이력, 그리고 대화 메모리(Local State)를 유지합니다. 예를 들어, 조세법 전문 에이전트와 공정거래법 전문 에이전트가 특정 기업 인수합병 계약을 공동 검토할 때, 각자 참조하는 법령 정보와 중간 추론 결과가 메시지 패싱(Message Passing)을 통해 교환됩니다. 이 과정에서 비동기적 메시지 전달 지연, 에이전트별 주의집중(Attention) 가중치의 차이, 그리고 토큰 제한으로 인한 요약(Summarization) 손실이 필연적으로 발생합니다. 이러한 미세한 정보 손실과 왜곡이 여러 라운드의 루프를 거치며 누적되면, 에이전트들은 동일한 계약서 조항에 대해 서로 다른 전제를 바탕으로 추론을 전개하게 됩니다. 결국, 시스템 전체의 공유 메모리가 파편화되면서 법률적 사실관계가 왜곡되는 환각 현상이 발생하며, 이는 개별 LLM의 미세조정이나 단순 RAG로는 해결할 수 없는 분산 메모리 불일치 문제입니다.
문맥 표류를 제어하기 위한 첫 단계는 에이전트 간의 상태 불일치를 실시간으로 정량화하는 것입니다. CDS는 에이전트 A와 B가 보유한 로컬 컨텍스트의 임베딩 벡터 간의 거리를 기반으로 계산됩니다. 구체적으로, 각 에이전트의 메모리 버퍼에서 추출한 핵심 법률 엔티티(Entity)와 추론 명제들의 세트를 의미론적 공간에 투영한 후, 코사인 유사도 및 자카드 유사도(Jaccard Similarity)를 결합하여 공간적 분산(Spatial Divergence)을 측정합니다. 여기에 메시지가 생성된 타임스탬프의 차이를 반영하는 시간적 가중치와, 현재 해결해야 하는 법적 하위 작업(Sub-task)의 연관성을 반영하는 작업 차원의 가중치를 곱하여 최종 CDS 스칼라 값을 도출합니다. 이 스칼라 지표는 계산 비용이 매우 저렴하여 매 에이전트 턴(Turn)마다 실시간으로 연산될 수 있으며, 시스템 관리자가 설정한 허용 임계값(Threshold)을 초과하는 즉시 경보를 발생시키는 트리거 역할을 수행하여 시스템의 붕괴를 사전에 차단합니다.
SSVP는 분산 데이터베이스의 합의 알고리즘에서 영감을 얻은 에이전트 간 일관성 유지 규약입니다. 모든 에이전트가 매번 모든 대화 이력을 상호 공유하는 무조건적인 전체 방송(Full-broadcast) 방식은 극심한 토큰 낭비와 지연 시간을 초래하므로, SSVP는 선택적이고 동적인 동기화를 수행합니다. 에이전트들은 자신의 로컬 상태를 가벼운 해시 형태나 핵심 명제 요약(State Summary)으로 압축하여 주기적으로 공유 채널에 게시합니다. 코디네이터 에이전트 혹은 분산 노드들은 이 요약을 바탕으로 상호 간의 CDS를 계산하고, CDS가 사전에 정의된 임계값을 초과하는 '고분산 상태(High-divergence state)'가 감지되면 즉시 협업 루프를 일시 정지(Pause)시킵니다. 이후, 불일치가 발생한 핵심 컨텍스트 요소를 식별하여 해당 에이전트들에게만 정밀하게 동기화된 컨텍스트 패치(Context Patch)를 주입한 후 추론을 재개하도록 강제함으로써, 문맥의 일관성을 물리적으로 확보합니다.
SSVP가 멀티 에이전트의 환각을 유의미하게 억제함에도 불구하고, 실무 적용 시 몇 가지 기술적 한계와 취약점이 존재합니다. 첫째, 상태 요약(State Summary)을 생성하는 과정 자체에서 정보의 압축 손실이 발생할 수 있으며, 만약 요약 에이전트가 법률적으로 미묘하지만 중요한 단서(예: '단, ~의 경우는 예외로 한다'와 같은 단서 조항)를 누락할 경우, CDS가 낮게 측정되어 상태 불일치를 감지하지 못하는 '미검출 오류(False Negative)'가 발생할 수 있습니다. 둘째, 에이전트 수가 증가할수록 상태 요약 교환 및 CDS 계산에 필요한 연산량이 기하급수적으로 증가하는 확장성(Scalability) 문제가 발생합니다. 셋째, 특정 에이전트가 악의적이거나 오염된 외부 소스를 RAG를 통해 주입받았을 때, SSVP가 이 오염된 상태를 '합의된 정상 상태'로 오인하여 시스템 전체로 오염을 확산시키는 '다수결 편향(Majority Bias)'의 위험도 배제할 수 없어 이에 대한 보완책이 필요합니다.
긴장 관계 완벽한 일관성 보장을 위해 매 턴마다 전체 에이전트의 컨텍스트를 동기화하면 API 호출 비용과 지연 시간(Latency)이 기하급수적으로 증가하는 반면, 비용 절감을 위해 동기화 주기를 늦추면 문맥 표류로 인한 법률적 판단 오류(환각)의 위험이 극대화되는 긴장 관계가 존재합니다.
실무적 해소 이를 해결하기 위해 법률 쟁점의 중요도와 에이전트의 역할에 따라 동적 임계값(Dynamic Threshold)을 적용합니다. 예컨대, 단순 판례 요약 에이전트는 CDS 임계값을 느슨하게 설정하여 통신 오버헤드를 줄이고, 최종 계약서 조항의 적법성을 판정하는 핵심 의사결정 에이전트는 극도로 엄격한 임계값과 즉각적인 SSVP 동기화를 강제하는 계층적 하이브리드 동기화 정책을 채택합니다.
법마디 OS(Lawmadi OS)의 차세대 '멀티 에이전트 계약서 정밀 검토 엔진'에 SSVP 아키처를 이식하여 시스템 무결성을 극적으로 끌어올릴 수 있습니다. 구체적으로, 계약서의 독소 조항을 탐지하는 '탐지 에이전트', 관련 판례를 검색하는 'RAG 에이전트', 그리고 개정 법률과의 정합성을 대조하는 '준법 에이전트' 간의 협업 파이프라인을 구축합니다. 이들 상위에 '컨텍스트 오케스트레이터(Context Orchestrator)' 레이어를 신설하여, 각 에이전트의 중간 추론 상태를 벡터화한 후 CDS를 실시간 모니터링합니다. 만약 준법 에이전트가 참조한 최신 개정법 정보가 탐지 에이전트의 계약서 분석 컨텍스트와 어긋나 CDS가 임계값을 초과하면, 오케스트레이터는 즉시 동기화 프로토콜을 발동하여 개정법 조항의 핵심 요약을 탐지 에이전트의 프롬프트 컨텍스트에 패치 형태로 강제 주입합니다. 이를 통해 무조건적인 전체 컨텍스트 공유 대비 API 비용을 약 50% 이상 절감하면서도, 에이전트 간의 지식 불일치로 발생하던 계약서 검토 환각율을 획기적으로 억제하는 실무적 무결성을 달성할 수 있습니다.
"법률 AI의 진정한 무결성은 가장 똑똑한 단일 에이전트의 지능이 아니라, 분산된 지식의 격차를 실시간으로 조율하고 동기화하는 시스템적 정교함에서 완성됩니다."