오픈AI의 딥리서치 등 과거보다 다양한 기능을 수행하는 인공지능 뒤에는 ‘에이전트’가 있다. LLM 혼자 풀기 어려운 문제를 외부 도구와 연동해 해결하는 ‘자율 실행 AI 시스템’이다.
거대 언어모델(Large-scale Language Model·LLM)이 빠르게 발전하면서 단순히 문장을 생성하거나 질문에 답하는 데 그치지 않고 더 복잡한 작업을 맡길 수 있는 ‘에이전트(agent)’가 주목받고 있다. 여기에서 에이전트란 LLM 혼자서는 풀기 어려운 문제들을 외부 도구(검색, 데이터베이스, API 등)와 연동해 스스로 해결하는, 일종의 “자율 실행 AI 시스템”을 의미한다. 이번 글에서는 에이전트의 구성 요소를 중심으로 어떻게 동작하는지 살펴보겠다.
최근 널리 사용되고 있는 에이전트 시스템은 크게 모델(LLM), 도구(tool), 메모리(memory), 그리고 이들을 총괄하는 오케스트레이션 레이어(orchestration layer)로 구성된다(〈그림 1〉 참조). ‘모델(LLM)‘은 텍스트 이해와 생성을 담당한다. ‘도구‘는 검색 API, 데이터베이스 질의, 날씨 조회, 결제 시스템 호출 등 모델이 스스로 얻기 힘든 정보를 확보하는 역할을 맡는다. ’메모리’는 현재 대화 맥락(단기)과 과거 대화 이력, 사용자 선호·취향(장기) 등을 저장해두는 영역이다. ’오케스트레이션 레이어’는 마치 오케스트라의 지휘자처럼 “언제, 어떤 도구·메모리를 사용하고, 그 결과를 어떻게 LLM에 반영해 답변을 완성할지”를 결정하고 지휘한다.
문제가 될 시 삭제하겠습니다