1. AI Agent 평가의 핵심 레이어 및 메트릭AI Agent의 평가는 크게 생성 단계(Generation Layer)와 행동 단계(Action Layer)의 두 가지 관점으로 접근합니다.① 생성 단계 (Generation Layer) - RAG 기반 할루시네이션 검증Agent가 외부 데이터(DB, 문서, API)를 참조해 답변할 때, 할루시네이션을 잡아내기 위해 LLM-as-a-Judge(더 똑똑한 LLM을 판사로 쓰는 방식) 기법을 활용한 3대 메트릭을 주로 사용합니다.충실성 (Faithfulness / Groundedness)개념: Agent가 내놓은 답변이 참조한 컨텍스트(문서나 API 결과)에 실제로 기반하고 있는가?측정법: 답변의 문장들을 개별적 사실(Statements) 단위로 쪼갠 뒤,..