이 글은 입법평가 영역에 인공지능을 활용할 수 있는지를 모색한다. ChatGPT 열풍이 시사하는 것처럼 현재 인공지능이 보여 주는 기술적 수준이나 역량은 놀라울 정도이다. 언어적 소통 영역에 한정해 말하면 이제 인공지능은 인간처럼 소통하는 것에 머물지 않고 의료나 행정, 사법, 면접 등과 같이 전문적인 역량이 필요한 영역에서도 상당한 성취를 보여 준다. 이에 인공지능이 인간이 수행하던 전문 영역을 대체할 것이라는 두려움이 현실적 위험으로 엄습한다. 이러한 상황에서 이 글은 의료나 행정, 사법, 면접처럼 고도의 전문적 역량이 요청되는 입법평가에도 인공지능을 활용할 수 있는지, 만약 가능하다면 그 범위는 어떻게 획정할 수 있는지, 이에 따른 한계는 무엇인지 살펴본다. 이를 위해 먼저 입법평가가 어떤 의미를 지니는지(II), 이러한 입법평가를 수행하는 데 필요한 역량은 무엇인지 규명한다(III). 다음으로 인공지능이 현재 도달한 기술 수준을 검토함으로써 입법평가를 수행하는 데 필요한 역량을 인공지능이 갖추고 있는지 살펴본다(IV). 이어서 실제로 인공지능이 입법평가에 활용될 수 있는지를 검증한다는 차원에서 의료, 사법, 행정, 면접 영역에서 인공지능이 어떻게 활용될 수 있는지 또는 활용되는지를 살펴본다(V). 이를 토대로 하여 입법평가 가운데 어떤 영역에서 인공지능을 활용할 수 있는지, 이때 필요한 추가적인 근거와 요건은 무엇인지 검토한다(VI). 이 글은 다음과 같은 결론에 도달한다. 지금의 기술적 수준을 고려할 때 입법평가에 인공지능을 활용할 가능성은 분명 존재한다. 그러나 이는 양적 평가와 같은 영역에만 제한적으로 활용되어야 한다. 더불어 인공지능이 내놓은 입법평가 결과를 인간 전문가가 검증할 수 있도록 거버넌스를 구축하고 법적 근거도 확보해야 한다. 인공지능은 재량 영역처럼 고도로 복잡한 사고 능력을 발휘해야 하는 영역에서 여전히 불완전함을 보여 주기 때문이다. ChatGPT가 범하는 환각(hallucination) 이슈가 예증하듯이 인공지능은 인간이 수행하던 전문적 영역을 완전하게 대체하기에는 부족하다. 이는 입법평가에도 마찬가지라고 말할 수 있다.