구문 보존 기반 코드 워터마킹을 통한 LLM 생성 코드 탐지 연구

Syntax-preserving code watermarking for detecting LLM-generated code

연구 내용

LLM이 생성한 코드의 기능을 유지하면서도 판별 가능성을 높이기 위해 구문 비의존 토큰에 워터마킹을 임베딩하는 탐지용 기법을 개발하는 연구

LLM 생성 코드 탐지는 워터마킹이 실제 실행 의미를 훼손하지 않으면서 검출이 가능해야 합니다. 기존 접근은 높은 엔트로피 토큰에 임베딩하는 가정에 의존하지만, 키워드와 같은 구문-핵심 토큰의 특성 때문에 로직 손상이 발생할 수 있습니다. 본 연구는 STONE으로서 구문 비의존 토큰에만 워터마킹을 삽입하고, 코드 무결성을 보존하도록 설계합니다. 또한 정확성, 검출성, 비가시성의 균형을 갖는 STEM을 제안하여 탐지 성능을 일관되게 평가할 수 있는 체계를 제공합니다.

관련 프로젝트

0건

연구 흐름

초기에는 워터마킹 기반 탐지에서 “기능 보존”과 “검출 용이성”이 함께 만족되어야 한다는 문제를 정식화하고, 구문-핵심 토큰의 엔트로피 특성 때문에 기존 가정이 취약해질 수 있음을 분석합니다. 이후 2025년에는 STONE을 통해 구문 비의존 토큰에만 워터마킹을 임베딩하는 구문 인지형 설계를 제안합니다. 더불어 정확성, 검출 가능성, 비가시성의 관점을 동시에 반영하는 STEM을 도입하여 방법의 성능을 통합적으로 검증하는 흐름으로 전개됩니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

소프트웨어 공급망 보안
코드 출처 검증
LLM 생성 코드 리스크 관리
지적재산권 침해 탐지
악성 코드 위장 방지
컴파일 전 무결성 확인
라이브러리 진위 판별
코드 포렌식 자동화
보안 감사용 증적 생성
대규모 개발 파이프라인 신뢰성 향상