연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 13
·2023
READSUM: Retrieval-Augmented Adaptive Transformer for Source Code Summarization
YunSeok Choi, CheolWon Na, Hyojun Kim, Jee-Hyong Lee
IF 3.4 (2023) IEEE Access
초록

코드 요약(Code summarization)은 소스 코드의 이해와 유지보수를 돕기 위해 소스 코드로부터 간단하면서도 유익한 요약을 자동으로 생성하는 과정이다. 본 논문에서는 소스 코드 SUMmarization을 위한 검색 보강(REtrieval-augmented) 적응형(ADaptive) 트랜스포머 모델인 READSUM을 제안하며, 이 모델은 추출적 접근과 생성적(추상적) 접근을 모두 결합한다. 제안된 모델은 입력 코드의 구조적 정보와 순차적 정보를 모두 고려하면서, 생성적 방식으로 코드 요약을 생성한다. 아울러 중요한 키워드의 출현 빈도를 높이기 위해 유사한 코드의 검색된 요약을 활용하는 추출적 접근도 함께 사용한다. 원래 코드와 검색된 유사 코드를 임베딩 계층 단계에서 효과적으로 결합하기 위해, 다중 헤드 자기어텐션(multi-head self-attention)을 통해 원래 코드와 검색된 코드의 증강 표현을 구한다. 또한 인코더 단계에서 표현에 대한 구조적 정보와 순차적 정보를 적응적으로 학습하는 자기어텐션 네트워크를 개발한다. 더 나아가 디코더 단계에서는 원래 코드와 검색된 요약 간의 관계를 포착하기 위한 퓨전(fusion) 네트워크를 설계한다. 이 퓨전 네트워크는 검색된 요약을 기반으로 요약 생성을 효과적으로 유도한다. 마지막으로 READSUM은 추출적 접근으로 중요한 키워드를 추출하고, 소스 코드의 구조적 정보와 순차적 정보를 모두 고려하는 생성적 접근을 통해 고품질 요약을 생성한다. 다양한 실험과 절제(ablation) 연구를 통해 READSUM의 우수성을 입증한다. 또한 생성된 요약의 품질을 평가하기 위해 인간 평가도 수행한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Automatic summarizationComputer scienceTransformerInformation retrievalElectrical engineeringVoltageEngineering
타입
Article
IF / 인용수
3.4 / 13
게재 연도
2023