기본 정보
논문·특허
과제
구성원
Preprint|
인용수 0
·2025
AssurAI: Experience with Constructing Korean Socio-cultural Datasets to Discover Potential Risks of Generative AI
Chae-Gyun Lim, Seung-Ho Han, Eeeseung Byun, Jeongyun Han, Soohyun Cho, Eojin Joo, Heehyeon Kim, Sieun Kim, Juhoon Lee, Hyunsoo Lee, Dong-Kun Lee, Jonghwan Hyeon, Yechan Hwang, Youngjun Lee, Keon‐Cheol Lee, Minhyeong An, Hyunjun Ahn, Jeong-Woo Son, Junho Park, Do Young Yoon, Taehyung Kim, Julie Kim, Dasom Choi, Kwangyoung Lee, Hyunseung Lim, Yeohyun Jung, Jia Fei Hong, Seungyoon Nam, Joonyoung Park, Sungmin Na, Yubin Choi, Jeanne Choi, Yoojin Hong, Sueun Jang, Youngseok Seo, Somin Park, Sungyang Jo, Wonhye Chae, Yeeun Jo, Eunyoung Kim, Joyce Jiyoung Whang, Ha Hong, Joseph Seering, Lee Uichin, Juho Kim, Suk‐Ho Choi, S. Ko, Taeho Kim, Kyunghoon Kim, Moon‐Kyung Ha, SoJung Lee, Jemin Hwang, J.G. Kwak, Hojin Choi
ArXiv.org
초록

생성형 AI의 빠른 발전은 견고한 안전성 평가를 필요로 한다. 그러나 현재의 안전성 데이터셋은 대부분 영어 중심이어서, 한국과 같은 비영어권의 사회문화적 맥락에서의 특정 위험을 충분히 포착하지 못하며, 또한 텍스트 양식에 제한되는 경우가 많다. 이러한 공백을 해소하기 위해 본 연구는 생성형 AI의 안전성을 평가하기 위한 품질관리된 새로운 한국어 멀티모달 데이터셋인 AssurAI를 제안한다. 첫째, 다학제 전문가 집단이 기존의 확립된 프레임워크로부터 조정하여 보편적 위해와 한국의 사회문화적 맥락에 대한 관련성을 모두 포괄하도록 35개의 서로 다른 AI 위험 요인에 대한 분류체계를 정의한다. 둘째, 이러한 분류체계를 활용하여 텍스트, 이미지, 비디오, 오디오를 아우르는 총 11,480개의 인스턴스로 구성된 대규모 한국어 멀티모달 데이터셋인 AssurAI를 구축하고 공개한다. 셋째, 데이터 무결성을 보장하기 위해 사용되는 엄격한 품질관리 절차를 적용하며, 두 단계의 구축 과정(즉, 전문가 주도 시딩과 크라우드소싱 기반 확장), 세 명의 독립적인 주석, 그리고 반복적인 전문가 레드팀(적대적 공격팀) 루프를 포함한다. 파일럿 연구를 통해 AssurAI가 최근 LLM의 안전성을 평가하는 데 효과적임을 검증한다. 우리는 한국 커뮤니티를 위한 더 안전하고 신뢰할 수 있는 생성형 AI 시스템 개발을 촉진하기 위해 AssurAI를 공개한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Generative grammarSAFERConstruct (python library)Relevance (law)Multidisciplinary approachProcess (computing)Generative modelToolboxQuality (philosophy)
타입
Preprint
IF / 인용수
- / 0
게재 연도
2025