RnDcircle | 플랫폼

연구 내용

사회적·윤리적 학습을 위한 데이터 특성과 생성 AI 모델의 안전성을 개선하고, 편향 완화와 설명가능한 근거 추론을 통해 의사결정 지원 성능을 안정화하는 연구

본 연구는 생성 AI의 사회적·윤리적 학습을 데이터 특성 관점에서 다루며, 안전한 디코딩과 편향 완화를 포함하는 학습 체계를 구성하는 데 중점을 둡니다. 또한 자기인식 피드백 기반 자가학습과 윤리 전문가 혼합을 통해 모델이 학습 중 목표를 정렬하도록 설계하고, 지속적 학습 환경에서 과적합을 완화하기 위한 강건한 파인튜닝 전략을 적용합니다. 더불어 전문지식 기반 판단 결과에 대한 근거 추론과 보고서 생성을 포함한 설명가능한AI 기술을 개발하여 의사결정 지원의 검증 가능성을 높이는 방향으로 진행합니다.

관련 프로젝트

8건

연구 흐름

2022년에는 전문지식 대상 판단 결과의 이유와 근거를 생성하는 설명가능 의사결정 지원 기술 개발 과제를 통해 근거 추론과 보고서 생성을 목표로 연구를 시작했습니다. 2024년부터는 사회적·윤리적 학습을 위한 데이터 특성 및 생성 AI 모델의 윤리성 향상 과제를 수행하며, 안전한 디코딩과 편향 방지, 자가학습 구조를 중심으로 확장했습니다. 동시에 변화하는 환경과 가치에 지속부합하는 Open-ended Alignment 관점에서 신뢰성과 공정성, 개인성을 고려한 학습 정렬 기법을 연구했습니다. 2025년에는 저자원 NLP에서 과적합을 줄이기 위한 적대적 학습과 메트릭 기반 학습 결합의 강건한 파인튜닝 연구로 성능 안정화 방향을 구체화했습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

편향 방지 학습 파이프라인
안전한 디코딩 정책
윤리 전문가 혼합 모듈
자기인식 피드백 기반 자가학습
근거 추론 생성기
설명가능 보고서 생성 시스템
지속적 학습 검증 체계
Open-ended Alignment 평가 도구
신뢰성·공정성 점검 모듈
개인성 유지 학습 전략

AI 얼라인먼트와 윤리학습, 설명가능 의사결정 지원 연구