신뢰·안전 AI 및 기밀성 보장 온디바이스 실증 연구

Trustworthy and secure AI with confidentiality for on-device and safety applications

연구 내용

거대 언어 모델의 편향과 안전 위험을 평가하고, 데이터·모델 기밀성을 유지하며, 음성·통화·단말 기반 위협을 탐지하는 신뢰 AI 기술을 개발하는 연구

신뢰 AI 관점에서 거대 언어 모델의 가치 정렬이 의도치 않은 위해로 이어질 수 있는 안전 위험을 심리·경험 근거로 분석합니다. 동시에 강건성, 설명가능성, 편향 완화와 같은 가드레일 요구사항을 만족시키기 위한 연구를 수행합니다. 실무 적용을 위해 데이터 기밀성 확보 및 성능 향상을 목표로 오프사이트 학습 알고리즘을 다루며, 단말 내 인공지능을 전제로 보이스피싱·딥페이크·악성앱 탐지와 같은 위협 시나리오를 모델 경량화 관점에서 정리합니다. 또한 변환기 기반 실행 바이너리에서 함수 심볼 추론과 음성 프로파일링 장치에 관한 기술 실체를 특허로 보유하고 있습니다.

관련 프로젝트

7건

연구 흐름

2022~2023년의 특허 기반 기술로는 바이너리 분석에서 함수 심볼 추론과 음성 프로파일링 문제를 정리했습니다. 이후 2024년에는 AI Guardians 과제를 통해 신뢰 AI 구성요소인 설명가능성, 강건성, 편향 완화, AI 법·정책 요구를 함께 다루는 방향으로 확장했습니다. 2025년에는 모델 및 데이터 기밀성 확보와 연속 학습을 목표로 오프사이트 학습 알고리즘을 연구하고, 단말 내 경량화된 위협 탐지(보이스피싱 등)로 안전 적용성을 구체화하는 흐름을 이어갑니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

설명가능 신뢰 AI 가드레일
가치정렬 안전 위험 평가
편향 완화 진단 프레임워크
데이터 기밀성 보존 학습 파이프라인
오프사이트 연속 학습 설계
단말 기반 보이스피싱 탐지
딥페이크 및 악성앱 탐지
음성 프로파일링 기반 식별 모듈
바이너리 함수 심볼 추론 엔진
안전·규제 준수 AI 평가 도구