기본 정보
연구 분야
프로젝트
논문
구성원
읽는 시간 · 1분 21초

신뢰·안전 AI 및 기밀성 보장 온디바이스 실증 연구

Trustworthy and secure AI with confidentiality for on-device and safety applications

연구 내용

거대 언어 모델의 편향과 안전 위험을 평가하고, 데이터·모델 기밀성을 유지하며, 음성·통화·단말 기반 위협을 탐지하는 신뢰 AI 기술을 개발하는 연구

신뢰 AI 관점에서 거대 언어 모델의 가치 정렬이 의도치 않은 위해로 이어질 수 있는 안전 위험을 심리·경험 근거로 분석합니다. 동시에 강건성, 설명가능성, 편향 완화와 같은 가드레일 요구사항을 만족시키기 위한 연구를 수행합니다. 실무 적용을 위해 데이터 기밀성 확보 및 성능 향상을 목표로 오프사이트 학습 알고리즘을 다루며, 단말 내 인공지능을 전제로 보이스피싱·딥페이크·악성앱 탐지와 같은 위협 시나리오를 모델 경량화 관점에서 정리합니다. 또한 변환기 기반 실행 바이너리에서 함수 심볼 추론과 음성 프로파일링 장치에 관한 기술 실체를 특허로 보유하고 있습니다.

관련 연구 성과

관련 논문

1

관련 특허

2

관련 프로젝트

7

연구 흐름

2022~2023년의 특허 기반 기술로는 바이너리 분석에서 함수 심볼 추론과 음성 프로파일링 문제를 정리했습니다. 이후 2024년에는 AI Guardians 과제를 통해 신뢰 AI 구성요소인 설명가능성, 강건성, 편향 완화, AI 법·정책 요구를 함께 다루는 방향으로 확장했습니다. 2025년에는 모델 및 데이터 기밀성 확보와 연속 학습을 목표로 오프사이트 학습 알고리즘을 연구하고, 단말 내 경량화된 위협 탐지(보이스피싱 등)로 안전 적용성을 구체화하는 흐름을 이어갑니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

  • 설명가능 신뢰 AI 가드레일
  • 가치정렬 안전 위험 평가
  • 편향 완화 진단 프레임워크
  • 데이터 기밀성 보존 학습 파이프라인
  • 오프사이트 연속 학습 설계
  • 단말 기반 보이스피싱 탐지
  • 딥페이크 및 악성앱 탐지
  • 음성 프로파일링 기반 식별 모듈
  • 바이너리 함수 심볼 추론 엔진
  • 안전·규제 준수 AI 평가 도구

관련 논문

구분

제목

1

Unintended Harms of Value-Aligned LLMs: Psychological and Empirical Insights

관련 특허

구분

제목

1

트랜스포머 기반의 실행 바이너리 내 어셈블리 코드에서 함수 심볼을 추론하는 방법 및 장치, 그리고 이를 기록한 기록 매체

2

음성 프로파일링 장치 및 방법

관련 프로젝트

구분

제목

1

AI Guardians: 강건하고 통제가능하며 편향 없는 신뢰 AI 기술 개발

2

AI Guardians: 강건하고 통제가능하며 편향 없는 신뢰 AI 기술 개발

3

AI Guardians: 강건하고 통제가능하며 편향 없는 신뢰 AI 기술 개발

4

AI 모델 및 데이터 기밀성 확보 및 성능 향상 오프사이트 AI 모델 학습 알고리즘

5

(2세부)알려지지 않은 신종 보이스피싱 탐지·예측 기술개발

6

(2세부)알려지지 않은 신종 보이스피싱 탐지·예측 기술개발

7

AI스타펠로우십지원(울산과학기술원)

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.