RnDCircle Logo
배호 연구실
이화여자대학교 사이버보안학과 배호 교수
적대적 머신러닝
악성코드 분석
프라이버시 보존 생성모델
연구 영역
기본 정보
논문·특허
과제
구성원

배호 연구실

이화여자대학교 사이버보안학과 배호 교수

배호 연구실은 사이버보안학과 소속으로, 기계학습 기반 보안 취약성을 적대적 공격 관점에서 분석하고 프라이버시를 보장하는 생성형 모델을 함께 연구합니다. 악성코드 분류의 이질적 입력 구조에서 회피성 변형이 생성되는 과정을 모델링하고, 설명 방법이 충분히 해석되지 않을 수 있음을 평가합니다. 또한 개인 의료 데이터와 이미지의 비식별화를 위해 target 속성을 유지하는 생성형 프레임워크를 설계하고, 합성 데이터의 프라이버시 보장과 역공학 위험 저감 방향을 다룹니다. 차등정보보호와 데이터 비접근 기반 생성 기술을 연계하여 실제 서비스 배포 절차까지 고려한 보안 연구를 수행합니다.

적대적 머신러닝악성코드 분석프라이버시 보존 생성모델비식별화차등정보보호
대표 연구 분야
연구 영역 전체보기
적대적 공격에 강인한 악성코드·보안 모델 분석 연구 thumbnail
적대적 공격에 강인한 악성코드·보안 모델 분석 연구
Adversarial-robust Malware Learning and Security Evaluation
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.
주요 논문
5
논문 전체보기
1
Article
|
인용수 7
·
2024
Evaluation of Malware Classification Models for Heterogeneous Data
Ho Bae
IF 3.5 (2024)
Sensors
머신러닝(ML)은 다양한 분야에서 널리 활용되고 있다. 또한 ML 기반 기법은 기술 분야의 보안 문제를 해결하기 위해 사용되어 왔으며, 다수의 연구는 보안 문제를 해결하는 데 있어 그 잠재력과 효과를 보여주고 있다. 수년 동안 악성 소프트웨어를 식별하기 위한 ML 방법은 여러 보안 영역에 걸쳐 개발되어 왔다. 그러나 최근 연구에서는 ML 모델이 작은 입력 교란에 취약하다는 점이 강조되었으며, 이를 적대적 예(adversarial examples)라 한다. 이러한 적대적 예는 모델의 예측을 크게 변화시킬 수 있다. 기존의 적대적 예에 관한 연구는 주로 영상 처리용 ML 모델에 초점을 두었으나, 점차 보안을 포함한 다른 응용 분야로 확장되었다. 흥미롭게도 적대적 공격은 악성코드 분류(malware classification)의 영역에서 특히 효과적인 것으로 입증되었다. 본 연구는 악성코드 분류의 투명성을 탐구하고 악성코드 분류기(malware classifiers)를 위한 설명 방법을 개발하고자 한다. 현재의 과제는 전통적인 영상 데이터셋과 비교해 악성코드가 지닌 복잡한 데이터 구조로 인해, 동질적 데이터에 대한 설명가능 AI(explainable AI)에서의 과제보다 더 복잡하다. 연구 결과 기존의 설명들이 이질적 데이터(heterogeneous data)를 해석하는 데에는 한계가 있음을 확인하였다. 본 연구에서 사용한 방법은, 분류 정확도(classification accuracy)가 높더라도 현재의 악성코드 탐지기가 오히려 잘못된 형태의 보안감을 제공할 수 있으며, 분류 정확도의 측정만으로 탐지기를 검증하기에는 충분하지 않다는 점을 보여주었다.
https://doi.org/10.3390/s24010288
Malware
Computer science
Adversarial system
Machine learning
Artificial intelligence
Software
Adversarial machine learning
Data mining
Computer security
2
Article
|
·
인용수 0
·
2024
Star-Generative Adversarial Network Advancements for De-Identification with Fixing Target Attributes
Yerin Yoon, Ho Bae
KIISE Transactions on Computing Practices
비식별화는 데이터셋에서 개인을 식별할 수 있는 요소들을 제거하여 데이터로부터 개인정보가 노출되지 않도록 하는 보안 방법이다. 제 4차 산업혁명 이후 데이터에 대한 수요와 공급이 기하급수적으로 증가하면서 데이터로 인한 개인 정보 노출 가능성이 현저히 높아졌는데, 이에 따라 데이터 활용을 제한하지 않으면서 보안 문제를 해결하기 위한 데이터 비식별화가 중요해 졌다. 특히 이미지 데이터는 원본 형태로 노출되었을 때 데이터 도용 및 악용 가능성이 높고, 사용자의 초상권을 침해할 수 있다. 그래서 이미지 데이터 비식별화는 지속적으로 연구되어 왔으며, 최근에는 데이터의 분포를 유지하면서 비식별화를 진행하는 생성 모델을 이용한 비식별화가 주목받고 있다. 본 논문에서는 이미지의 특정한 속성은 유지하면서 비식별화를 진행하는 생성 모델의 고도화를 목표로 하며, 비식별화 과정 중 모델 학습 과정에서 사용할 수 있는 두 가지의 선택 방법론을 제안한다. 그리고 두 가지의 선택 방법론을 적용함으로써 유지하고자 하는 target 속성이 기존 모델보다 더 잘 유지되며 생성 모델의 성능 또한 더 좋아지는 것을 실험으로 보인다.
https://doi.org/10.5626/ktcp.2024.30.4.199
Adversarial system
Identification (biology)
Generative grammar
Star (game theory)
Generative adversarial network
Computer science
Artificial intelligence
Deep learning
Astrophysics
Physics
3
Book chapter
|
·
인용수 3
·
2024
FLGuard: Byzantine-Robust Federated Learning via Ensemble of Contrastive Models
Younghan Lee, Yungi Cho, Woorim Han, Ho Bae, Yunheung Paek
Lecture notes in computer science
https://doi.org/10.1007/978-3-031-51482-1_4
Computer science
Federated learning
Byzantine fault tolerance
Deep learning
Artificial intelligence
Ensemble learning
Machine learning
Deep neural networks
Scheme (mathematics)
Distributed computing
최신 정부 과제
17
과제 전체보기
1
2025년 2월-2028년 2월
|247,174,000
데이터 비접근 기반의 멀티모달 데이터 생성 기술 개발
생성 AI 모델이 민감한 데이터에 직접 접근하지 않고도 멀티모달 데이터를 생성할 수 있는 기술을 개발하는 것을 목표함.
데이터 비접근 기술
차등정보보호
2
2024년 12월-2028년 12월
|1,987,500,000
위험적 요소에도 강인하며 유연한 회복 탄력성을 가지는 인공지능 기술 개발
o 기존의 단일 모달리티 / 단일 위험 요소에 대한 인공지능 모델의 강건성 보장 기술을 넘어 멀티 모달리티 / 복합 위험 요소에 대한 인공지능 모델의 회복탄력성 강화가 가능하도록 하는 위험 요소 탐지-해석-복구 통합 프레임워크 개발 - 이미지-텍스트 멀티모달 모델에 대하여 주요 위험 요소: 1) 탈옥 (jailbreaking), 2) 백도어 공격 (bac...
회복탄력성
강건성
적대적 공격
비젼-언어모델
거대언어모델
3
2024년 12월-2028년 12월
|1,987,500,000
위험적 요소에도 강인하며 유연한 회복 탄력성을 가지는 인공지능 기술 개발
o 기존의 단일 모달리티 / 단일 위험 요소에 대한 인공지능 모델의 강건성 보장 기술을 넘어 멀티 모달리티 / 복합 위험 요소에 대한 인공지능 모델의 회복탄력성 강화가 가능하도록 하는 위험 요소 탐지-해석-복구 통합 프레임워크 개발 - 이미지-텍스트 멀티모달 모델에 대하여 주요 위험 요소: 1) 탈옥 (jailbreaking), 2) 백도어 공격 (bac...
회복탄력성
강건성
적대적 공격
비젼-언어모델
거대언어모델
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2024수면무호흡증의 중증도를 예측하는 방법 및 장치1020240108447
공개2024하드웨어 용량에 따른 동적 클러스터링 방법 및 데이터처리장치1020240057466
거절2024차등 프라이버시를 만족하는 생성 모델 기반의 합성 데이터 생성 방법 및 데이터처리장치1020240056890
전체 특허

수면무호흡증의 중증도를 예측하는 방법 및 장치

상태
공개
출원연도
2024
출원번호
1020240108447

하드웨어 용량에 따른 동적 클러스터링 방법 및 데이터처리장치

상태
공개
출원연도
2024
출원번호
1020240057466

차등 프라이버시를 만족하는 생성 모델 기반의 합성 데이터 생성 방법 및 데이터처리장치

상태
거절
출원연도
2024
출원번호
1020240056890