주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
인용수 7
·
2024Evaluation of Malware Classification Models for Heterogeneous Data
Ho Bae
IF 3.5 (2024)
Sensors
머신러닝(ML)은 다양한 분야에서 널리 활용되고 있다. 또한 ML 기반 기법은 기술 분야의 보안 문제를 해결하기 위해 사용되어 왔으며, 다수의 연구는 보안 문제를 해결하는 데 있어 그 잠재력과 효과를 보여주고 있다. 수년 동안 악성 소프트웨어를 식별하기 위한 ML 방법은 여러 보안 영역에 걸쳐 개발되어 왔다. 그러나 최근 연구에서는 ML 모델이 작은 입력 교란에 취약하다는 점이 강조되었으며, 이를 적대적 예(adversarial examples)라 한다. 이러한 적대적 예는 모델의 예측을 크게 변화시킬 수 있다. 기존의 적대적 예에 관한 연구는 주로 영상 처리용 ML 모델에 초점을 두었으나, 점차 보안을 포함한 다른 응용 분야로 확장되었다. 흥미롭게도 적대적 공격은 악성코드 분류(malware classification)의 영역에서 특히 효과적인 것으로 입증되었다. 본 연구는 악성코드 분류의 투명성을 탐구하고 악성코드 분류기(malware classifiers)를 위한 설명 방법을 개발하고자 한다. 현재의 과제는 전통적인 영상 데이터셋과 비교해 악성코드가 지닌 복잡한 데이터 구조로 인해, 동질적 데이터에 대한 설명가능 AI(explainable AI)에서의 과제보다 더 복잡하다. 연구 결과 기존의 설명들이 이질적 데이터(heterogeneous data)를 해석하는 데에는 한계가 있음을 확인하였다. 본 연구에서 사용한 방법은, 분류 정확도(classification accuracy)가 높더라도 현재의 악성코드 탐지기가 오히려 잘못된 형태의 보안감을 제공할 수 있으며, 분류 정확도의 측정만으로 탐지기를 검증하기에는 충분하지 않다는 점을 보여주었다.
https://doi.org/10.3390/s24010288
Malware
Computer science
Adversarial system
Machine learning
Artificial intelligence
Software
Adversarial machine learning
Data mining
Computer security
2
Article
|
·
인용수 0
·
2024Star-Generative Adversarial Network Advancements for De-Identification with Fixing Target Attributes
Yerin Yoon, Ho Bae
KIISE Transactions on Computing Practices
비식별화는 데이터셋에서 개인을 식별할 수 있는 요소들을 제거하여 데이터로부터 개인정보가 노출되지 않도록 하는 보안 방법이다. 제 4차 산업혁명 이후 데이터에 대한 수요와 공급이 기하급수적으로 증가하면서 데이터로 인한 개인 정보 노출 가능성이 현저히 높아졌는데, 이에 따라 데이터 활용을 제한하지 않으면서 보안 문제를 해결하기 위한 데이터 비식별화가 중요해 졌다. 특히 이미지 데이터는 원본 형태로 노출되었을 때 데이터 도용 및 악용 가능성이 높고, 사용자의 초상권을 침해할 수 있다. 그래서 이미지 데이터 비식별화는 지속적으로 연구되어 왔으며, 최근에는 데이터의 분포를 유지하면서 비식별화를 진행하는 생성 모델을 이용한 비식별화가 주목받고 있다. 본 논문에서는 이미지의 특정한 속성은 유지하면서 비식별화를 진행하는 생성 모델의 고도화를 목표로 하며, 비식별화 과정 중 모델 학습 과정에서 사용할 수 있는 두 가지의 선택 방법론을 제안한다. 그리고 두 가지의 선택 방법론을 적용함으로써 유지하고자 하는 target 속성이 기존 모델보다 더 잘 유지되며 생성 모델의 성능 또한 더 좋아지는 것을 실험으로 보인다.
https://doi.org/10.5626/ktcp.2024.30.4.199
Adversarial system
Identification (biology)
Generative grammar
Star (game theory)
Generative adversarial network
Computer science
Artificial intelligence
Deep learning
Astrophysics
Physics
3
Book chapter
|
·
인용수 3
·
2024FLGuard: Byzantine-Robust Federated Learning via Ensemble of Contrastive Models
Younghan Lee, Yungi Cho, Woorim Han, Ho Bae, Yunheung Paek
Lecture notes in computer science
https://doi.org/10.1007/978-3-031-51482-1_4
Computer science
Federated learning
Byzantine fault tolerance
Deep learning
Artificial intelligence
Ensemble learning
Machine learning
Deep neural networks
Scheme (mathematics)
Distributed computing
4
Article
|
·
인용수 1
·
2023PUCA: Patch-Unshuffle and Channel Attention for Enhanced Self-Supervised Image Denoising
Ho Bae, Hyemi Jang, Dahuin Jung, Jaihyun Lew, Junsung Park, Sungroh Yoon
https://doi.org/10.52202/075280-0843
Channel (broadcasting)
Noise reduction
Noise (video)
Pattern recognition (psychology)
Image (mathematics)
5
Article
|
·
인용수 0
·
2023Privacy-Preserving Publishing of Individual-Level Medical Data for Cloud Services
Ho Bae, Heonseok Ha, Siwon Kim
딥러닝(DL)은 질병 예측을 포함한 많은 응용 분야에서 광범위하게 채택되어 왔다. 대부분의 DL 기반 응용은 DL 모델이 너무 크고 복잡하여 클라이언트 측에서 실행하기 어렵기 때문에 클라우드 서버에서 수행된다. 실질적으로 클라우드에 호스팅된 추론은 개인 의료 데이터를 사용하는 서비스와 관련하여 개인정보 보호에 대한 우려를 초래한다. 그럼에도 불구하고 최근 건강 진단 서비스용 DL 기반 응용의 발전을 고려하면, 이러한 응용은 일상생활에서 의료 지원을 제공하는 지배적인 수단이 되었다. 개인 의료 데이터의 오용을 방지하기 위해 민감한 정보를 보존하는 여러 기법이 개발되었으며, 이는 개인정보 보호와 유용성 간의 상충관계(trade-off)를 수반한다. 개인정보 보존과 양호한 예측 성능을 모두 제공하는 간단한 방법은 진단 방법을 클라이언트 측에 배치하는 것이다. 그러나 이를 수행하면 DL 모델이 공격자에 대해 더 취약해진다. 이를 위해 본 연구에서는 사용자 데이터의 프라이버시를 보장하면서 원래의 클래스 정보를 유지하고 모델을 역공학(reverse engineering)으로부터 보호하는 딥 프라이빗 생성 프레임워크를 제안한다. 벤치마크 질병 데이터셋에 대한 실제 딥 신경망을 대상으로 한 실험 결과, 제안된 방법은 원래 데이터와 합성 데이터 간의 상호정보량(mutual information)을 거의 80% 감소시키면서도 원래 예측 정확도에 거의 95%에 해당하는 예측 정확도를 보존함을 보여주었다.
http://dx.doi.org/10.1109/bibm58861.2023.10385371
Computer science
Cloud computing
Benchmark (surveying)
Software deployment
Information privacy
Server
Deep learning
Machine learning
Computer security
Private information retrieval