RnDCircle Logo
정우환 연구실
고려대학교 인공지능학과
정우환 교수
기본 정보
연구 분야
프로젝트
발행물
구성원

정우환 연구실

고려대학교 인공지능학과 정우환 교수

정우환 연구실은 기계학습과 지식처리를 기반으로 자연어처리, 차분 프라이버시, 멀티모달 인공지능을 연구하며, 저자원 정보추출과 개체명 인식, 개인정보보호형 데이터 수집·공개, 의료 의사결정지원, 안티피싱, 스마트홈 생활데이터 분석 등 실제 응용에 연결되는 인공지능 기술을 개발하는 연구실이다.

대표 연구 분야
연구 영역 전체보기
자연어처리와 지식추출 thumbnail
자연어처리와 지식추출
주요 논문
3
논문 전체보기
1
article
|
인용수 1
·
2025
Improving Detail in Pluralistic Image Inpainting with Feature Dequantization
Kil Houm Park, Woohwan Jung
Pluralistic Image Inpainting (PII) offers multiple plausible solutions for restoring missing parts of images and has been successfully applied to various applications including image editing and object removal. Recently, VQGANbased methods have been proposed and have shown that they significantly improve the structural integrity in the generated images. Nevertheless, the state-of-the-art VQGANbased model PUT faces a critical challenge: degradation of detail quality in output images due to feature quantization. Feature quantization restricts the latent space and causes information loss, which negatively affects the detail quality essential for image inpainting. To tackle the problem, we propose the FDM (Feature Dequantization Module) specifically designed to restore the detail quality of images by compensating for the information loss. Furthermore, we develop an efficient training method for FDM which drastically reduces training costs. We empirically demonstrate that our method significantly enhances the detail quality of the generated images with negligible training and inference overheads. The code is available at https://github.com/hyudsl/FDM
https://doi.org/10.1109/wacv61041.2025.00076
Inpainting
Artificial intelligence
Image (mathematics)
Computer vision
Feature (linguistics)
Computer science
Pattern recognition (psychology)
Philosophy
Linguistics
2
article
|
인용수 12
·
2022
Cardinality estimation of approximate substring queries using deep learning
Suyong Kwon, Woohwan Jung, Kyuseok Shim
IF 3.3
Proceedings of the VLDB Endowment
Cardinality estimation of an approximate substring query is an important problem in database systems. Traditional approaches build a summary from the text data and estimate the cardinality using the summary with some statistical assumptions. Since deep learning models can learn underlying complex data patterns effectively, they have been successfully applied and shown to outperform traditional methods for cardinality estimations of queries in database systems. However, since they are not yet applied to approximate substring queries, we investigate a deep learning approach for cardinality estimation of such queries. Although the accuracy of deep learning models tends to improve as the train data size increases, producing a large train data is computationally expensive for cardinality estimation of approximate substring queries. Thus, we develop efficient train data generation algorithms by avoiding unnecessary computations and sharing common computations. We also propose a deep learning model as well as a novel learning method to quickly obtain an accurate deep learning-based estimator. Extensive experiments confirm the superiority of our data generation algorithms and deep learning model with the novel learning method.
https://doi.org/10.14778/3551793.3551859
Substring
Cardinality (data modeling)
Computer science
Deep learning
Artificial intelligence
Estimator
Computation
Machine learning
Algorithm
Theoretical computer science
3
article
|
인용수 19
·
2022
Collecting Geospatial Data Under Local Differential Privacy With Improving Frequency Estimation
Daeyoung Hong, Woohwan Jung, Kyuseok Shim
IF 10.4
IEEE Transactions on Knowledge and Data Engineering
Geospatial data provides a lot of benefits for personalized services. However, since the geospatial data contains sensitive information about personal activities, collecting the raw data has a potential risk of leaking private information from the collectors. Recently, local differential privacy (LDP), which protects the privacy of users without trusting the collector, has been adopted to preserve privacy in many real applications. In this paper, we investigate the problem of collecting the locations of individual users under LDP, and propose a perturbation mechanism designed carefully to minimize the expected error of perturbed locations according to the privacy budget and the data domain. The frequency distribution of perturbed locations inevitably has a large error. To tackle the problem, we also propose a postprocessing algorithm to estimate the original frequency distribution of collected data by using convex optimization. By experiments with various real datasets, we show the effectiveness of the proposed algorithms.
https://doi.org/10.1109/tkde.2022.3181049
Differential privacy
Geospatial analysis
Computer science
Raw data
Data mining
Information privacy
Computer security
Remote sensing
정부 과제
7
과제 전체보기
1
2025년 3월-2027년 12월
|300,000,000
전주기적 위암관리를 위한 인공지능기반 통합형 의사결정지원시스템 개발
위암전주기 관리를 위한 AI기반 통합형 의사결정지원 시스템 개발- 근거중심 의사결정지원을 위한 환자맞춤형 의학 문헌 검색 모델 개발- 의료 의사결정지원을 위한 의료특화 VLM (Visual-Language Model) 개발- 공공데이터를 활용한 위암 전주기 (예방, 진단, 치료 및 사후관리) 관리 단계별 특화 AI 모델 개발- 단계별 특화 AI를 통합하는 ...
의료인공지능
위암
근거기반의학
임상의사결정시스템
2
주관|
2023년 6월-2025년 12월
|250,000,000
개인정보보호를 보장하는 멀티모달 안티피싱을 위한 경량화 모델 및 스플릿러닝 기술 개발
■ 개인 정보 보호 안티피싱 기술개발 ● 본 과제에서는 모델, 데이터 및 학습 측면 각각에 대해 개인 정보 보호를 달성하고자 함. ▷ 모델 측면: Split Learning 기반 모델 분할 기법 및 경량화 - 프라이버시 문제를 해결하기 위해 클라우드가 사용자의 데이터를 직접적으로 전달받지 않는 기법을 개발하고자 함. 피싱 탐지 모델을 클라이언트모델과 서버모델로 나누어 서버에는 클라이언트 모델의 출력값인 Smashed data만을 전송하는 Split learning기반 피싱탐지기술 개발 ▷ 데이터 측면: 변조 데이터 기반 학습 - 모델의 역함수를 근사하는 모델 전도 공격을 통해 Smashed data로부터 원본 데이터를 추론하는 Inversion attack을 막기위한 Smashed data 변조 알고리즘 개발 ▷ 학습 측면: 개인정보보호 보장 지속적 학습 (Privacy preserving continual learning) - 진화하는 공격기법에 대응하기 위한 지속적학습을 수행하면서도 개인정보를 보호하기 위한 개인정보보호 보장 지속적 학습 기술 개발 ■ 최신피싱기법 대응을 위한 탐지 모델 학습 ● 본 과제에서는 메신저 피싱을 비롯한 최신 피싱 기법에 대응할수 있는 피싱 탐지 모델을 개발 ▷ 멀티 모달 피싱 탐지 모델E-Mail, SMS 피싱은 이미지, 텍스트, URL 등 다양한 데이터로 구성. 여러 종류의 데이터를 모두 사용하는 멀티 모달 피싱 탐지 모델을 개발하여 피싱 탐지 정확도를 높이고자 함. ▷ 메신저 피싱 탐지 모델최근 메신저 피싱 (예: 카카오톡 피싱)의 급격한 증가로 메신저 피싱이 전체피싱의 57.6%를 차지하고 있음. 메신저 피싱에 대응하기 위한 데이터 수집 및 모델 개발을 세계최초로 수행. ▷ 지속적 학습(Continual Learning)을 통한 모델 개선 공격 기법은 계속 진화하므로 새로운 데이터에 대한 지속적인 모델 업데이트가 필요함. 지속적 학습 기법을 적용하여 실시간 모델 업데이트를 통해 새로운 공격에 대응하고자 함.
안티피싱
메신저 기반 피싱
멀티모달 학습
모델 경량화
개인정보보호
3
2023년 6월-2025년 12월
|300,000,000
개인정보보호를 보장하는 멀티모달 안티피싱을 위한 경량화 모델 및 스플릿러닝 기술 개발
개인정보보호를 보장하는 멀티모달 안티 피싱 인공지능을 위한 경량화 모델 및 스플릿러닝 기술 개발o 현재 AI 기반 피싱 탐지 기술은 주로 사용자의 데이터를 클라우드로 전송하여 분석o 이 경우 데이터가 외부로 전송되므로 사용자의 개인 정보 유출 우려가 있는 취약점 존재o 본 과제에서는 이를 해결하기 위한 개인정보보호를 보장하는 AI기반 피싱 탐지 기술 개발...
안티피싱
메신저 기반 피싱
멀티모달 학습
모델 경량화
개인정보보호
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2024금융 정보 제공을 위한 대화형 검색 엔진 서버, 이를 포함하는 대화형 검색 엔진 시스템 및 이를 이용한 대화형 검색 방법1020240127540
공개2024숫자 환각 현상을 방지하는 전자 텍스트 문서 생성 방법 및 장치와, 상기 전자 텍스트 문서 생성 방법에 포함되는 숫자 매칭 방법1020240114887
등록2024조립 데이터셋 레버리징을 활용한 로우-리소스 미립 개체명 인식 개선 방법 및 장치1020240106702
전체 특허

금융 정보 제공을 위한 대화형 검색 엔진 서버, 이를 포함하는 대화형 검색 엔진 시스템 및 이를 이용한 대화형 검색 방법

상태
공개
출원연도
2024
출원번호
1020240127540

숫자 환각 현상을 방지하는 전자 텍스트 문서 생성 방법 및 장치와, 상기 전자 텍스트 문서 생성 방법에 포함되는 숫자 매칭 방법

상태
공개
출원연도
2024
출원번호
1020240114887

조립 데이터셋 레버리징을 활용한 로우-리소스 미립 개체명 인식 개선 방법 및 장치

상태
등록
출원연도
2024
출원번호
1020240106702