RnDCircle Logo
서창호 연구실
한국과학기술원 전기및전자공학부
서창호 교수
기본 정보
연구 분야
프로젝트
발행물
구성원

서창호 연구실

한국과학기술원 전기및전자공학부 서창호 교수

서창호 연구실은 정보이론을 중심으로 무선통신·네트워크의 근본 성능 한계를 분석하고, 이를 데이터사이언스와 머신러닝으로 확장하여 랭킹, 클러스터링, 행렬완성, 분산저장, 공정하고 책임있는 인공지능까지 아우르는 융합 연구를 수행하며, 이론적 엄밀성과 실제 시스템 적용 가능성을 동시에 추구한다.

대표 연구 분야
연구 영역 전체보기
정보이론 기반 통신 네트워크 설계 thumbnail
정보이론 기반 통신 네트워크 설계
주요 논문
5
논문 전체보기
1
article
|
green
·
인용수 71
·
2018
Hypergraph Spectral Clustering in the Weighted Stochastic Block Model
Kwangjun Ahn, Kangwook Lee, Changho Suh
IF 13.7
IEEE Journal of Selected Topics in Signal Processing
Spectral clustering is a celebrated algorithm that partitions the objects based on pairwise similarity information. While this approach has been successfully applied to a variety of domains, it comes with limitations. The reason is that there are many other applications in which only <italic xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink">multi</i> way similarity measures are available. This motivates us to explore the multiway measurement setting. In this paper, we develop two algorithms intended for such setting: hypergraph spectral clustering (HSC) and hypergraph spectral clustering with local refinement (HSCLR). Our main contribution lies in performance analysis of the polytime algorithms under a random hypergraph model, which we name the weighted stochastic block model, in which objects and multiway measures are modeled as nodes and weights of hyperedges, respectively. Denoting by <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$n$</tex-math></inline-formula> the number of nodes, our analysis reveals the following: 1) HSC outputs a partition which is better than a random guess if the sum of edge weights (to be explained later) is <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$\Omega (n)$</tex-math> </inline-formula> ; 2) HSC outputs a partition which coincides with the hidden partition except for a vanishing fraction of nodes if the sum of edge weights is <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$\omega (n)$</tex-math> </inline-formula> ; and 3) HSCLR exactly recovers the hidden partition if the sum of edge weights is on the order of <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$n \log n$</tex-math></inline-formula> . Our results improve upon the state of the arts recently established under the model and they first settle the orderwise optimal results for the binary edge weight case. Moreover, we show that our results lead to efficient sketching algorithms for subspace clustering, a computer vision application. Finally, we show that HSCLR achieves the information-theoretic limits for a special yet practically relevant model, thereby showing no computational barrier for the case.
https://doi.org/10.1109/jstsp.2018.2837638
Hypergraph
Stochastic block model
Spectral clustering
Cluster analysis
Partition (number theory)
Pairwise comparison
Mathematics
Combinatorics
Subspace topology
Algorithm
2
article
|
인용수 8
·
2018
Top-$K$ Rank Aggregation From $M$-Wise Comparisons
Minje Jang, Sunghyun Kim, Changho Suh
IF 13.7
IEEE Journal of Selected Topics in Signal Processing
Suppose one aims to identify only the top- <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$K$</tex-math></inline-formula> among a large collection of <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$n$</tex-math></inline-formula> items provided <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$M$</tex-math></inline-formula> -wise comparison data, where a set of <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$M$</tex-math></inline-formula> items in each data sample are ranked in order of individual preference. Natural questions that arise are as follows: 1) how one can reliably achieve the top- <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$K$</tex-math></inline-formula> rank aggregation task; and 2) how many <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$M$</tex-math></inline-formula> -wise samples one needs to achieve it. In this paper, we answer these two questions. First, we devise an algorithm that effectively converts <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"> <tex-math notation="LaTeX">$M$</tex-math></inline-formula> -wise samples into pairwise ones and employs a spectral method using the refined data. Second, we consider the Plackett–Luce (PL) model, a well-established statistical model, and characterize the minimal number of <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$M$</tex-math> </inline-formula> -wise samples (i.e., sample complexity) required for reliable top- <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"> <tex-math notation="LaTeX">$K$</tex-math></inline-formula> ranking. It turns out to be inversely proportional to <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$M$</tex-math></inline-formula> . To characterize it, we derive a lower bound on the sample complexity and prove that our algorithm achieves the bound. Moreover, we conduct extensive numerical experiments to demonstrate that our algorithm not only attains the fundamental limit under the PL model but also provides robust ranking performance for a variety of applications that may not precisely fit the model. We corroborate our theoretical result using synthetic datasets, confirming that the sample complexity decreases at the rate of <inline-formula xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><tex-math notation="LaTeX">$\frac{1}{M}$</tex-math></inline-formula> . Also, we verify the applicability of our algorithm in practice, showing that it performs well on various real-world datasets.
https://doi.org/10.1109/jstsp.2018.2834864
Notation
Rank (graph theory)
Mathematics
Algorithm
Computer science
Combinatorics
Arithmetic
3
article
|
인용수 48
·
2017
Opportunistic Downlink Interference Alignment for Multi-Cell MIMO Networks
Hyun Jong Yang, Won-Yong Shin, Bang Chul Jung, Changho Suh, A. Paulraj
IF 10.7
IEEE Transactions on Wireless Communications
In this paper, we propose an opportunistic downlink interference alignment (ODIA) for interference-limited cellular downlink, which intelligently combines user scheduling and downlink IA techniques. The proposed ODIA not only efficiently reduces the effect of inter-cell interference from other-cell base stations (BSs) but also eliminates intra-cell interference among spatial streams in the same cell. We show that the minimum number of users required to achieve a target degrees-of-freedom can be fundamentally reduced, i.e., the fundamental user scaling law can be improved by using the ODIA, compared with the existing downlink IA schemes. In addition, we adopt a limited feedback strategy in the ODIA framework, and then analyze the number of feedback bits required for the system with limited feedback to achieve the same user scaling law of the ODIA as the system with perfect channel state information. We also modify the original ODIA in order to further improve the sum-rate, which achieves the optimal multiuser diversity gain, i.e., log log N, per spatial stream even in the presence of downlink inter-cell interference, where N denotes the number of users in a cell. Simulation results show that the ODIA significantly outperforms existing interference management techniques in terms of sum rate in realistic cellular environments. Note that the ODIA operates in a non-collaborative and decoupled manner, i.e., it requires no information exchange among BSs and no iterative beamformer optimization between BSs and users, thus leading to an easier implementation.
https://doi.org/10.1109/twc.2017.2647942
Telecommunications link
Computer science
Interference (communication)
MIMO
Base station
Scheduling (production processes)
Channel state information
Cellular network
Computer network
Channel (broadcasting)
정부 과제
19
과제 전체보기
1
주관|
2022년 3월-2026년 12월
|2,500,000,000
점차 강화되고 있는 윤리 정책에 발맞춰 유연하게 진화하는 인공지능 기술 개발 연구
[주요 내용] - 실제 정책을 반영하는 인공지능 응용 모델 개발 * 1차년도에 개발한 각 분야의 AI 기반 시스템을 발전시켜 실제 현 정책을 반영하여 준수할 수 있는 AI 시스템으로 개발. * 인공지능 공정성과 관련된 정책들을 반영하는 다양한 편향성 완화 기법을 통해 알고리즘들을 각 분야의 데이터 특성 및 인공지능 모델의 목표에 맞게 개발하여 적용. < 채용 > 지원자 평가 시스템의 데이터 불균형에 따른 편향성 완화 < 추천시스템 > 상품, 뉴스 등 사용자의 그룹에 따른 추천 시스템의 편향성 완화 < 금융/신용 > 개인의 신용 평가 시스템에서의 보호 변수에 따른 편향성 완화 < 의료 > 질환 진단 시스템 및 치료 선택안 권고 시스템의 데이터 불균형에 따른 편향성 완화 < 언어 > 그룹에 따른 음성인식 시스템의 성능 편차 완화 / 혐오 표현 탐지 시스템 / 언어 모델 편향 탐지 시스템 개발 < 기타 > 치안, 광고, 법률, 문화, 방송 등 다양한 범위의 보호변수에 따른 편향성 탐지 및 완화
공정성
신뢰도
유연성
인공지능
정책
2
주관|
2022년 3월-2026년 12월
|1,875,000,000
점차 강화되고 있는 윤리 정책에 발맞춰 유연하게 진화하는 인공지능 기술 개발 연구
[주요 내용] - 인공지능 공정성에 대한 선행 연구 조사 * 인공지능 공정성을 평가 할 수 있는 지표로써 equalized odds, demographic parity, mean difference score 등 다양한 측도가 존재함. * 이에 대한 선행 조사는 추후 정책 반영시 나타나는 결과를 단순 정확도에서 더 나아가 정착 반영 정도에 대한 공정성을 평가하기 위한 정량적 지표로써 사용이 가능함. - 공정성 평가를 위한 설문조사 * 공정성에 대한 평가는 수학적 지표에서 더 나아가 사람이 이를 어떻게 받아들이는가로 평가 할 수 있는 여지가 많음. * 사람이 받아들일 수 있는 공정성 평가 기준의 설립을 위해 이와 관련된 설문 조사는 필수적임. * 기존 조사와 조사 목적을 반영하여 작성된 설문 초안을 온라인 조사가 가능한 형태로 수정하여 최종 설문지를 확정 한 후 온라인 설문 프로그래밍을 진행. - AI 기반 시스템을 위한 데이터셋 구축 * 정책 반영을 위한 다양한 AI기반 시스템의 경우 채용, 금융/신용, 의료 등 사람의 사생활 문제와 관련되어 있는 데이터셋을 필요로 하는 경우가 많음. * 사생활 문제와 관련되있는 데이터셋의 경우 특정 사람을 식별 할 수 있는 문제로 인해 오픈된 데이터셋이 미미함. * 공개되어 있는 데이터셋의 경우에도 제한적인 내용을 담고 있기 때문에, 정책 반영을 위한 충분한 정보 제공이 어려움. * AI 기반 시스템을 위한 데이터셋 구축의 경우, AI 기반 시스템의 성능 측정 뿐 아니라, 정책 반영 여부를 정확하게 판단하기 위해 필수적임. - AI 기반 시스템 개발 * 1차년도에서의 AI 기반 시스템의 개발은 본 과제 전반에서 정책 반영 여부와 이에 관련된 평가를 위한 필수적인 과정임. * 하기 시스템 개발을 위한 기초 연구 진행 < 채용 > 지원자 평가 시스템 개발 < 추천시스템 > 상품, 뉴스 등 사용자에 따른 추천 시스템 개발 < 금융/신용 > 대출심사 및 개업과 개인의 신용 평가 시스템 개발 < 의료 > 질환 진단 시스템 및 치료 선택안 권고 시스템 개발 < 언어 > 음성인식 시스템 / 혐오 표현 탐지 시스템 / 언어 모델 편향 탐지 시스템 개발 < 기타 > : 치안, 광고, 법률, 문화, 방송등 보다 다양한 범위에 적용 가능한 AI 시스템 개발
공정성
신뢰도
유연성
인공지능
정책
3
주관|
2020년 3월-2022년 12월
|1,200,000,000
적은 양의 학습 데이터만으로 양질의 데이터 분석결과를 보장해야 하는 문제 해결
1) 소량의 데이터를 활용하는 메타훈련 기반의 소수샷학습 알고리즘 - 거리 기반, 모델 기반, 최적화 기반의 기존 메타학습 알고리즘 분석과 더불어 피처 공간의 투영 기술을 활용하는 새로운 소수샷학습 기법 연구 - 자기지도학습 등을 활용하여 기존 에피소드 기반의 훈련 기법을 능가하는 메타훈련 기법 연구 - 귀납적 편향성 축적이 강화될 수 있는 추가 모듈 구조 및 작업특화 조건형성이 우수한 추론 모델 개발 - 작업 특화 조건형성 시 선형 피처 공간 투영을 능가하는 비선형 투영 기술 개발 2) 선행 지식과 새로운 정보를 융합하는 빠른 전이학습 알고리즘 - 새로운 작업의 데이터를 선행 모델로 처리하여 얻은 정보와 새로운 작업의 데이터에 대해 독립적으로 추출한 지식을 융합하는 모듈 도입 및 학습 기술 개발 - 상기 독립적인 지식을 빠르게 추출하기 위한 추가 신경망 모듈 도입을 포함한 새로운 신경망 구조 및 학습 기술 연구 - 융합된 지식을 바탕으로 신경망의 파라미터 혹은 구조적 특성을 변화시키는 미세 조정 기법 연구 - 새로운 작업들의 연속학습이 가능한 점진적 미세 조정 기법 개발 3) 미분류 데이터에서 추출한 특징을 활용하여 학습 성능을 향상시키는 학습 알고리즘 - 행렬채움 방식을 적용한 데이터의 관계 그래프를 도출하고 이를 통해 미분류 데이터를 학습에 활용하는 준지도학습 알고리즘 개발 - 메타학습을 이용해 다수의 자기지도학습 작업을 효과적으로 활용하는 새로운 자기지도학습 기법 연구 - 미분류 데이터의 특징 분석을 통해 선별 및 추가 분류 전략을 확립하고 심층 신경망의 훈련과정과 연동하여 동작하는 심층 능동학습 알고리즘 개발 - 데이터의 신뢰도 및 중요도 분석을 통해 미분류 데이터셋을 가공하여 소수샷학습 및 메타학습에 도움이 될 수 있는 데이터만을 추출하는 알고리즘 개발 4) 세부 기술 연계를 통한 학습 적용 범위 확장 및 학습 성능 향상 - 소수샷학습 기술의 작업 특화 조건형성 기법을 전이학습의 미세조정 알고리즘으로 활용 - 미분류 데이터를 이용한 자기지도학습 기술을 바탕으로 개선된 메타훈련 기법 개발 - 능동학습 및 빅데이터 가공 기술로 미분류 데이터를 처리하여 소수샷학습 및 전이학습에 활용 5) 각 세부기술 요소에 대한 SW 및 연계된 전체 시스템 SW 제공 - 소수샷학습/전이학습/준지도학습/자기지도학습을 연계하여 적은 양의 데이터로 동작 가능한 의료 진단 SW 구축 - 준지도학습/자기지도학습/능동학습/빅데이터 가공 기술을 연계하여 반도체 결함 진단 SW 구축
메타학습
빅데이터 가공
소수샷학습
자기지도학습
전이학습
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
등록2023머신러닝에서 상관 관계 변화에 따른 공정한 모델 훈련 방법 및 시스템1020230052881
공개2023전장 상황과 관련된 가설 추천 방법 및 이를 수행하는 전자 장치1020230041897
등록2021레이블이 부분적으로 주어진 환경에서 다중 레이블을 분류하는 방법 및 이를 수행하는 장치1020210173776
전체 특허

머신러닝에서 상관 관계 변화에 따른 공정한 모델 훈련 방법 및 시스템

상태
등록
출원연도
2023
출원번호
1020230052881

전장 상황과 관련된 가설 추천 방법 및 이를 수행하는 전자 장치

상태
공개
출원연도
2023
출원번호
1020230041897

레이블이 부분적으로 주어진 환경에서 다중 레이블을 분류하는 방법 및 이를 수행하는 장치

상태
등록
출원연도
2021
출원번호
1020210173776