RnDCircle Logo
서창호 연구실
한국과학기술원 전기및전자공학부
서창호 교수
기본 정보
연구 분야
프로젝트
발행물
구성원

서창호 연구실

한국과학기술원 전기및전자공학부 서창호 교수

서창호 연구실은 정보이론을 중심으로 무선통신·네트워크의 근본 성능 한계를 분석하고, 이를 데이터사이언스와 머신러닝으로 확장하여 랭킹, 클러스터링, 행렬완성, 분산저장, 공정하고 책임있는 인공지능까지 아우르는 융합 연구를 수행하며, 이론적 엄밀성과 실제 시스템 적용 가능성을 동시에 추구한다.

대표 연구 분야
연구 영역 전체보기
정보이론 기반 통신 네트워크 설계 thumbnail
정보이론 기반 통신 네트워크 설계
주요 논문
3
논문 전체보기
1
article
|
인용수 1
·
2023
On the Fundamental Limits of Matrix Completion: Leveraging Hierarchical Similarity Graphs
Junhyung Ahn, Adel Elmahdy, Soheil Mohajer, Changho Suh
IF 2.9
IEEE Transactions on Information Theory
We study a matrix completion problem which leverages a hierarchical structure of social similarity graphs as side information in the context of recommender systems. We assume that users are categorized into clusters, each of which comprises sub-clusters (or what we call “groups”). We consider a hierarchical stochastic block model that well respects practically-relevant social graphs and follows a low-rank rating matrix model. Under this setting, we characterize the information-theoretic limit on the number of observed matrix entries (i.e., optimal sample complexity) as a function of the quality of graph side information (to be detailed) by proving sharp upper and lower bounds on the sample complexity. One important consequence of this result is that leveraging the hierarchical structure of similarity graphs yields a substantial gain in sample complexity relative to the one that simply identifies different groups without resorting to the relational structure across them. Another implication of the result is when the graph information is rich, the optimal sample complexity is proportional to the number of clusters, while it nearly stays constant as the number of groups in a cluster increases. We empirically demonstrate through extensive experiments that the proposed algorithm achieves the optimal sample complexity.
https://doi.org/10.1109/tit.2023.3345902
Stochastic block model
Matrix completion
Computer science
Low-rank approximation
Similarity (geometry)
Recommender system
Theoretical computer science
Matrix (chemical analysis)
Rank (graph theory)
Mathematics
2
article
|
인용수 6
·
2022
Mc2g: An Efficient Algorithm for Matrix Completion With Social and Item Similarity Graphs
Qiaosheng Zhang, Geewon Suh, Changho Suh, Vincent Y. F. Tan
IF 5.8
IEEE Transactions on Signal Processing
In this paper, we design and analyze MC2G (Matrix Completion with 2 Graphs), an algorithm that performs matrix completion in the presence of social and item similarity graphs. MC2G runs in quasilinear time and is parameter free. It is based on spectral clustering and local refinement steps. For the matrix completion problem which possesses additional block structures in its rows and columns, we derive the expected number of sampled entries required for MC2G to succeed, and further show that it matches an information-theoretic lower bound up to a constant factor for a wide range of parameters. We perform extensive experiments on both synthetic datasets and a semi-real dataset inspired by real graphs. The experimental results show that MC2G outperforms other state-of-the-art matrix completion algorithms.
https://doi.org/10.1109/tsp.2022.3174423
Matrix completion
Matrix (chemical analysis)
Row
Row and column spaces
Algorithm
Spectral clustering
Similarity (geometry)
Range (aeronautics)
Computer science
Cluster analysis
3
editorial
|
bronze
·
인용수 0
·
2022
Guest Editorial
Mohammad Ali Maddah-Ali, Salman Avestimehr, Ravi Tandon, Changho Suh, Ayfer Özgür, Chao Tian, Tara Javidi, Giuseppe Caire
IF 2.2
IEEE Journal on Selected Areas in Information Theory
Welcome to the ninth (June 2022) issue of the IEEE Journal on Selected Areas in Information Theory (JSAIT), dedicated to “Distributed Coding and Computation”.
https://doi.org/10.1109/jsait.2022.3216438
Ninth
Computer science
Computation
Coding (social sciences)
Sociology
Algorithm
Physics
Social science
정부 과제
19
과제 전체보기
1
주관|
2022년 3월-2026년 12월
|2,500,000,000
점차 강화되고 있는 윤리 정책에 발맞춰 유연하게 진화하는 인공지능 기술 개발 연구
[주요 내용] - 실제 정책을 반영하는 인공지능 응용 모델 개발 * 1차년도에 개발한 각 분야의 AI 기반 시스템을 발전시켜 실제 현 정책을 반영하여 준수할 수 있는 AI 시스템으로 개발. * 인공지능 공정성과 관련된 정책들을 반영하는 다양한 편향성 완화 기법을 통해 알고리즘들을 각 분야의 데이터 특성 및 인공지능 모델의 목표에 맞게 개발하여 적용. < 채용 > 지원자 평가 시스템의 데이터 불균형에 따른 편향성 완화 < 추천시스템 > 상품, 뉴스 등 사용자의 그룹에 따른 추천 시스템의 편향성 완화 < 금융/신용 > 개인의 신용 평가 시스템에서의 보호 변수에 따른 편향성 완화 < 의료 > 질환 진단 시스템 및 치료 선택안 권고 시스템의 데이터 불균형에 따른 편향성 완화 < 언어 > 그룹에 따른 음성인식 시스템의 성능 편차 완화 / 혐오 표현 탐지 시스템 / 언어 모델 편향 탐지 시스템 개발 < 기타 > 치안, 광고, 법률, 문화, 방송 등 다양한 범위의 보호변수에 따른 편향성 탐지 및 완화
공정성
신뢰도
유연성
인공지능
정책
2
주관|
2022년 3월-2026년 12월
|1,875,000,000
점차 강화되고 있는 윤리 정책에 발맞춰 유연하게 진화하는 인공지능 기술 개발 연구
[주요 내용] - 인공지능 공정성에 대한 선행 연구 조사 * 인공지능 공정성을 평가 할 수 있는 지표로써 equalized odds, demographic parity, mean difference score 등 다양한 측도가 존재함. * 이에 대한 선행 조사는 추후 정책 반영시 나타나는 결과를 단순 정확도에서 더 나아가 정착 반영 정도에 대한 공정성을 평가하기 위한 정량적 지표로써 사용이 가능함. - 공정성 평가를 위한 설문조사 * 공정성에 대한 평가는 수학적 지표에서 더 나아가 사람이 이를 어떻게 받아들이는가로 평가 할 수 있는 여지가 많음. * 사람이 받아들일 수 있는 공정성 평가 기준의 설립을 위해 이와 관련된 설문 조사는 필수적임. * 기존 조사와 조사 목적을 반영하여 작성된 설문 초안을 온라인 조사가 가능한 형태로 수정하여 최종 설문지를 확정 한 후 온라인 설문 프로그래밍을 진행. - AI 기반 시스템을 위한 데이터셋 구축 * 정책 반영을 위한 다양한 AI기반 시스템의 경우 채용, 금융/신용, 의료 등 사람의 사생활 문제와 관련되어 있는 데이터셋을 필요로 하는 경우가 많음. * 사생활 문제와 관련되있는 데이터셋의 경우 특정 사람을 식별 할 수 있는 문제로 인해 오픈된 데이터셋이 미미함. * 공개되어 있는 데이터셋의 경우에도 제한적인 내용을 담고 있기 때문에, 정책 반영을 위한 충분한 정보 제공이 어려움. * AI 기반 시스템을 위한 데이터셋 구축의 경우, AI 기반 시스템의 성능 측정 뿐 아니라, 정책 반영 여부를 정확하게 판단하기 위해 필수적임. - AI 기반 시스템 개발 * 1차년도에서의 AI 기반 시스템의 개발은 본 과제 전반에서 정책 반영 여부와 이에 관련된 평가를 위한 필수적인 과정임. * 하기 시스템 개발을 위한 기초 연구 진행 < 채용 > 지원자 평가 시스템 개발 < 추천시스템 > 상품, 뉴스 등 사용자에 따른 추천 시스템 개발 < 금융/신용 > 대출심사 및 개업과 개인의 신용 평가 시스템 개발 < 의료 > 질환 진단 시스템 및 치료 선택안 권고 시스템 개발 < 언어 > 음성인식 시스템 / 혐오 표현 탐지 시스템 / 언어 모델 편향 탐지 시스템 개발 < 기타 > : 치안, 광고, 법률, 문화, 방송등 보다 다양한 범위에 적용 가능한 AI 시스템 개발
공정성
신뢰도
유연성
인공지능
정책
3
주관|
2020년 3월-2022년 12월
|1,200,000,000
적은 양의 학습 데이터만으로 양질의 데이터 분석결과를 보장해야 하는 문제 해결
1) 소량의 데이터를 활용하는 메타훈련 기반의 소수샷학습 알고리즘 - 거리 기반, 모델 기반, 최적화 기반의 기존 메타학습 알고리즘 분석과 더불어 피처 공간의 투영 기술을 활용하는 새로운 소수샷학습 기법 연구 - 자기지도학습 등을 활용하여 기존 에피소드 기반의 훈련 기법을 능가하는 메타훈련 기법 연구 - 귀납적 편향성 축적이 강화될 수 있는 추가 모듈 구조 및 작업특화 조건형성이 우수한 추론 모델 개발 - 작업 특화 조건형성 시 선형 피처 공간 투영을 능가하는 비선형 투영 기술 개발 2) 선행 지식과 새로운 정보를 융합하는 빠른 전이학습 알고리즘 - 새로운 작업의 데이터를 선행 모델로 처리하여 얻은 정보와 새로운 작업의 데이터에 대해 독립적으로 추출한 지식을 융합하는 모듈 도입 및 학습 기술 개발 - 상기 독립적인 지식을 빠르게 추출하기 위한 추가 신경망 모듈 도입을 포함한 새로운 신경망 구조 및 학습 기술 연구 - 융합된 지식을 바탕으로 신경망의 파라미터 혹은 구조적 특성을 변화시키는 미세 조정 기법 연구 - 새로운 작업들의 연속학습이 가능한 점진적 미세 조정 기법 개발 3) 미분류 데이터에서 추출한 특징을 활용하여 학습 성능을 향상시키는 학습 알고리즘 - 행렬채움 방식을 적용한 데이터의 관계 그래프를 도출하고 이를 통해 미분류 데이터를 학습에 활용하는 준지도학습 알고리즘 개발 - 메타학습을 이용해 다수의 자기지도학습 작업을 효과적으로 활용하는 새로운 자기지도학습 기법 연구 - 미분류 데이터의 특징 분석을 통해 선별 및 추가 분류 전략을 확립하고 심층 신경망의 훈련과정과 연동하여 동작하는 심층 능동학습 알고리즘 개발 - 데이터의 신뢰도 및 중요도 분석을 통해 미분류 데이터셋을 가공하여 소수샷학습 및 메타학습에 도움이 될 수 있는 데이터만을 추출하는 알고리즘 개발 4) 세부 기술 연계를 통한 학습 적용 범위 확장 및 학습 성능 향상 - 소수샷학습 기술의 작업 특화 조건형성 기법을 전이학습의 미세조정 알고리즘으로 활용 - 미분류 데이터를 이용한 자기지도학습 기술을 바탕으로 개선된 메타훈련 기법 개발 - 능동학습 및 빅데이터 가공 기술로 미분류 데이터를 처리하여 소수샷학습 및 전이학습에 활용 5) 각 세부기술 요소에 대한 SW 및 연계된 전체 시스템 SW 제공 - 소수샷학습/전이학습/준지도학습/자기지도학습을 연계하여 적은 양의 데이터로 동작 가능한 의료 진단 SW 구축 - 준지도학습/자기지도학습/능동학습/빅데이터 가공 기술을 연계하여 반도체 결함 진단 SW 구축
메타학습
빅데이터 가공
소수샷학습
자기지도학습
전이학습
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
등록2023머신러닝에서 상관 관계 변화에 따른 공정한 모델 훈련 방법 및 시스템1020230052881
공개2023전장 상황과 관련된 가설 추천 방법 및 이를 수행하는 전자 장치1020230041897
등록2021레이블이 부분적으로 주어진 환경에서 다중 레이블을 분류하는 방법 및 이를 수행하는 장치1020210173776
전체 특허

머신러닝에서 상관 관계 변화에 따른 공정한 모델 훈련 방법 및 시스템

상태
등록
출원연도
2023
출원번호
1020230052881

전장 상황과 관련된 가설 추천 방법 및 이를 수행하는 전자 장치

상태
공개
출원연도
2023
출원번호
1020230041897

레이블이 부분적으로 주어진 환경에서 다중 레이블을 분류하는 방법 및 이를 수행하는 장치

상태
등록
출원연도
2021
출원번호
1020210173776