[주요 내용]
- 실제 정책을 반영하는 인공지능 응용 모델 개발
* 1차년도에 개발한 각 분야의 AI 기반 시스템을 발전시켜 실제 현 정책을 반영하여 준수할 수 있는 AI 시스템으로 개발.
* 인공지능 공정성과 관련된 정책들을 반영하는 다양한 편향성 완화 기법을 통해 알고리즘들을 각 분야의 데이터 특성 및 인공지능 모델의 목표에 맞게 개발하여 적용.
< 채용 > 지원자 평가 시스템의 데이터 불균형에 따른 편향성 완화
< 추천시스템 > 상품, 뉴스 등 사용자의 그룹에 따른 추천 시스템의 편향성 완화
< 금융/신용 > 개인의 신용 평가 시스템에서의 보호 변수에 따른 편향성 완화
< 의료 > 질환 진단 시스템 및 치료 선택안 권고 시스템의 데이터 불균형에 따른 편향성 완화
< 언어 > 그룹에 따른 음성인식 시스템의 성능 편차 완화 / 혐오 표현 탐지 시스템 / 언어 모델 편향 탐지 시스템 개발
< 기타 > 치안, 광고, 법률, 문화, 방송 등 다양한 범위의 보호변수에 따른 편향성 탐지 및 완화
[주요 내용]
- 인공지능 공정성에 대한 선행 연구 조사
* 인공지능 공정성을 평가 할 수 있는 지표로써 equalized odds, demographic parity, mean difference score 등 다양한 측도가 존재함.
* 이에 대한 선행 조사는 추후 정책 반영시 나타나는 결과를 단순 정확도에서 더 나아가 정착 반영 정도에 대한 공정성을 평가하기 위한 정량적 지표로써 사용이 가능함.
- 공정성 평가를 위한 설문조사
* 공정성에 대한 평가는 수학적 지표에서 더 나아가 사람이 이를 어떻게 받아들이는가로 평가 할 수 있는 여지가 많음.
* 사람이 받아들일 수 있는 공정성 평가 기준의 설립을 위해 이와 관련된 설문 조사는 필수적임.
* 기존 조사와 조사 목적을 반영하여 작성된 설문 초안을 온라인 조사가 가능한 형태로 수정하여 최종 설문지를 확정 한 후 온라인 설문 프로그래밍을 진행.
- AI 기반 시스템을 위한 데이터셋 구축
* 정책 반영을 위한 다양한 AI기반 시스템의 경우 채용, 금융/신용, 의료 등 사람의 사생활 문제와 관련되어 있는 데이터셋을 필요로 하는 경우가 많음.
* 사생활 문제와 관련되있는 데이터셋의 경우 특정 사람을 식별 할 수 있는 문제로 인해 오픈된 데이터셋이 미미함.
* 공개되어 있는 데이터셋의 경우에도 제한적인 내용을 담고 있기 때문에, 정책 반영을 위한 충분한 정보 제공이 어려움.
* AI 기반 시스템을 위한 데이터셋 구축의 경우, AI 기반 시스템의 성능 측정 뿐 아니라, 정책 반영 여부를 정확하게 판단하기 위해 필수적임.
- AI 기반 시스템 개발
* 1차년도에서의 AI 기반 시스템의 개발은 본 과제 전반에서 정책 반영 여부와 이에 관련된 평가를 위한 필수적인 과정임.
* 하기 시스템 개발을 위한 기초 연구 진행
< 채용 > 지원자 평가 시스템 개발
< 추천시스템 > 상품, 뉴스 등 사용자에 따른 추천 시스템 개발
< 금융/신용 > 대출심사 및 개업과 개인의 신용 평가 시스템 개발
< 의료 > 질환 진단 시스템 및 치료 선택안 권고 시스템 개발
< 언어 > 음성인식 시스템 / 혐오 표현 탐지 시스템 / 언어 모델 편향 탐지 시스템 개발
< 기타 > : 치안, 광고, 법률, 문화, 방송등 보다 다양한 범위에 적용 가능한 AI 시스템 개발
1) 소량의 데이터를 활용하는 메타훈련 기반의 소수샷학습 알고리즘
- 거리 기반, 모델 기반, 최적화 기반의 기존 메타학습 알고리즘 분석과 더불어 피처 공간의 투영 기술을 활용하는 새로운 소수샷학습 기법 연구
- 자기지도학습 등을 활용하여 기존 에피소드 기반의 훈련 기법을 능가하는 메타훈련 기법 연구
- 귀납적 편향성 축적이 강화될 수 있는 추가 모듈 구조 및 작업특화 조건형성이 우수한 추론 모델 개발
- 작업 특화 조건형성 시 선형 피처 공간 투영을 능가하는 비선형 투영 기술 개발
2) 선행 지식과 새로운 정보를 융합하는 빠른 전이학습 알고리즘
- 새로운 작업의 데이터를 선행 모델로 처리하여 얻은 정보와 새로운 작업의 데이터에 대해 독립적으로 추출한 지식을 융합하는 모듈 도입 및 학습 기술 개발
- 상기 독립적인 지식을 빠르게 추출하기 위한 추가 신경망 모듈 도입을 포함한 새로운 신경망 구조 및 학습 기술 연구
- 융합된 지식을 바탕으로 신경망의 파라미터 혹은 구조적 특성을 변화시키는 미세 조정 기법 연구
- 새로운 작업들의 연속학습이 가능한 점진적 미세 조정 기법 개발
3) 미분류 데이터에서 추출한 특징을 활용하여 학습 성능을 향상시키는 학습 알고리즘
- 행렬채움 방식을 적용한 데이터의 관계 그래프를 도출하고 이를 통해 미분류 데이터를 학습에 활용하는 준지도학습 알고리즘 개발
- 메타학습을 이용해 다수의 자기지도학습 작업을 효과적으로 활용하는 새로운 자기지도학습 기법 연구
- 미분류 데이터의 특징 분석을 통해 선별 및 추가 분류 전략을 확립하고 심층 신경망의 훈련과정과 연동하여 동작하는 심층 능동학습 알고리즘 개발
- 데이터의 신뢰도 및 중요도 분석을 통해 미분류 데이터셋을 가공하여 소수샷학습 및 메타학습에 도움이 될 수 있는 데이터만을 추출하는 알고리즘 개발
4) 세부 기술 연계를 통한 학습 적용 범위 확장 및 학습 성능 향상
- 소수샷학습 기술의 작업 특화 조건형성 기법을 전이학습의 미세조정 알고리즘으로 활용
- 미분류 데이터를 이용한 자기지도학습 기술을 바탕으로 개선된 메타훈련 기법 개발
- 능동학습 및 빅데이터 가공 기술로 미분류 데이터를 처리하여 소수샷학습 및 전이학습에 활용
5) 각 세부기술 요소에 대한 SW 및 연계된 전체 시스템 SW 제공
- 소수샷학습/전이학습/준지도학습/자기지도학습을 연계하여 적은 양의 데이터로 동작 가능한 의료 진단 SW 구축
- 준지도학습/자기지도학습/능동학습/빅데이터 가공 기술을 연계하여 반도체 결함 진단 SW 구축
1) 소량의 데이터를 활용하는 메타훈련 기반의 소수샷학습 알고리즘
- 거리 기반, 모델 기반, 최적화 기반의 기존 메타학습 알고리즘 분석과 더불어 피처 공간의 투영 기술을 활용하는 새로운 소수샷학습 기법 연구
- 자기지도학습 등을 활용하여 기존 에피소드 기반의 훈련 기법을 능가하는 메타훈련 기법 연구
- 귀납적 편향성 축적이 강화될 수 있는 추가 모듈 구조 및 작업특화 조건형성이 우수한 추론 모델 개발
- 작업 특화 조건형성 시 선형 피처 공간 투영을 능가하는 비선형 투영 기술 개발
2) 선행 지식과 새로운 정보를 융합하는 빠른 전이학습 알고리즘
- 새로운 작업의 데이터를 선행 모델로 처리하여 얻은 정보와 새로운 작업의 데이터에 대해 독립적으로 추출한 지식을 융합하는 모듈 도입 및 학습 기술 개발
- 상기 독립적인 지식을 빠르게 추출하기 위한 추가 신경망 모듈 도입을 포함한 새로운 신경망 구조 및 학습 기술 연구
- 융합된 지식을 바탕으로 신경망의 파라미터 혹은 구조적 특성을 변화시키는 미세 조정 기법 연구
- 새로운 작업들의 연속학습이 가능한 점진적 미세 조정 기법 개발
3) 미분류 데이터에서 추출한 특징을 활용하여 학습 성능을 향상시키는 학습 알고리즘
- 행렬채움 방식을 적용한 데이터의 관계 그래프를 도출하고 이를 통해 미분류 데이터를 학습에 활용하는 준지도학습 알고리즘 개발
- 메타학습을 이용해 다수의 자기지도학습 작업을 효과적으로 활용하는 새로운 자기지도학습 기법 연구
- 미분류 데이터의 특징 분석을 통해 선별 및 추가 분류 전략을 확립하고 심층 신경망의 훈련과정과 연동하여 동작하는 심층 능동학습 알고리즘 개발
- 데이터의 신뢰도 및 중요도 분석을 통해 미분류 데이터셋을 가공하여 소수샷학습 및 메타학습에 도움이 될 수 있는 데이터만을 추출하는 알고리즘 개발
4) 세부 기술 연계를 통한 학습 적용 범위 확장 및 학습 성능 향상
- 소수샷학습 기술의 작업 특화 조건형성 기법을 전이학습의 미세조정 알고리즘으로 활용
- 미분류 데이터를 이용한 자기지도학습 기술을 바탕으로 개선된 메타훈련 기법 개발
- 능동학습 및 빅데이터 가공 기술로 미분류 데이터를 처리하여 소수샷학습 및 전이학습에 활용
5) 각 세부기술 요소에 대한 SW 및 연계된 전체 시스템 SW 제공
- 소수샷학습/전이학습/준지도학습/자기지도학습을 연계하여 적은 양의 데이터로 동작 가능한 의료 진단 SW 구축
- 준지도학습/자기지도학습/능동학습/빅데이터 가공 기술을 연계하여 반도체 결함 진단 SW 구축
1) 소량의 데이터를 활용하는 메타훈련 기반의 소수샷학습 알고리즘
- 거리 기반, 모델 기반, 최적화 기반의 기존 메타학습 알고리즘 분석과 더불어 피처 공간의 투영 기술을 활용하는 새로운 소수샷학습 기법 연구
- 자기지도학습 등을 활용하여 기존 에피소드 기반의 훈련 기법을 능가하는 메타훈련 기법 연구
- 귀납적 편향성 축적이 강화될 수 있는 추가 모듈 구조 및 작업특화 조건형성이 우수한 추론 모델 개발
- 작업 특화 조건형성 시 선형 피처 공간 투영을 능가하는 비선형 투영 기술 개발
2) 선행 지식과 새로운 정보를 융합하는 빠른 전이학습 알고리즘
- 새로운 작업의 데이터를 선행 모델로 처리하여 얻은 정보와 새로운 작업의 데이터에 대해 독립적으로 추출한 지식을 융합하는 모듈 도입 및 학습 기술 개발
- 상기 독립적인 지식을 빠르게 추출하기 위한 추가 신경망 모듈 도입을 포함한 새로운 신경망 구조 및 학습 기술 연구
- 융합된 지식을 바탕으로 신경망의 파라미터 혹은 구조적 특성을 변화시키는 미세 조정 기법 연구
- 새로운 작업들의 연속학습이 가능한 점진적 미세 조정 기법 개발
3) 미분류 데이터에서 추출한 특징을 활용하여 학습 성능을 향상시키는 학습 알고리즘
- 행렬채움 방식을 적용한 데이터의 관계 그래프를 도출하고 이를 통해 미분류 데이터를 학습에 활용하는 준지도학습 알고리즘 개발
- 메타학습을 이용해 다수의 자기지도학습 작업을 효과적으로 활용하는 새로운 자기지도학습 기법 연구
- 미분류 데이터의 특징 분석을 통해 선별 및 추가 분류 전략을 확립하고 심층 신경망의 훈련과정과 연동하여 동작하는 심층 능동학습 알고리즘 개발
- 데이터의 신뢰도 및 중요도 분석을 통해 미분류 데이터셋을 가공하여 소수샷학습 및 메타학습에 도움이 될 수 있는 데이터만을 추출하는 알고리즘 개발
4) 세부 기술 연계를 통한 학습 적용 범위 확장 및 학습 성능 향상
- 소수샷학습 기술의 작업 특화 조건형성 기법을 전이학습의 미세조정 알고리즘으로 활용
- 미분류 데이터를 이용한 자기지도학습 기술을 바탕으로 개선된 메타훈련 기법 개발
- 능동학습 및 빅데이터 가공 기술로 미분류 데이터를 처리하여 소수샷학습 및 전이학습에 활용
5) 각 세부기술 요소에 대한 SW 및 연계된 전체 시스템 SW 제공
- 소수샷학습/전이학습/준지도학습/자기지도학습을 연계하여 적은 양의 데이터로 동작 가능한 의료 진단 SW 구축
- 준지도학습/자기지도학습/능동학습/빅데이터 가공 기술을 연계하여 반도체 결함 진단 SW 구축