| 번호 | 청구항 |
|---|---|
| 1 | 전처리부를 통해 모델 훈련을 위한 데이터의 레이블과 그룹 속성 간의 편향의 변화를 나타내는 상관 관계에 관한 클래스의 샘플을 추출하여 상기 상관 관계 변화를 감소시키기 위한 전처리를 수행하는 단계; 공정 모델 처리부를 통해 상기 전처리된 상관 관계 변화에 따라 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율을 조정하는 단계; 및 후처리부를 통해 훈련된 모델의 출력이 미리 정해진 공정성을 충족하도록 상기 조정된 데이터 비율에 따라 조정된 데이터를 모델 훈련을 위한 공정 알고리즘에 입력하는 단계를 포함하는 모델 훈련 방법. |
| 2 | 제1항에 있어서,상기 전처리부를 통해 모델 훈련을 위한 데이터의 레이블과 그룹 속성 간의 편향의 변화를 나타내는 상관 관계에 관한 클래스의 샘플을 추출하여 상기 상관 관계 변화를 감소시키기 위한 전처리를 수행하는 단계; 배치 데이터에서 주어진 그룹 속성의 조건부 확률 차이의 상관 상수 및 상기 상관 상수의 범위를 분포 추정 기법을 사용하여 구하고, 상기 추출된 샘플에 대한 클래스의 가중치를 사용하여 조건부 확률 차이에 비례하는 데이터의 레이블과 그룹 속성 간의 상관 관계 변화를 감소시키기 위한 전처리를 수행하는모델 훈련 방법. |
| 3 | 제1항에 있어서,상기 공정 모델 처리부를 통해 상기 전처리된 상관 관계 변화에 따라 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율을 조정하는 단계는, 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율을 조정에서 정보 손실을 줄이기 위해 원래 데이터 비율과 조정된 데이터 비율 간의 제곱 차이를 최소화하는 것을 목표로 하는 함수를 설정하는모델 훈련 방법. |
| 4 | 제3항에 있어서,상기 공정 모델 처리부를 통해 상기 전처리된 상관 관계 변화에 따라 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율을 조정하는 단계는, 상기 원래 데이터 비율과 조정된 데이터 비율 간의 제곱 차이를 최소화하기 위한 함수에 대하여 비볼록 QCQP(quadratically constrained quadratic problem)의 최적 값의 하한을 제공하는 볼록 이완 SDP(Semidefinite Programming) 완화를 적용하는 모델 훈련 방법. |
| 5 | 제4항에 있어서,상기 공정 모델 처리부를 통해 상기 전처리된 상관 관계 변화에 따라 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율을 조정하는 단계는,상기 SDP 완화를 통해 조정된 새로운 데이터 비율을 반영함으로써, 상기 전처리를 통한 상관 관계 조정과 데이터 비율에 대한 공정성 완화를 분리하는모델 훈련 방법. |
| 6 | 모델 훈련을 위한 데이터의 레이블과 그룹 속성 간의 편향의 변화를 나타내는 상관 관계에 관한 클래스의 샘플을 추출하여 상기 상관 관계 변화를 감소시키기 위한 전처리를 수행하는 전처리부; 상기 전처리된 상관 관계 변화에 따라 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율을 조정하는 공정 모델 처리부; 및 훈련된 모델의 출력이 미리 정해진 공정성을 충족하도록 상기 조정된 데이터 비율에 따라 조정된 데이터를 모델 훈련을 위한 공정 알고리즘에 입력하는 후처리부를 포함하는 모델 훈련 시스템. |
| 7 | 제6항에 있어서,상기 전처리부는, 훈련 데이터에 대한 성능이 배치 데이터로 전달되도록 배치 데이터에서 주어진 그룹 속성의 조건부 확률 차이의 상관 상수 및 상기 상관 상수의 범위를 분포 추정 기법을 사용하여 구하고, 상기 상관 상수의 범위 및 상기 추출된 샘플에 대한 클래스의 가중치를 사용하여 상기 조건부 확률 차이에 비례하는 상기 상관 관계 변화를 감소시키기 위한 전처리를 수행하는모델 훈련 시스템. |
| 8 | 제6항에 있어서,상기 공정 모델 처리부는, 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율 조정 과정에서 정보 손실을 줄이기 위해 원래 데이터 비율과 조정된 데이터 비율 간의 제곱 차이를 최소화하는 것을 목표로 하는 함수를 설정하는모델 훈련 시스템. |
| 9 | 제8항에 있어서,상기 공정 모델 처리부는, 상기 원래 데이터 비율과 조정된 데이터 비율 간의 제곱 차이를 최소화하기 위한 함수에 대하여 비볼록 QCQP(quadratically constrained quadratic problem)의 최적 값의 하한을 제공하는 볼록 이완 SDP(Semidefinite Programming) 완화를 적용하고, 상기 SDP 완화를 통해 조정된 새로운 데이터 비율을 반영함으로써, 상기 전처리를 통한 상관 관계 조정과 데이터 비율에 대한 공정성 완화를 분리하는 모델 훈련 시스템. |
| 10 | 상관 관계 변화에 따른 공정한 모델 훈련 방법을 실행시키기 위해 컴퓨터 판독 가능한 저장 매체에 저장된 프로그램에 있어서, 전처리부를 통해 모델 훈련을 위한 데이터의 레이블과 그룹 속성 간의 편향의 변화를 나타내는 상관 관계에 관한 클래스의 샘플을 추출하여 상기 상관 관계 변화를 감소시키기 위한 전처리를 수행하는 단계; 공정 모델 처리부를 통해 상기 전처리된 상관 관계 변화에 따라 상기 데이터의 레이블과 그룹 속성 간의 데이터 비율을 조정하는 단계; 및 후처리부를 통해 훈련된 모델의 출력이 미리 정해진 공정성을 충족하도록 상기 조정된 데이터 비율에 따라 조정된 데이터를 모델 훈련을 위한 공정 알고리즘에 입력하는 단계를 포함하는 컴퓨터 판독 가능한 저장 매체에 저장된 프로그램. |