o 데이터 관리 및 인구적 특성에 따른 데이터 분석을 위해 아동의 신상과 관련된 기본적인 정보 수집 및 관리를 위한 모듈 구축, 양육자가 일상생활을 하는 동안 자녀를 관찰한 내용을 바탕으로 주어진 질문에 답하도록 요청하여 정보를 수집 및 관리를 위한 모듈 구축
o 아동 연령에 따른 적합한 질문을 화면에 보여주어 영역(사회적/정서, 언어/의사소통, 인지력-학습, 사고, 문제 해결, 움직임/신체발달)에 대한 관찰정보를 수집 및 관리 모듈 구축하여 연령별 발달 정보를 수집함.
o 기질검사는 대다수가 설문조사로 이루어지는데 이는 양육자의 편향된 대답 때문에 정확하지 않은 기질·성격으로 분류될 가능성이 크고 아동을 대상으로 검사하는 경우 전문가의 판단에 의존하기 때문에 긴 시간과 높은 비용이 필요하므로 영상처리 기반 의사소통 감성 분석을 활용한 기질검사 모듈을 개발함.
o 맥박, 피부 전도반응 및 피부 온도를 통해 간접적으로 자율신경반응을 확인할 수 있으며 치료사와 아동의 상호작용 수준이 높은 경우, 양자 간의 자율신경반응 지표의 변화가 일치하는 경향을 보여 상호작용 분석을 위한 맥박, 피부 전도반응, 피부 온도 등을 수집하는 모듈 및 측정된 맥박, 피부 전도반응과 피부 온도 신호 분석을 위한 데이터 전처리, 신호 분석/지표 모델을 개발함.
o 시선 추적 장치(휴대용 아이트래커, 거치식 아이트래커 및 VR기기)를 이용하여 안구 움직임 영상정보를 수집하고 전문가를 통해 이벤트, 동작, 감정, 음성 또는 기타 관련 정보에 라벨을 지정하여 수동으로 수행하거나 시스템 자체가 인간 주석자로부터 레이블을 요청하는 능동 학습을 사용하는 기술을 통해 감정분석 라벨링을 수행함.
o 영유아/아동의 상담 영상을 이용하여 Dilated Convolution과 Coord Convolution 기술을 결합한 하이브리드 모델을 통해 강건한 안면 특징을 검출하고 수집한 시선추적 데이터를 활용하여 양자 또는 삼차 상호작용 요소(Partner-Oriented, PO; Object-Oriented, OO; Introspective, INT; Responding JA, RJA; Initiating JA, IJA)로 구분할 수 있는 구성도를 설계함.
o Face Landmark Detection을 이용한 얼굴 특징점 추출 및 얼굴 이미지 재정렬 기법 연구와 FACS 기반의 표정 변화 분류 모델 개발과 감정 인식을 위한 표현 규칙 정의 및 특징 Landmark의 변화량을 추적하여 사용자의 감정 분류 및 판별 기법을 개발을 통해 감정(분노, 혐오, 두려움, 행복, 중립, 슬픔, 놀라움)과 관련 있는 얼굴 특징점들을 이용한 동적 감정 분류 모델을 개발함.
o 학습 데이터 확보를 위한 비지도 학습 딥러닝 모델과 영유아의 특색 있는 행동 변화를 인지 및 빠른 Motion 변화에 관한 특징 학습을 위한 Gait 인식 기반 영상 식별 및 행동 특징 분류 모델 개발 및 t-SNE와 군집화 기반의 Vector 시각화를 통한 시간 흐름에 따른 영유아 행동 변화를 분류하는 패턴 분석 모델을 개발함.
o 발화 데이터를 텍스트로 변환하는 STT 엔진, Stable Diffusion 기반으로 하여 Stack-GAN, AttnGan 등을 Text-to-Image 모델 개발을 통해 언어장애 발화텍스트/이미지를 변환함.
o 음성 및 자연어 처리 기반 의사소통 감성 분석을 활용한 기질검사 모듈 개발을 위해 영유아/아동의 상담 음성을 이용하여 STT 기술을 활용해 텍스트데이터 BERT 활용한 문장 단위 감성 분석을 통한 다면적 기질/인성검사 시스템 구성도를 설계함.
딥러닝 기반 공정검사를 적용한 고품질 STP(Shielded-Twisted Pair) 이더넷 커넥터 자동 조립 설비 국산화 기술 개발
본 과제는 미래형 자동차 통신네트워크용 고품질 Shielded-Twisted Pair(STP) 이더넷 커넥터를 정밀 자동 조립하는 설비를 국산화하는 연구임.
연구 목표는 압착단자 위치 ≤0.1㎜, LVDT·Vision 반복공차 ≤10㎛, 컴퓨터비전 측정 정확률 ≥98%, 딥러닝 기반 불량 예측 정확률 ≥98% 달성에 있음. 핵심 연구 내용은 1차년도 Pre-Inspection 시스템 설계·제작 및 수집 데이터 기반 S/W 개발, 2차년도 자동 조립 시스템 설계·독자 제어 알고리즘 개발 및 딥러닝 기반 공정검사 시스템 구현임. 기대 효과는 수입대체 및 기능 추가/개조 비용 최소 20% 절감, 미래형 자동차용 하네스 자동화 설비의 안정적 공급과 신속 대응 체계 마련임.
딥러닝 기반 공정검사를 적용한 고품질 STP(Shielded-Twisted Pair) 이더넷 커넥터 자동 조립 설비 국산화 기술 개발
본 과제는 미래형 자동차용 통신네트워크 구축을 위한 고품질 STP(Shielded-Twisted Pair) 이더넷 커넥터를 자동으로 조립하는 설비를 국산화하는 연구임.
연구목표는 압착단자 위치 ≤0.1㎜, LVDT·Vision 반복공차 ≤10㎛, 컴퓨터비전 정확률 ≥98%, 딥러닝 기반 불량 예측 정확률 ≥98% 달성과 설비 C/T ≤16sec 확보에 있음. 핵심 연구내용은 1차년도 Pre-Inspection 시스템으로 조립 전 검사 데이터 수집 및 S/W 불량 예측 개발, 2차년도 독자 제어 설계·기구 설계 정립과 딥러닝 기반 공정검사 시스템으로 자동화 조립 성능을 구현하는 과정임. 기대효과는 수입 대체 및 비용·대응시간 절감, 외산 독점 설비 의존도 완화와 안정적 부품 공급체계 마련에 있음.
- 본 연구에서는 이미지 분류에서 뛰어난 성능을 보이는 CNN과 시계열 데이터 분석에 적합한 LSTM을 결합한 CNN-LSTM을 사용함.
- OCT 데이터에서 지역적인 특징을 추출하는데 효과적인 CNN에 장기 시계열 (Long-term Time Series) 데이터에서 발생할 수 있는 Gradient Descent 현상을 예방할 수 있게 해 주는 LSTM을 연결하여 시계열 데이터 학습에 적합하도록 구성함.
- CNN은 이미지를 처리하는 것에 특화되어 패턴을 식별하는데, Convolution Layer를 통해 특징을 추출하고자 하는 이미지의 특정 픽셀과 근접 픽셀과의 관계를 파악하며, Pooling Layer를 통해 추출한 특성 중 의미 있는 값을 Feature로 결정함. 마지막 층에 Fully Connected Layer를 연결하여 해당 Input 값이 어느 Class에 속하는지를 Softmax Function을 통해 도출함.
- LSTM(Long Short-Term Memory)이란 시계열 데이터의 예측 성능에 강점을 보이는 딥러닝 알고리즘임. LSTM은 기존 RNN 알고리즘의 장기 의존성(Long-Term Dependency)문제를 해결해 주면서 과거의 이벤트를 통해 미래 결과에 영향을 가질 수 있는 순환구조로 구축함.
- LSTM에서 핵심적인 개념은 셀 스테이트(The Cell State)와 세 종류의 게이트임. 셀 스테이트는 컨베이어 벨트와 같이 전체를 관통하여 연결되기 때문에 정보를 계속적으로 다음 단계에 전달함. LSTM은 여기에 게이트 (Gate)란 요소를 활용하여 정보를 더하거나 제거함. '포겟 게이트(Forget Gate)'는 셀 스테이트에서 어떤 정보를 버릴지 선택해주며, '인풋 게이트(Input Gate)'는 현재 정보를 업데이트할지 결정하는 역할을 함. 모형은 이러한 두 게이트를 통해 이전 셀스테이트를 얼마나 버릴지, 지금 입력과 이전 출력으로 얻어진 값을 얼마나 셀 스테이트에 반영할지 결정함. 최종적으로 '아웃풋 게이트(Output Gate)'는 얻어진 셀 스테이트를 어느 정도 반영할지 결정하여 원하는 값만 결과로 반영함.
- 임상학적으로 안질환의 심각도는 시간에 따라 다르게 나타나며, 따라서 OCT의 촬영영상을 판독한 심각도의 정도가 시간의 흐름에 따라 다르게 나옴. 이러한 임상학적 진단을 기반으로 본 연구에서는 딥러닝 기반 알고리즘인 CNN과 LSTM을 직렬 병합하여 OCT특정 영역에 대한 망막질환의 가능성과 심각성을 예측함.
[연차별 연구내용]
(1) 1차년도: 3D OCT 영상 DB구축, 라벨링 및 머신러닝 기반 기술 구현
- 국내외 대학병원 안과에서 3D OCT 영상 확보 및 DB 구축
- OCT 영상에 따른 진단명 라벨링을 위한 DB 구축
- 전이학습 기반 3D OCT 생성 기술 구현 및 성능 평가
- 전이학습 기반 영상 단일 질병 분류 기술 구현 및 성능 평가
- 3D OCT 영상 기반 영상 캡셔닝을 위한 딥러닝 모델 개발 및 성능평가
(2) 2차년도: 딥러닝 기반 3D OCT 영상 진단을 위한 세부 원천 기술 개발
- 3D 촬영영상 기반 황반부 이상 병변 검출을 위한 합성 영상 생성 기술 구현
- 병변 영역 추정 기반 3D OCT 촬영영상 단일 질병 분류 기술 구현
- 소견/병변을 포함한 촬영영상 기반 질병 진단 기술 구현
(3) 3차년도: 딥러닝 모델 융합 및 의료 진단 시스템 구축
- 병변 영역 추정 기반 합성 3D 촬영영상 생성 기술 구현 및 검증
- 병변 영역 추정 및 합성 3D 촬영영상 모델 기반 다중 질병 분류 기술 구현 및 검증
- 딥러닝 모델 융합 기반 3D 촬영영상의 질병 진단 기술 구현 및 검증
- 딥러닝 모델 융합 기반 대표 안구질환(당뇨성 망막증, 녹내장, 노인황반변성) 진단 기술 구현 및 검증
- 제안된 방법은 데이터 전처리 및 망막 이미지 분류 (훈련 및 테스트 단계)의 두 단계로 구성됨. 각 데이터 세트는 관심 영역 축소, 등 휘도 평면 대비 제한 적응형 히스토그램 등화, k- 폴드 교차 검증 및 데이터 증가 단계에 따라 전처리함.
- 전처리 단계에서 나온 각 트레이닝 세트는 트레이닝 설정으로 진행하여 각 데이터 세트에 대해 학습 가중치를 생성함 각 테스트 세트는 안질환 분류 테스트 결과를 제공하기 위해 트레이닝 단계에서 생성된 학습된 가중치로 예측함.
- 본 연구에서는 이미지 분류에서 뛰어난 성능을 보이는 CNN과 시계열 데이터 분석에 적합한 LSTM을 결합한 CNN-LSTM을 사용함.
- OCT 데이터에서 지역적인 특징을 추출하는데 효과적인 CNN에 장기 시계열 (Long-term Time Series) 데이터에서 발생할 수 있는 Gradient Descent 현상을 예방할 수 있게 해 주는 LSTM을 연결하여 시계열 데이터 학습에 적합하도록 구성함.
- CNN은 이미지를 처리하는 것에 특화되어 패턴을 식별하는데, Convolution Layer를 통해 특징을 추출하고자 하는 이미지의 특정 픽셀과 근접 픽셀과의 관계를 파악하며, Pooling Layer를 통해 추출한 특성 중 의미 있는 값을 Feature로 결정함. 마지막 층에 Fully Connected Layer를 연결하여 해당 Input 값이 어느 Class에 속하는지를 Softmax Function을 통해 도출함.
- LSTM(Long Short-Term Memory)이란 시계열 데이터의 예측 성능에 강점을 보이는 딥러닝 알고리즘임. LSTM은 기존 RNN 알고리즘의 장기 의존성(Long-Term Dependency)문제를 해결해 주면서 과거의 이벤트를 통해 미래 결과에 영향을 가질 수 있는 순환구조로 구축함.
- LSTM에서 핵심적인 개념은 셀 스테이트(The Cell State)와 세 종류의 게이트임. 셀 스테이트는 컨베이어 벨트와 같이 전체를 관통하여 연결되기 때문에 정보를 계속적으로 다음 단계에 전달함. LSTM은 여기에 게이트 (Gate)란 요소를 활용하여 정보를 더하거나 제거함. '포겟 게이트(Forget Gate)'는 셀 스테이트에서 어떤 정보를 버릴지 선택해주며, '인풋 게이트(Input Gate)'는 현재 정보를 업데이트할지 결정하는 역할을 함. 모형은 이러한 두 게이트를 통해 이전 셀스테이트를 얼마나 버릴지, 지금 입력과 이전 출력으로 얻어진 값을 얼마나 셀 스테이트에 반영할지 결정함. 최종적으로 '아웃풋 게이트(Output Gate)'는 얻어진 셀 스테이트를 어느 정도 반영할지 결정하여 원하는 값만 결과로 반영함.
- 임상학적으로 안질환의 심각도는 시간에 따라 다르게 나타나며, 따라서 OCT의 촬영영상을 판독한 심각도의 정도가 시간의 흐름에 따라 다르게 나옴. 이러한 임상학적 진단을 기반으로 본 연구에서는 딥러닝 기반 알고리즘인 CNN과 LSTM을 직렬 병합하여 OCT특정 영역에 대한 망막질환의 가능성과 심각성을 예측함.