연구 영역 | 이원석 교수 연구실 | 연세대학교 컴퓨터과학과

이원석 교수 연구실

서비스 플랜

연구실 검색

프로젝트 공고

정부 과제 추천

AI 기반 기업 서칭

홈

기본 정보

연구 분야

프로젝트

논문

구성원

연구 영역

대표 연구 분야

연구실이 가장 잘하는 대표 연구 분야

데이터베이스 시스템 및 데이터 스트림 처리

이 연구 주제는 대규모 데이터베이스 시스템의 효율적 저장, 검색, 질의 처리, 그리고 지속적으로 유입되는 데이터 스트림의 실시간 분석 기술을 핵심으로 한다. 연구실의 전반적인 이력과 학술 활동을 보면 데이터베이스시스템과 데이터베이스 자체가 가장 중심적인 정체성으로 나타나며, 특히 연속 질의 처리, 다중 질의 최적화, 데이터 큐브, OLAP, 분산 환경에서의 통합 뷰 관리 등 기초와 응용을 함께 다루는 연구 흐름이 뚜렷하다. 이는 전통적인 정적 데이터베이스를 넘어, 시간에 따라 빠르게 변하는 온라인 데이터 환경에 적응하는 지능형 데이터 처리 기반을 구축하려는 방향으로 이해할 수 있다. 구체적으로는 온라인 데이터 스트림에서 빈발 항목 집합을 추적하거나, 연관규칙을 실시간으로 탐색하고, 메모리 제약이 큰 환경에서도 안정적으로 동작하는 처리 구조를 설계하는 연구가 포함된다. 또한 연속 질의의 공유 처리, 선택 조건의 실행 순서 최적화, 다중 조인 질의 처리, XML 스트림 질의, 온·오프라인 분석을 연결하는 통합 실행 환경 등은 데이터 처리 성능을 높이기 위한 핵심 방법론이다. 이러한 연구는 대용량 로그, 센서 데이터, 네트워크 데이터, 웹 데이터처럼 실시간성과 확장성이 중요한 환경에서 매우 큰 의미를 갖는다. 이 분야의 기대효과는 다양한 산업 데이터의 즉시성 있는 해석과 의사결정 지원에 있다. 교통, 네트워크 모니터링, 사용자 로그 분석, 미디어 추천, 스마트 환경 서비스 등 실제 응용 사례가 다수 확인되며, 최근의 빅데이터 자동화 분석 프로젝트와도 자연스럽게 연결된다. 결국 이 연구는 고성능 데이터 관리와 실시간 분석 역량을 결합하여, 방대한 데이터를 빠르게 이해하고 활용할 수 있는 차세대 데이터 인프라를 만드는 데 기여한다.

데이터베이스데이터스트림연속질의질의최적화실시간분석

데이터 마이닝, 빈발패턴 분석 및 지능형 응용

이 연구 주제는 데이터로부터 반복적 패턴과 의미 있는 연관성을 발견하고, 이를 실제 문제 해결에 활용하는 데이터 마이닝 연구를 중심으로 한다. 연구실의 저서인 연관규칙 및 빈발항목 집합분석, 다수의 국제학회 발표, 그리고 경로 패턴·구매 패턴·웹 로그·트위터 토픽·센서 데이터에 대한 연구 실적은 패턴 마이닝이 연구실의 오랜 핵심 축임을 보여준다. 단순히 알고리즘 개발에 머무르지 않고, 발견된 패턴을 실제 서비스나 예측, 추천, 이상 탐지, 상황 인지 문제로 확장하는 점이 특징이다. 방법론 측면에서는 빈발 항목 집합 탐색, 연관규칙 생성, 서브스페이스 클러스터링, 이상행위 탐지, 토픽 모델링, 프로파일링, 사용자 행동 분석 등 다양한 분석 기법이 활용된다. 특히 이동 객체 데이터나 교통 CCTV 로그로부터 경로 영역을 학습하는 특허는 패턴 마이닝이 공간·시간 데이터 분석으로 확장되고 있음을 보여준다. 또한 구매 시점 예측, 웹 로그 기반 트렌드 분석, 사용자 맞춤형 추천, 로봇 내비게이션을 위한 상황 인지, 네트워크 트래픽 모니터링 등은 데이터 마이닝 기술이 실제 환경의 의사결정 시스템과 긴밀히 연결될 수 있음을 입증한다. 향후 이 연구는 빅데이터 자동화 분석과 결합해 더 높은 활용도를 가질 수 있다. 데이터 전처리부터 통계 분석, 머신러닝 모델링, 시각화까지 자동화하는 최근 프로젝트는 기존의 패턴 탐색 경험을 보다 사용하기 쉬운 분석 플랫폼으로 발전시키는 기반이 된다. 따라서 이 연구 주제는 대규모 데이터에서 숨은 구조를 찾고, 그것을 예측·추천·탐지 기능으로 전환하는 실용적 지능 분석 연구로서 연구실의 경쟁력을 잘 보여준다.

데이터마이닝연관규칙빈발패턴클러스터링추천시스템

프라이버시 보호 데이터 분석 및 비식별 데이터 품질 평가

이 연구 주제는 개인정보를 포함한 데이터의 안전한 활용을 위해 비식별화와 재식별 위험 평가, 그리고 데이터 활용 품질 측정을 함께 다루는 분야이다. 연구실의 특허와 학술발표를 보면 비정형 트랜잭션 비식별 데이터의 품질 측정, 재식별 위험성 분석, k-익명성 보장 비식별 빅데이터의 빈발패턴 정확도 향상, 차분 프라이버시 모델의 노이즈 파라미터 분배 등 프라이버시 보호 데이터 분석에 대한 지속적인 관심이 확인된다. 이는 데이터 활용과 개인정보 보호 사이의 균형을 과학적으로 설계하려는 연구 방향으로 해석할 수 있다. 핵심 접근은 비식별 데이터가 실제로 얼마나 안전한지, 그리고 원본 데이터의 분석 가치를 얼마나 유지하는지를 동시에 정량화하는 데 있다. 연구실이 제안한 개인 중복도 기반 검증, 원본과 비식별 레코드 간의 통계적 유사성 측정, 빈발패턴 결과의 보정 기법 등은 단순한 익명화 수준을 넘어서 데이터의 실질적 품질을 평가하는 체계로 볼 수 있다. 이와 함께 트랜잭션 데이터, 로그 데이터, 집계 데이터 등 다양한 비정형 데이터 유형을 고려하는 점은 현실적인 데이터 거버넌스 문제에 적합하다. 이 연구의 중요성은 공공 데이터 개방, 의료·금융 데이터 활용, 기업 데이터 협업 등 민감정보가 포함된 데이터 생태계 전반에서 더욱 커지고 있다. 비식별 처리가 과도하면 분석 가치가 떨어지고, 반대로 보안 수준이 낮으면 재식별 위험이 커지기 때문에 정교한 품질-보호 균형 설계가 필요하다. 연구실의 접근은 안전성과 활용성을 함께 고려하는 실용적 프레임워크를 제공하며, 향후 자동화된 데이터 분석 플랫폼에서도 신뢰 가능한 데이터 활용 기준을 제시하는 기반 기술로 발전할 가능성이 높다.

비식별화재식별위험차분프라이버시데이터품질개인정보보호

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)