이학연 교수 연구실 | 서울과학기술대학교 본교(제1캠퍼스) 산업공학과-산업정보시스템전공/ITM(IT Management)전공

Data & Business Innovation LAB

서울과학기술대학교 본교(제1캠퍼스) 산업공학과-산업정보시스템전공/ITM(IT Management)전공 이학연 교수

텍스트 임베딩

임베딩 역추론

기술기회 분석

이학연 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

홈

Data & Business Innovation LAB

서울과학기술대학교 본교(제1캠퍼스) 산업공학과-산업정보시스템전공/ITM(IT Management)전공 이학연 교수

Data & Business Innovation LAB은 산업공학과-산업정보시스템전공/ITM(IT Management)전공에 속한 연구실로, 머신러닝과 빅데이터 분석을 활용한 다양한 연구를 수행하고 있습니다. 최근에는 학습자 맞춤형 지식 상태 분석 및 문제 추천 시스템 개발, B2B 사업 환경 분석을 위한 정보 처리 분석 시스템 개발, 텍스트 기반 기술동향정보의 분석을 위한 그래프 학습 및 링크 예측 방법론 개발 등 다양한 프로젝트를 진행하였습니다. 또한, 대학의 산학연구 역량 빅데이터 분석, 오픈소스 프로젝트 데이터 기반 인공지능 나우캐스팅, 희귀 의약품 해외 라이센싱을 위한 기술가치평가 등 다양한 분야에서 성과를 내고 있습니다. 2023년에는 특허 토픽 기반 메타버스 기술 프레임워크와 디지털 헬스케어 기술 구조 분석 등의 논문을 발표하였으며, 2022년에는 스마트 제조 국가연구개발 랜드스케이프와 패션 산업 단발성 유행 탐지 등의 연구를 진행하였습니다. 연구실은 지속적으로 전략적 기술획득을 위한 테크놀로지 어낼리틱스와 경제성 평가 모형 개발 및 적용 연구를 통해 산업계와의 협력을 강화하고 있습니다.

텍스트 임베딩임베딩 역추론기술기회 분석네트워크 임베딩사용자 선호 추적

대표 연구 분야

연구 영역 전체보기

임베딩 역추론 기반 기술기회·시장 화이트스페이스 발굴 연구

Technology Opportunity and Market Whitespace Discovery via Embedding Inversion

연구 분야 상세보기

임베딩 역추론 기반 기술기회·시장 화이트스페이스 발굴 연구

Technology Opportunity and Market Whitespace Discovery via Embedding Inversion

연구 분야 상세보기

선호 추적과 사용자 유형화 기반 개인화 추천 연구

Personalized Recommendation via Preference Tracing and User Type Modeling

연구 분야 상세보기

데이터사이언스 기반 전자제조 및 건물형 태양광 운영 인력양성 연구

Data Science–Based Training for Electronics Manufacturing and Building-Integrated PV Operations

연구 분야 상세보기

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

6총합

5개년 연도별 피인용 수

11총합

주요 논문

5

논문 전체보기

1

article

|

인용수 2

·

2025

Translate patent vacancies into human-readable texts: Identifying technology opportunities with text embedding inversion

Sungsoo Lee, Hyoduk Shin, Hakyeon Lee

IF 9.9 (2025)

Advanced Engineering Informatics

특허 맵에서 공백(vacancies)을 찾아 기술 기회를 식별하려는 시도는 다수 이루어져 왔으나, 발견된 특허 공백의 기술적 내용을 명확히 해석할 수 없다는 근본적인 한계는 여전히 해결되지 않은 문제로 남아 있다. 본 연구는 기계 학습 기법을 활용하여 특허 맵으로부터 기술 기회를 도출하기 위한 새로운 생성(generative) 접근법을 제안한다. 제안된 접근법은 고차원 임베딩을 원래의 데이터 형태로 복원하는 임베딩 역전(embedding inversion) 기법을 사용하여, 특허 공백을 사람이 읽을 수 있는 텍스트로 변환한다. 이 과정은 5단계로 이루어진다: 1) 텍스트 임베딩 모델을 사용하여 특허 초록을 고차원 벡터로 변환하고, 2) 오토인코더를 학습하여 고차원 임베딩을 2차원 공간으로 투영하며 양방향 매핑을 가능하게 하고, 3) 커널 밀도 추정(kernel density estimation)을 이용해 격자 기반 특허 맵을 구성하며, 4) 공백 셀과 그 좌표를 특허 공백으로 식별하고, 5) 디코더를 사용하여 공백 좌표를 고차원 임베딩 벡터로 재구성한 뒤, vec2text를 통해 사람이 읽을 수 있는 텍스트를 생성한다. 제안된 접근법을 시연하기 위해 수집된 17,616건의 특허를 대상으로 LiDAR 기술에 관한 사례 연구를 수행하였다. 결과는 제안된 접근법이 특허 공백을 성공적으로 식별하고 이를 사람이 읽을 수 있는 텍스트로 변환할 수 있음을 검증하였으며, 이는 기술 기회 분석을 위한 매우 실용적이고 유용한 도구로서의 잠재력을 시사한다.

https://doi.org/10.1016/j.aei.2025.103661

Embedding

Inversion (geology)

Computer science

Information retrieval

Artificial intelligence

Biology

Paleontology

2

article

|

·

인용수 1

·

2025

From knowledge tracing to preference tracing: Capturing dynamic user preferences for personalized recommendation

Jungmin Hwang, Hakyeon Lee

IF 6.3 (2025)

Electronic Commerce Research and Applications

https://doi.org/10.1016/j.elerap.2025.101527

Tracing

Preference

Computer science

Human–computer interaction

Recommender system

Information retrieval

Mathematics

Operating system

Statistics

3

article

|

·

인용수 0

·

2025

Navigating the AI technology landscape from GitHub data

Jaemyoung Choi, Sungsoo Lee, Hakyeon Lee

IF 12.5 (2025)

Technology in Society

https://doi.org/10.1016/j.techsoc.2025.103090

GRASP

Source code

Coding (social sciences)

Software

Reuse

Graph

Cluster analysis

최신 정부 과제

15

과제 전체보기

1

2023년 5월-2027년 12월

|1,410,587,000원

건물형 태양광산업 생태계 대응 전문 인력 양성

[최종목표]o 탄소중립과 에너지산업 고도화를 선도할 수 있는 전문지식과 현장경험을 겸비한 “건물형 태양광산업 생태계 대응 전문 인력 양성” - 응용 분야 연계 지식 교육을 통한 건축-태양광 융합 시장에 능동적으로 대응하는 융합인력 양성 - 참여 대학별 특화 분야 전문교육 + 대학 간 교차 교육으로 유동적 대응 가능 융합인력 양성 - 기업 에로기술 해결...

태양광시스템

건물일체형 태양광시스템

인력양성

전력변환

시스템 운영 및 유지보수

2

주관|

2021년 5월-2024년 2월

|43,426,000원

오픈소스 프로젝트 데이터 기반 인공지능 나우캐스팅

AI 나우캐스팅 절차는 1) DB 구축, 2) 연관관계 측정, 3) 나우캐스팅의 세 가지 단계로 구성된다. 1) DB 구축: 인공지능 관련 키워드 검색을 통해 깃허브에서 AI 프로젝트 Repo를 추출하고 (약 50만 개 이상), 웹크롤링 및 API를 이용하여 Owner, Repo, Topics, Intro, Date, Language, Contributor, Fork 등 다양한 종류의 데이터를 수집하여 AI 프로젝트 DB를 구축한다. 2) 연관관계 측정: Repo/Owner/User/Topic 등 다양한 수준에서의 연관관계 및 유사성을 측정하여 인접행렬(adjacency matrix)을 생성하며, 이때 연관관계는 첫째, Co-contribution, Co-word, Co-library 등 동시 발생(co-occurrence) 관점, 둘째, 코드 수정 및 가져오기와 관련한 Pull Request 및 Fork 활동 등의 지식 흐름(knowledge flow) 관점, 셋째, Readme 등 텍스트 데이터를 대상으로 토픽 모델링 및 워드 임베딩을 통해 문서 간 유사성을 측정하는 의미 유사성(semantic similarity) 관점의 세 가지 측면에서 분석된다. 3) 나우캐스팅: 인접행렬로부터 네트워크 시각화, 클러스터링 및 중심성, 브로커리지 분석 등을 통해 현황을 파악한 후, Graph Neural Network 및 Node2Vec 등 그래프 임베딩 기반 링크 예측(link prediction)을 통해 단기 변화를 예측한다. 나우캐스팅은 기술(T), 생태계(E), 서비스(S) 세 가지 모듈별로 수행된다. [모듈 T] AI 기술 나우캐스팅은 Repo 네트워크 및 Keyword 네트워크를 통해, 최신 AI 기술 구조 및 분포, 현황을 파악하고, 새롭게 출현하는 유망 AI 분야를 도출하며, AI 클러스터 진화 구조 예측을 바탕으로 AI 기술의 유망 및 쇠퇴 분야, 융합 및 분화를 예측한다. [모듈 E] AI 생태계 나우캐스팅은 Developer 네트워크 및 Company 네트워크를 통해, 개발자간 협업 생태계의 구조 및 변화를 분석하고, AI 기술 개발에 기여하고 있는 개발자 그룹 및 핵심 개발자를 추출하여 인재 발굴 및 채용과 연계하며, AI 생태계를 주도하고 있는 기업 간 지식 흐름 및 공동 개발 현황을 파악함으로써 AI 연구개발 및 기술전략 수립에 활용한다. [모듈 S] AI 서비스 나우캐스팅은 Tech-Service 네트워크 및 APP 네트워크를 통해, AI 활용 서비스 부문과 그에 활용되는 기술 간의 연관관계를 파악하고, AI 애플리케이션 간의 Trigger-Action 관계를 분석 및 예측하여, AI 애플리케이션 디자인 및 서비스 기회를 탐색한다.

인공지능

나우캐스팅

깃허브

오픈소스

기술예측

기술기획

그래프 임베딩

링크 예측

개방형 혁신

3

주관|

2021년 5월-2024년 2월

|48,386,000원

오픈소스 프로젝트 데이터 기반 인공지능 나우캐스팅

AI 나우캐스팅 절차는 1) DB 구축, 2) 연관관계 측정, 3) 나우캐스팅의 세 가지 단계로 구성된다. 1) DB 구축: 인공지능 관련 키워드 검색을 통해 깃허브에서 AI 프로젝트 Repo를 추출하고 (약 50만 개 이상), 웹크롤링 및 API를 이용하여 Owner, Repo, Topics, Intro, Date, Language, Contributor, Fork 등 다양한 종류의 데이터를 수집하여 AI 프로젝트 DB를 구축한다. 2) 연관관계 측정: Repo/Owner/User/Topic 등 다양한 수준에서의 연관관계 및 유사성을 측정하여 인접행렬(adjacency matrix)을 생성하며, 이때 연관관계는 첫째, Co-contribution, Co-word, Co-library 등 동시 발생(co-occurrence) 관점, 둘째, 코드 수정 및 가져오기와 관련한 Pull Request 및 Fork 활동 등의 지식 흐름(knowledge flow) 관점, 셋째, Readme 등 텍스트 데이터를 대상으로 토픽 모델링 및 워드 임베딩을 통해 문서 간 유사성을 측정하는 의미 유사성(semantic similarity) 관점의 세 가지 측면에서 분석된다. 3) 나우캐스팅: 인접행렬로부터 네트워크 시각화, 클러스터링 및 중심성, 브로커리지 분석 등을 통해 현황을 파악한 후, Graph Neural Network 및 Node2Vec 등 그래프 임베딩 기반 링크 예측(link prediction)을 통해 단기 변화를 예측한다. 나우캐스팅은 기술(T), 생태계(E), 서비스(S) 세 가지 모듈별로 수행된다. [모듈 T] AI 기술 나우캐스팅은 Repo 네트워크 및 Keyword 네트워크를 통해, 최신 AI 기술 구조 및 분포, 현황을 파악하고, 새롭게 출현하는 유망 AI 분야를 도출하며, AI 클러스터 진화 구조 예측을 바탕으로 AI 기술의 유망 및 쇠퇴 분야, 융합 및 분화를 예측한다. [모듈 E] AI 생태계 나우캐스팅은 Developer 네트워크 및 Company 네트워크를 통해, 개발자간 협업 생태계의 구조 및 변화를 분석하고, AI 기술 개발에 기여하고 있는 개발자 그룹 및 핵심 개발자를 추출하여 인재 발굴 및 채용과 연계하며, AI 생태계를 주도하고 있는 기업 간 지식 흐름 및 공동 개발 현황을 파악함으로써 AI 연구개발 및 기술전략 수립에 활용한다. [모듈 S] AI 서비스 나우캐스팅은 Tech-Service 네트워크 및 APP 네트워크를 통해, AI 활용 서비스 부문과 그에 활용되는 기술 간의 연관관계를 파악하고, AI 애플리케이션 간의 Trigger-Action 관계를 분석 및 예측하여, AI 애플리케이션 디자인 및 서비스 기회를 탐색한다.

인공지능

나우캐스팅

깃허브

오픈소스

기술예측

기술기획

그래프 임베딩

링크 예측

개방형 혁신

맞춤형 인사이트 리포트

연구실의 전체 데이터를 활용한 맞춤형 인사이트 리포트

연구 트렌드부터 공동 연구 방향성 기획까지

연구실과 같이 할 수 있는게 무엇인지,
지금 바로 확인해보세요

무료 리포트 확인하기

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)