주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
인용수 0
·
2026Retraction Note: Stabilized Performance Maximization for GAN-based Real-Time Authentication Image Generation over Internet
Joo Yong Shim, Soyi Jung, Joongheon Kim, Jong‐Kook Kim
IF 3 (2026)
Multimedia Tools and Applications
https://doi.org/10.1007/s11042-026-21504-2
Maximization
The Internet
Authentication (law)
Image (mathematics)
2
Article
|
인용수 4
·
2025CroMe: Multimodal Fake News Detection Using Cross-Modal Tri-Transformer and Metric Learning
Eunjee Choi, Junhyun Ahn, XinYu Piao, Jong‐Kook Kim
IF 3.6 (2025)
IEEE Access
멀티모달 가짜 뉴스 탐지는 최근 들어 점차 더 많은 관심을 받고 있다. 기존 방법들은 단일 모달 데이터를 각각 독립적으로 인코딩하는 데 의존하며, 고급 기법을 통해 모달 내 관계를 포착하고 모달 간 유사성을 통합하는 이점을 간과한다. 이러한 문제를 해결하기 위해, 멀티모달 가짜 뉴스 탐지를 위한 크로스-모달 트라이-트랜스포머(Cross-Modal Tri-Transformer)와 메트릭 러닝(Metric Learning, CroMe)을 제안한다. CroMe는 고정된 이미지 인코더와 대형 언어 모델을 인코더로 사용하여 Bootstrapping Language-Image Pre-training(BLIP2-OPT)을 활용함으로써 상세한 텍스트, 이미지 및 결합된 이미지-텍스트 표현을 포착한다. 메트릭 러닝 모듈은 프록시 앵커(proxy anchor) 방법을 사용하여 모달 내 관계를 포착하고, 특징 융합 모듈은 Cross-Modal 및 Tri-Transformer를 사용하여 효과적인 통합을 수행한다. 최종 가짜 뉴스 탐지기는 융합된 특징을 분류기에 입력하여 콘텐츠의 진위 여부를 예측한다. 데이터셋에 대한 실험 결과, CroMe는 멀티모달 가짜 뉴스 탐지에서 뛰어난 성능을 보였다.
https://doi.org/10.1109/access.2025.3633841
Encoder
Metric (unit)
Bootstrapping (finance)
Classifier (UML)
Multimodal learning
Feature (linguistics)
Feature extraction
Fake news
3
Article
|
인용수 9
·
2023Audio-to-Visual Cross-Modal Generation of Birds
Joo Yong Shim, Joongheon Kim, Jong‐Kook Kim
IF 3.4 (2023)
IEEE Access
음성 및 시각 양식 데이터는 많은 분야에서 정밀한 조사를 수행하는 데 필수적인 요소이다. 때로는 시각 데이터를 얻기 어려운 반면 청각 데이터는 쉽게 이용 가능하다. 이 경우, 음성 데이터를 이용해 시각 데이터를 생성하는 것은 매우 유용할 수 있다. 본 논문은 새로운 오디오-투-비주얼 크로스모달 생성 접근법을 제안한다. 제안하는 사운드 인코더는 청각 데이터의 특징을 추출하고, 생성 모델은 그 음성 특징을 사용하여 이미지를 생성한다. 이 모델은 (i) 타당한 특징 표현과 (ii) 생성된 이미지와 음성 입력 간의 연관성을 학습하여 사실적이며 잘 분류된 이미지를 생성할 것으로 기대된다. 본 연구를 위해 10종의 서로 다른 조류 종의 소리와 이에 대응하는 이미지를 포함하는 새로운 데이터셋인 Audio-Visual Corresponding Bird(AVC-B) 데이터셋을 수집하였다. 실험 결과, 제안된 방법은 분류에 적합한 이미지를 생성할 수 있으며 최신 기술(state-of-the-art) 방법보다 더 나은 분류 성능을 달성함을 보여준다.
https://doi.org/10.1109/access.2023.3257565
Computer science
Audio visual
Modal
Artificial intelligence
Encoder
Feature (linguistics)
Pattern recognition (psychology)
Representation (politics)
Visualization
Speech recognition
4
Article
|
인용수 13
·
2023Enabling Large Batch Size Training for DNN Models Beyond the Memory Limit While Maintaining Performance
XinYu Piao, DoangJoo Synn, Jooyoung Park, Jong‐Kook Kim
IF 3.4 (2023)
IEEE Access
최근의 딥러닝 모델은 큰 배치 크기로 학습하기가 어렵다. 이는 보급형 기기가 모델과 큰 데이터 배치 크기를 모두 수용할 만큼의 충분한 메모리를 갖추지 못할 수 있기 때문이다. 배치 크기는 학습 모델에서 사용되는 하이퍼파라미터 중 하나이며, 배치 크기는 모델을 업로드한 뒤 남는 메모리에만 들어갈 수 있으므로 대상 기기의 메모리 용량에 의존하고 그 범위 내에서 제한된다. 또한 데이터 항목의 크기도 중요한 요인인데, 각 데이터 항목의 크기가 커질수록 남은 메모리에 들어갈 수 있는 배치 크기는 더 작아지기 때문이다. 본 논문은 이러한 문제를 해결하기 위한 Micro-Batch Processing (MBP) 방법을 제안한다. 이 방법은 하나의 배치를 남은 메모리에 들어갈 수 있는 크기로 분할한 뒤 이를 순차적으로 처리하는 배치 처리 방식을 제공함으로써 딥러닝 모델의 학습을 돕는다. 소형 배치를 각각 처리한 후, 성능을 유지하기 위해 그라디언트 누적(gradient accumulation)을 기반으로 한 손실 정규화 알고리즘을 사용한다. 본 방법의 목적은 메모리 크기를 증가시키거나 다수의 장치(GPUs)를 사용하지 않고도, 시스템의 메모리 용량을 초과하는 더 큰 배치 크기로 딥러닝 모델을 학습할 수 있게 하는 것이다.
https://doi.org/10.1109/access.2023.3312572
Computer science
Batch processing
Normalization (sociology)
Artificial intelligence
5
Article
|
인용수 8
·
2022Feature Based Sampling: A Fast and Robust Sampling Method for Tasks Using 3D Point Cloud
Jung-Woo Han, Dong-Joo Synn, Taehyeong Kim, Hae-Chun Chung, Jong‐Kook Kim
IF 3.9 (2022)
IEEE Access
포인트 클라우드 데이터셋은 LIDAR와 같은 센서가 자율주행차와 드론을 포함한 여러 응용 분야에서 손쉽게 활용될 수 있기 때문에, 기계가 현실 세계를 인지하는 데 빈번히 사용된다. PointNet 및 PointNet++은 포인트 클라우드를 해석하기 위한 널리 사용되는 포인트 단위 임베딩 방법이다. 그러나 PointNet을 기반으로 한 최신 모델이라도 실시간 추론은 여전히 어려운 과제로 남아 있다. 더 빠른 추론을 위한 해결책으로는 샘플링이 있는데, 샘플링은 다음 모듈에서 계산할 포인트의 수를 줄이는 방법이다. Furthest Point Sampling(FPS)은 널리 사용되지만, 느리고 핵심 포인트를 선택하기 어렵다는 단점이 있다. 본 논문에서는 주의(attention) 기법을 적용한 새로운 샘플링 방법인 Feature-Based Sampling(FBS)을 제안한다. 그 결과, 정확도는 기존 방법들과 유사하면서도 학습 시간과 추론 시간이 유의미하게 단축됨을 확인하였다. 추가 실험을 통해, 제안된 방법이 핵심 포인트를 보존하거나 중요하지 않은 포인트를 폐기하는 데 더 적합함을 보여준다.
https://doi.org/10.1109/access.2022.3178519
Computer science
Point cloud
Inference
Sampling (signal processing)
Artificial intelligence
Feature (linguistics)
Embedding
Speedup
Data mining
Pattern recognition (psychology)