최근 딥러닝 기술은 고정밀도 모델로 인해서 정확도가 높아지고 있으나, 복잡한 네트워크의 깊이와 파라미터의 수 증가로 인해서 연산에 필요한 자원 소모 및 프로세싱 시간이 증가한다. 이러한 네트워크 복잡도는 IoT 시스템 및 모바일 시스템과 같은 임베디드 시스템에서 딥러닝 연산을 수행하는 오버헤드가 된다. 따라서, 양자화와 같은 경량 시스템에 맞는 딥러닝 모델을 위한 경량화 연구가 많이 이루어져 왔다. 양자화를 적용하면 정확도 손실이 많이 발생하기 때문에 파라미터를 혼합해서 사용하는 Mixed Precision 적용이 대안이 되고있다. 본 논문에서는 임베디드 시스템에서 Mixed Precision 기반의 CNN 딥러닝 모델의 추론 연산 방식을 구현하였으며, Mixed Precision 적용에 대한 성능 분석을 하였다. 실험 결과, 연산 복잡도가 높은 몇몇 계층에 양자화를 적용하면 정확도의 손실을 줄이면서 추론 시간이 14%~20%가량 줄어듦을 확인할 수 있었다.