반응형 Programming/Deep Learning Network19 [Model] MobileNet v1 개발자로서 스트레스를 많이 받는 것 중 하나는 수행 속도입니다. 특히, AI 그리고 Deep Learning에서의 처리 속도 개선은 어려운 작업 중 하나입니다. 이와 관련된 고민들을 통해 만들어진 MobileNet에 대해 간단하게 설명해보고자 합니다. 보통 개발자 입장에서 AI라고 하면 가장 먼저 떠오르는 것들 중 하나는 GPU일 것입니다. 2016년 이세돌과 대결했던 알파고는 GPU대신 48개의 TPU를 사용했고 판후이와의 대결에서는 1202개의 CPU와 176개의 GPU를 사용했다고 합니다. 즉, 엄청난 컴퓨팅 파워를 사용해야 쓸만한 뭔가가 나온다는 얘기가 되는 것이죠. 그러나 현실에서는 위와 같은 컴퓨팅 파워를 갖기에는 한계가 있습니다. 자동차, 드론, 스마트폰과 같은 환경에서는 GPU는커녕, 기껏.. 2023. 2. 21. [Model] Grad-CAM Model 내부에서 Object Detection등과 같은 연산을 진행할 때, 어느 곳이 활성화되어서 Detection을 수행하는지에 대해 확인할 수 있는 방안이 필요할 수도 있습니다. 이를 위한 Grid-CAM 부분을 정리하고자 합니다. CAM 학습 이미지와 이에 대한 Label만 있는 상황에서 DL Model이 Image의 어느 부분을 보았는지를 알고 싶을 때, 학습 이미지와 이에 대한 Bounding Box만 있는 상황에서 각 Pixel에 대한 Label을 알고 싶을 때가 있습니다. 위와 같은 상황은 학습할 이미지에 대한 정보보다 예측해야 할 정보가 더 디테일한 경우라고 할 수 있고, 이를 Weakly Supervised Learning이라고 하는데, 이는 CAM을 통해서 알 수 있습니다. CAM은.. 2023. 2. 15. [Model] ResNet Object Detection, Keypoint Detection, 이외의 Prediction 및 Classification 기능을 수행하는 AI를 개발할 때 많이 활용되는 구조인 ResNet에 대해 다뤄볼 예정입니다. ResNet으로 널리 알려진 이 구조는 2015년 MicroSoft에서 개발한 알고리즘으로 정식 게재된 논문 명은 “Deep Residual Learning for Image Recognition”입니다. 2014년 GoogLeNet이 22개의 층으로 구성된 것에 비해 ResNet은 152개의 층을 가진다. 7배 깊어진, 급속도로 깊어진 Model입니다. ResNet에 대한 논문은 다음 링크에서 확인할 수 있습니다. Deep Residual Learning for Image Recogni.. 2023. 2. 13. [Deep Learning] GAN(Generative Adversarial Network)이라는 것에 대하여. Deep Learning Network의 종류 중의 하나인 GAN에 대해서 정말 간략하게 설명하고자 합니다. GAN이란, Generative Adversarial Network의 약자로 적대적 생성 신경망이라고 합니다. 단어가 좀 애매하지만, 결론적으로는 Generator와 Discriminator의 어떠한 상호 적대적 관계를 통해 Real에 가까운 무언가를 생성해내는 모델이라 볼 수 있습니다. GAN을 활용한 몇 가지 사례는 다음과 같습니다. FaceBook에서 개발한 Real-eye-opener입니다. 이는 순간적으로 눈을 감은 채 찍힌 이미지에 가짜 눈을 생성하여 마치 눈을 뜨고 찍힌 것처럼 만드는 기술입니다. 다음은 CycleGAN이라고 하여 Image Translation에 적용한 사례입니다. .. 2023. 1. 9. 이전 1 2 다음 반응형