본문 바로가기

Review

CVPR 2020 동향 분석

**************** 목차 ****************
1. CVPR2020 Wordcloud 분석
2. CVPR2019 vs. CVPR2020
3. ICCV2019 vs. CVPR2020
4. 의견
***************************************

1. Word cloud 분석

CVPR 2020 word cloud

특정 산업과 기술의 트렌드를 파악하기 위한 방법 중 하나로 중요 저널/컨퍼런스에 발표된 논문의 제목들을 이용해 통계를 내는 방법이 있습니다. 이번 글에서는 CVPR 2020에 발표된 논문들을 통해 컴퓨터 비전 연구 관련 트렌드가 어떤지 살펴보도록 하겠습니다.

보다 직관적인 시각화를 위해 CVPR 2020 메인 섹션의 논문 제목을 이용해 Word cloud와 각 단어별 그래프를 만들어보았습니다. Word cloud 형태는 저희 회사와 어울리는 로켓으로 표현해보았습니다. 키워드를 통해 중요 연구 토픽을 알아보는 게 본 시각화의 목적이므로 일반적으로 흔하게 사용되는 단어들은 제외했습니다.
(images, via, neural, using, deep, visual, object, learning, video, convolutional 등)

이를 제외한 나머지 단어들의 통계를 통해 CVPR 2020에서 발표된 논문들의 트렌드를 분석해보겠습니다. 대략적으로 아래와 같이 그룹을 나누어 정리할 수 있습니다.

- 큰 크기 : Graph, Human, Face, Pose, Semantic, Point
- 중간 크기 : Domain, Scene, Adaptive, Attention, Shape, Single, Feature, Efficient
- 작은 글씨 : Joint, Motion, Action, Generative, Instance, Depth, Reconstruction, semi-supervised, Person

이러한 키워드를 통해서 기술 및 산업 흐름이 어떤지 유추해볼 수 있습니다. 상세한 분석은 뒷부분 섹션에서 파악하기로 하고 여기서는 큰 그림을 파악하기로 합니다.

  • 요즘은 거의 완성 단계라 생각되는 Face 관련 연구는 아직도 활발합니다. 다른 키워드들과 조합해 볼 때 가상의 얼굴을 생성하거나 복원 부분에 연구가 이루어질 것으로도 유추해볼 수 있습니다.
  • Graph, Pose 키워드를 보아 여러 개의 Pose 관련 논문과 오픈소스 코드가 공개된 후로 꾸준히 Pose에 대한 연구가 이루어지고 있다는 걸 짐작할 수 있습니다. 아마도 영상을 이해하는 부분에서는 행동이 중요하므로 Pose에 대한 연구가 많이 이루어지는 것 같습니다. 밑에 Action, Motion, Depth 키워드와 함께 유추해도 행동 인식 분야가 활발히 진행 중인 것을 볼 수 있습니다. 또한 Gaph 키워드는 Pose 추정뿐만 아니라 Graph Neural Network에 대한 학계의 관심이 커졌다고도 해석할 수 있습니다.
  • Semantic, Adaptive, Attention, Efficient, Feature 등의 키워드로 볼 때 이제 한정적 자원에서 효율적으로 필요한 정보를 뽑아 사용하는 방향으로 많이 연구가 되고 있다는 것을 확인할 수 있습니다. 아무래도 실제 환경에서 연구된 내용을 적용하려면 해당 연구들이 많이 중요하기 때문인 것 같습니다.
  • Point, Shape, Depth 등의 키워드로 볼 때 요즘 각광 받고 있는 자율주행으로 인해 해당 분야에 유용한 기술들이 많이 연구되고 있음을 유추할 수 있습니다.

2. CVPR2019 vs. CVPR2020

이번에는 작년과 비교했을 때 어떤 차이들이 있는지 살펴보도록 하겠습니다.

CVPR 2019 (왼쪽) vs. CVPR 2020 (오른쪽)

'왼쪽 비행기' 모양이 CVPR2019 word cloud 이고 '오른쪽 로켓' 모양이 CVPR2020 word cloud 입니다. 2019년도에 보이는 키워드로는 Adversarial, Detection, Pose, Semantic, Action, Estimation, Point  등이 있습니다. 작년에는 GAN 과 검출의 시대 였다면 올해 2020년에는 Graph, Pose, Point 등으로 볼 때 행위 인지 와 3D의 시대라고 봐야겠습니다.

2019년도와 2020년도 사이에서 제 눈에 띄는 다른 큰 차이는 '비행기 머리' 부분에는 'Supervised' 가 있는데 '로켓 머리' 부분에는 'semi-supervised' 가 있다는 점 입니다. 점차 Data는 많아지는데 Annotation이 힘들다 보니 연구의 방향이 semi-supervised로 넘어가는 것 같은데 이러다가 곧 Unsupervised 로 바뀔 날이 올지도 모르겠습니다.

3. ICCV2019 vs. CVPR2020

이번 CVPR2020 에서 가장 가까운 2019년 10월에 진행한 ICCV2019와 비교하면 어떤지 확인해 보겠습니다.

ICCV 2019 (왼쪽) vs. CVPR 2020 (오른쪽)

CVPR2019 (비행기모양) 에서는 GAN 과 검출의 시대였는데 불과 5개월 뒤에 열린 ICCV 2019에서는 검출이 더 강해지고 Pose, Point, Doamin, Depth 라는 단어가 눈에 띕니다. 확실히 2019년엔 검출 관련 연구가 많이 진행되었습니다. 그 이후로 2019년 연말로 가면서 ICCV 2019 에서는 3D, 행위와 관련된 연구가 많이 진행되는 추세로 바뀌는 게 보였고 이번 CVPR2020에서는 3D, Pose 관련 키워드가 두드러지는 것을 확인할 수 있습니다.

작년부터 점점 커지거나 꾸준히 상위에 랭크되는 Adaptation, Adaptive, Domain 단어들을 볼 때 점점 real-world 에 적용될 수 있는 기술들이 주목 받는 것 또한 관찰할 수 있습니다.

이번 포스팅에서는 기술적 흐름을 보기 위해서 Image와 Video 키워드를 지웠지만, 점점 Video 관련 연구가 많아지는 것도 눈여겨 볼만 합니다.

4. 의견

  • Semi-supervied, Domain 등의 단어가 점점 눈에 띄는 것으로 보아, 앞으로 real-world의 문제를 해결하기 위해 필요한 한정된 라벨이 주어진 환경에서의 연구와 데이터셋 구축 사업 등이 점차 많아질 것 같습니다.
  • Real-world 문제를 해결하기 위해 점점 효율적인 모델을 만드는 방향으로 연구가 진행되고 있고 그에 따라 하드웨어도 발전하고 있으므로 실제 현장에서 사용할 만한 기술들과 모델이 많아질 것으로 보여집니다. 관련 업체들은 이러한 기술 공유의 황금기에 각자의 현업에 어떻게 이러한 기술들을 잘 녹여낼지 고민해야겠습니다.
  • 기존에 인기가 많았던 검출과 더불어 3D, 행위 인지 쪽 기술이 늘어나고 있는 것으로 볼 때, 한정된 공간을 모니터링을 하면서 상황을 인지/분석하는 분야가 커질 것으로 예상됩니다. 특히 최근 코로나 때문에 판데믹이 선언된 상황에서 이러한 모니터링 기술이 점점 중요해질 것으로 보입니다.

[##최형욱##]