Vision transformer (original) (raw)

비전 변환기(Vision transformer) 또는 비전 트랜스포머는 이미지 처리를 하는 변환기이다. 2020년 "An image is worth 16x16 words" 논문에 의해 이미지를 단어처럼 처리하면 어떨까 하는 아이디어에서 시작되어, 분야에 따라 종래의 합성곱 신경망과 비슷한 성능을 내고 있다. 잘 알려진 프로젝트로는 , ResNet, DenseNet, Inception 등이 있다.

thumbnail