CNN(2)

ResNet

레이어가 깊어질수록 성능이 떨어지는 현상이 발생 왜지? 아 optimization이 제대로 안 되니까 문제네!
그러면 optimization할 양을 줄이기 위한 방법이 뭐 없을까? → 자기 자신을 한 번더 가져와서 optimization의 양을 줄여보자.(그걸 residual block이라고 부름)
그래서 residual block을 추가했을때, 기존 plain한 구조에서는 오히려 depth가 깊어질수록 성능이 떨어지는 문제가 발생했는데, resnet구조로 바꾼 뒤에는 이를 해결하였다!
image classification 뿐만아니라 object detection에도 유용함

학자들이 CNN 성능을 높이고자 아래 4가지 요소를 기준으로 성능 변화를 실험함

근데 얘네를 늘린다고 그만큼 비례해서 성능이 좋아지는 것은 아님! 그렇다면 얘네를 독립적으로 조절해 실험하는것보다는 적절한 조합을 찾아서 compound scaling을 하자.

그니까 예시를 들어주자면, 호랑이를 분류하려고 만든 모델이 존재하고, 나는 고양이를 분류하고 싶을때, 처음부터 모델을 설계하는 것이 아닌 호랑이분류모델에 파라미터를 조정하여 고양이분류모델로 바꾸는 식

상황에 맞게 어디까지 fine-tuning 대상으로 삼을지를 결정해서 fine-tuning을 진행한다.

RNN (0)	2024.05.21
CNN (0)	2024.05.21

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`