목록PARK/용어정리 (6)
DY N DY
오래간만의 포스팅. 요즘 딥러닝을 이용한 여러 Object Detection 알고리즘을 구경하는데, 대부분 NMS (non-maximum suppression)을 사용하여 연산량을 줄이고, mAP도 올리는 효과를 본다고 한다. 물론 필수로 필요한 것은 아니나 확실히 성능향상에 도움이 되는 것 같다. 사실 생각해보면 별건 아니었는데, 예전 영상처리에서 특히 canny edge detector같은데서 보았던 NMS와 헷갈려서... 이해하는데 시간이 꽤나 걸렸다. 사실 비슷한? 거의 동일한 방법인데, 픽셀이나 바운딩박스냐에 따라 나뉘는 것 같다. 일반적으로 영상에지를 찾기 위한 NMS는 현재 픽셀을 기준으로 주변의 픽셀과 비교했을 때 최대값인 경우 그대로 놔두고, 아닐 경우(비 최대) 억제(제거)하는 것이다...
Markov Random Field 공부하다가... 몰라서 또 다른거 검색하고 계속 다른것 검색하다가 본 단어. 대략적으로는 아는 것인데 iid라고 쓰니 못알아들었다.. 독립 동일 분포 라고도 한다는데 각각의 random variable들이 독립 + 동일한 확률분포를 가지는 분포를 뜻한다. 이렇게 보면 조금 어려울 수 있겠지만 우리가 평소 생각하는 동전, 주사위 던지기 같은것을 생각하면 어렵지 않다. 던지기를 N번 했을 때 각각 던졌을 때의 random variable은 서로 독립적이며, 동전은 앞/뒤가 나올 확률이 각각 1/2로 같고 주사위도 1/2/3/4/5/6이 나올 확률이 각각 1/6으로 같기 때문에 N개의 각 variable들은 독립, 동일 분포를 따른다고 할 수 있다.
정밀도와 재현율 위키 확률 통계쪽 분야에서 사용한다고 들었는데, 영상쪽에서는 주로 인식률에 대한 지표로 사용한다.이를 알기 위해 먼저 네가지 지표를 알아야 하는데 아래 표와 같다. TP(True Positive), FP(False Positive), FN(False Negative), TN(True Negative)표를 보면 어렵지 않다. 객체 인식률을 확인한다고 하였을 때,1. TP : 객체가 있는데 정확히 인식한 경우2. FN : 객체가 있으나 인식하지 못한 경우3. FP : 객체가 없음에도 인식한 경우4. TN : 객체가 없는데 인식하지 않은 경우(사실 인식에서는 계산하기가.. )그림이 있다면 설명이 더 편해질 것 같다. (추후 추가 예정) 실제 정답 True False 실험 결과 Positive ..
머신러닝 뿐만 아니라 영상처리 영역에서도 자주 사용되는 추측값에 대한 정확성 측정 방법. 간단히 말하면 오차의 제곱에 대해 평균을 취한 것이다. 작을 수록 원본과의 오차가 적은 것이므로 추측한 값의 정확성이 높은 것. 식은 다음과 같다. 위키 한눈에 알아보기도 쉽고, 계산하기도 쉬우므로 추정한 값에 대한 정확도 측정을 위해 많이 사용된다. 머신러닝 영역에서는 Cost Function에서 주로 사용되고,영상 화질 개선영역에서는 원본대비 화질을 측정하는 PSNR에서 사용된다. 이것을 기본으로 최소평균제곱오차, 평균제곱근오차 등이 있다. 더 자세한 것은 위키에서..
유클리드 거리 또한 컴퓨터공학분야를 공부하다 보면 들어봄직한 용어. 한글위키영어위키 짤막해서 둘다 볼만 하다. 맨하탄 거리 (http://dyndy.tistory.com/158) 에서도 같은 그림을 사용했지만 녹색과 같은 최단거리가 유클리드 거리이다. 수학에서 흔히 말하는 두 점 사이의 거리를 계산할 때 쓰이는 방법이다. L2거리(L2 Distance) 라고도 한다. 거리 계산은 아래와 같다. {\displaystyle {\begin{aligned}\mathrm {d} (\mathbf {p} ,\mathbf {q} )=\mathrm {d} (\mathbf {q} ,\mathbf {p} )&={\sqrt {(q_{1}-p_{1})^{2}+(q_{2}-p_{2})^{2}+\cdots +(q_{n}-p_{n}..
딥러닝 또는 영상 신호처리 등 뿐만 아니라 컴퓨터공학분야를 공부하다 보면 한번쯤 들어볼 수 있는 용어. 한글 위키에도 잘 정리되어 있다. 영어 위키그림에서 보았을 때(위키 그림) 빨간색, 노란색, 파란색이 모두 맨하탄 거리이다. 19세기의 수학자 헤르만 민코프스키가 고안한 용어. 택시거리, L1거리, 시가지 거리라고도 함. 이렇게 불리는 이유는 맨하탄 시가지의 건물이 아주 잘 정비되어있기 때문이 아닌가 싶다. 구글의 맨하탄 사진 계산하는 공식도 상당히 간단하다. 그냥 평면위에서 (x1, y1)과 (x2, y2)사이의 맨하탄 거리를 계산하는 공식은 |x1-x2| + |y1-y2| 그저 x끼리 차이의 절대값 + y끼리 차이의 절대값이다. 이걸 지도로 보면 더 명확하다. 그냥 갈 수 있는 거리로 갔을 때의(맨..