DY N DY

VoTT: Visual Object Tagging Tool 사용방법/후기 본문

PARK/영상처리 관련

VoTT: Visual Object Tagging Tool 사용방법/후기

손세지 2017. 12. 13. 22:16

머신러닝/딥러닝을 하는데 역시 가장 공수가 많이 드는 일은... 데이터 labeling이 아닐까 싶다.


이런툴 저런툴 만들어서, 얻어다가 사용해 봤는데, 최근 darknet을 사용하게 되면서 framework 별로 사용하는 데이터 format이 다른데... 이런것까지 지원하는 annotation tool이 어디 없을까 하다가 예전 cntk를 보던 중 얼핏 봤던 VoTT (Visual Object Tagging Tool)을 다운받아 사용해 보았다.


마소도 역시.. 깃헙에 다 올린다. ( VoTT github )

대충 설명은... 이걸로 태깅을 하고 모델을 트레이닝 시키고.. 에러 수정하고 약간 semi-auto tagging..? 도 된다고 하는것 같다. 

https://github.com/Microsoft/VoTT/releases

위의 url에서 릴리즈 패키지를 받을 수 있고, 압축해제 후 바로 실행 가능하다.

window, osx를 지원하며 포스팅 날짜 기준(2017-11-V1.0.8) linux는 아직 지원하지 않는다.


사용법은 매우 간단한데,


첫 실행화면으로 이미지가 있는 폴더나 영상을 선택한다. (드래그도 된다고 한다.)


github 이미지가 비디오를 선택했을 경우를 먼저 설명하면

몇프레임마다 뽑을 것인지

boundingbox 종류 (rectangle, squre로 고정할것인지 아닌지)

Tracking, Copy Last Frame 선택 (캠시프트 방법을 이용해 자동으로 이전프레임의 boundingbox를 옮길 것인지 그대로 카피할 것인지)

Enable SCD(Scene Change Detection) 이 옵션은 트레킹하다가 FP(false positive)를 방지하기 위해 뭘 하는데 체크하면 느려진다.

클래스 이름을 , 로 (cat, dog, horse, person 과 같이) 나누어 입력한 후


아래는 이미지를 선택했을 경우


바운딩박스를 그리면 된다.


아래는 이미지를 선택한 경우. 비디오와 거의 동일하다.



모두 완료한 후에는 Object Detection ->Export Tags을 클릭하고,


원하는 format으로 뽑아내면 된다. (현재 지원되는 format이 3종류정도 된다. darknet용으로 뽑는데 많은 도움이 되었다.


조금더 디테일한 사용법은 사용하면서 차차 익힐 수 있을 것 같고, 기본적인 사용법은 위에 설명한 것에서 크게 벗어나는 것이 없어서 사용하기 편리했다.