트레이닝 이미지 샘플 Set

Deep Learning 도구는, 네트워크 데이터를 공급하고 기계가 학습된 데이터로부터 어떠한 것을 달성할 수 있는지 추론하도록 가르치는 딥러닝에 기반하고 있습니다. 그러므로, 네트워크에 공급되는 데이터가 극히 중요합니다. 그래서, "내가 네트워크에 무엇을 학습시키고 있는가?"라는 질문을 스스로 해봐야 합니다.

사용자가 네트워크에 학습시키는 것은 트레이닝 이미지 샘플 Set에 기초합니다. 트레이닝 이미지 샘플 Set는 사용자가 네트워크에 공급하는 데이터를 대표합니다. Deep Learning 도구에서 이미지는 도구를 학습시키기 위해 이용되는 데이터 Set의 근간입니다. 딥러닝에서는 방대한 데이터가 시스템에 공급되며, 시스템은 우리가 달성하고자 하는 바가 무엇인지 데이터로부터 추론합니다. 그러므로, 데이터(이 context에서는 이미지)가 극히 중요합니다.

딥러닝의 영역에서, 트레이닝 이미지 Set는 네트워크에 전달되는 데이터를 대표합니다. 트레이닝 이미지 Set를 구성할 때 다음을 검토하십시오.

트레이닝 이미지 Set가 런타임 이미지를 대표하는가? 여기에는 다음이 포함됩니다.
- 조명 – 조명의 변동이 있다면, 트레이닝 Set는 런타임에 예상되는 조명의 변동을 포함해야 합니다.
- 컬러 – 런타임에 부품의 컬러이 변경될 것입니까? 그렇다면, 모든 컬러 변동을 포함해야 합니다.
- 회전/크기 – 부품이 카메라 앞에 올 때, 회전되거나 크기가 조정됩니까? 그렇다면, 이러한 변동도 포함해야 합니다.
- 부품별 변동 – 검사되는 부품에 미묘한 변동이 있다면, 이러한 변동도 트레이닝 Set에 포함해야 합니다.
- 배경 – 부품 이미지는 책상에서 캡처되는 경우가 많습니다. 하지만, 실제 부품은 컨베이어 벨트에서 이동하는데, 이는 Deep Learning 도구의 입장에서는 훨씬 흥미 있는 배경입니다. 이러한 경우에는, 트레이닝 Set를 컨베이어 벨트에서 얻어야 합니다. 또한, 배경이 검사에 중요하지 않다면, 마스크로 지울 수 있습니다. 배경을 마스크로 지우면, 네트워크에게 관련 없는 정보에 대한 교육을 시키지 않아도 되므로 일반적으로 성능이 향상됩니다.
트레이닝 이미지 Set가 충분한 데이터를 제공하는가? Deep Learning 도구 프로그래밍 시 많이 발생하는 문제는, 이미지와 데이터를 더 많이 제공한 후 도구를 다시 트레이닝시킴으로써 해결할 수 있습니다.

Tip: 이미지에 주석을 달거나 (예 : "good", "bad"등) 파일 이름에 설명 정보를 제공하면 이미지 라벨링 프로세스의 속도를 높일 수 있습니다.

이미지를 범주화하고 수집하면, 이미지 샘플 Set를 만들 수 있으며, 이를 트레이닝 Set에 이용할 수 있습니다.