About me
home
Portfolio
home

Towards Total Recall in Industrial Anomaly Detection

링크
연도
2022
인용 수
715
저널
IEEE/CVF
진행도
Wait
코드
키워드
Anomaly Detection
Unsupervised Learning

1. 중간 수준의 특징 패치 (Mid-level Features Patches):

딥러닝 모델(특히 CNN, Convolutional Neural Networks)은 이미지에서 다양한 수준의 특징을 추출해. 예를 들어, 첫 번째 층에서는 엣지(가장자리) 같은 저수준 특징을, 깊은 층으로 갈수록 더 복잡하고 추상적인 고수준 특징을 추출하게 돼.
여기서 "중간 수준의 특징"이란, 너무 단순하지도 않고 너무 추상적이지도 않은, 그 중간의 특징을 의미해. 이런 특징들은 이미지의 일부 패치(조각)에서 얻어지며, 예를 들어 특정 텍스처나 패턴 같은 것을 나타낼 수 있어.

2. 이미지넷 클래스에 대한 최소한의 편향 (Minimal Bias towards ImageNet Classes):

일반적으로 딥러닝 모델들은 ImageNet 같은 대규모 데이터셋으로 사전 학습을 시켜. 하지만 이 데이터셋은 일반적인 자연 이미지로 이루어져 있어서, 산업적 데이터(예: 제조업에서 찍힌 기계 부품 사진)와는 다를 수 있어.
따라서, 고수준 특징을 사용할 경우, 모델이 이미지넷에 맞춰진 특징들을 중심으로 판단을 하게 되어, 산업적 이미지에서는 정확하지 않을 수 있어. 하지만 중간 수준의 특징을 사용하면, 이런 자연 이미지 데이터에 대한 편향을 줄이고, 더 일반화된 특징을 사용할 수 있어.

3. 지역적 집합으로 공간적 문맥을 유지 (Feature Aggregation over a Local Neighbourhood):

이미지의 특정 패치에서 얻은 특징만 보는 것이 아니라, 그 패치 주변의 다른 패치들과의 관계도 고려해. 이를 통해, 특정 패치가 어느 정도 크기의 공간 내에서 의미가 있는지를 판단하게 돼.
예를 들어, 기계 부품에서 미세한 흠집이 있는지 확인할 때, 그 흠집이 있는 패치뿐만 아니라 주변 패치들도 함께 고려하면, 더 정확하게 이상 여부를 판단할 수 있게 돼.
"Coreset"은 큰 데이터 집합에서 중요한 하위 집합을 선택하는 기술을 의미해. Greedy Coreset Subsampling은 메모리 뱅크에서 중요한 정보만을 선택하고, 불필요하거나 중복된 정보를 제거하는 방법이다.
이 방법은 메모리 뱅크에 있는 패치들을 하나씩 살펴보면서, 기존에 선택된 것들과 비교해 새로운 정보를 제공하는 패치들만 선택해. 이를 통해 전체 메모리 뱅크의 크기를 줄이면서도 중요한 정보를 유지할 수 있어