HP50
HP10
•
빨간 선 아래의 가장 가까운 점 4개를 이상값으로 고려해서 성능 확인해봤는데 성능 떨어짐 해당 4개의 값은 정상값이다.
HP20(TPYE1)은 다 정상값으로 처리
HP30
우선 약자로 AT가 해낼 수 있는 최고 성능은 다음과 같다. → 95.8%
남은 시간 우리가 접근할 수 있는 일은 hyperparameter tuning이다.
•
batch size 조절하여 반드시 위의 시각화 표와 csv를 비교하여 추가적으로 분류하는 이상값을 찾아야한다.
•
모델 파라미터 숫자를 줄여서 실험을 진행하였는데 분류하는 이상값의 차이가 없었다.
•
win-size를 정확히 이해하여 win_size 조절을 통한 모델 아웃풋 차이(시각화)를 비교해야한다.
Batch size : 1 - > 정상은 정상에 가깝게 이상은 이상에 가깝게 배치를 하는데 과연… 확실히 정상과 이상값 간격을 넓혀준다! → 여기서 비율 조절하면 더 성능 올라갈 거 같긴 한디… 그 98퍼는 대체 어떻게 도달한걸까….(모델링? 데이터 엔진.. 접근..?)
HP20(1)
HP50(3)
여기에 이상값 정상값 섞여있다!!! → 대략 7개 정도 바꿨는데 성능이 유지 혹은 감소!
HP30(04567)
정상같으면서 정상 아닌 위의 분포들….
HP10(TYPE2)
선에 걸쳐있는 것들 정상값
CHECKPOINTS
라벨링 아웃풋 값!
여기서 한 개만 고쳐주면(ratio 조절만 해주면 됩니다!) 다시 SOTA인데 추후 공유하겠습니다!
SOTA 0.9605793854 모델!
HP20
HP50
•
여기서 ratio 조절해서 상단의 그림으로 threshold 올렸더니 ours SOTA 달성
•
숨어있는 이상치 값 찾아야한다!!!
•
시각화하면서 ratio 맞추는거 추천!!
HP30
HP10
•
threshold 바로 아래에 눈에 잘 보이는 4개의 점은 정상값!
CHECKPOINTS
제출 csv
모델은 공유 드라이브 활용!
요약 정리
•
제출된 csv 값과 비교하면서 어디 부분이 다르는지 도표와 함께 보면 모델 이해하기 더 편하다.
•
이것만 건들었을 때 0.960~~ → 0.947
•
0.956
•
layer 3→ 6으로 늘렸는데 조금 더 구분하기 쉬워짐
•
고려해볼 사항은 threshold 기준으로 3과 비교했을 때 멀어진 점이 있는 반면에 고정되는 점이 있었다. 해당 점이 이상치인 걸로 알 수 있을까…?
•
이거 0419_real_final임 기존보다 4개 다르다!