DEVIEW 2019 : Operational AI 발표 정리(2)

Review/Seminar

hu-nie 2021. 8. 21. 21:45

글또 두 번째 포스팅에 이어 Operational AI 후반부 내용을 정리하였습니다.

해당 발표는 Makina Rocks의 김기현 님이 발표하셨습니다.

모델 학습 후 배포가 끝?

Challenges in Lifelong Learning

AI를 Real World로 가져오기 위해서 실행/운영 측면의 문제들이 있음
- 비효율적인 레이블링테스트 데이터가 없을수도 있음
- 실행 주체가 일원화되어 있지 않음
- 테스트 데이터가 없을 수도 있음
- Catastrophic forgetting

Operational AI

실행/운영 측면의 문제들을 해결하기 위한 AI기술
- Active Learning
- Continual Learning
- Sanity Check
- Auto-Report, Auto-Intergration

Challenges : No Test Set

Various Sanity Check : Pseudo Test Set

합성을 통한 이상 데이터를 생성(Synthetic Anomalous)를 통해 성능에 대한 Proxy를 구함
- 화이트 노이즈만을 통해 데이터를 만들 순 있지만 실제로는 생기지 않는 데이터
- 따라서, Mnist에는 없지만 손글씨와 비슷한 형태를 띄는 데이터가 필요함
- Pseudo Anomalous 를 만들어냄
- 이를 통해 AUROC 값을 구하였는데 Ground-truth AUROC와 높은 상관관계가 있었고, 임계값을 구하는 데에도 용이하였음.

Challenges : Who runs the system?

Continual Learning

옛 지식을 잊지 않으면서 새로운 지식을 학습하는 AI
Incremental Training : 새로운 데이터만을 사용, 기존 모델 재학습
- 이전 데이터로부터 학습한 내용을 잊어버리는 현상인 Catastrophic Forgetting
Inclusive Training : 전체 데이터를 사용하여 모델을 새롭게 학습
- 전체 데이터에 대한 학습은 Scalability Issue가 있음

Model Archining

데이터에 따른 여러 모델을 만들어 문제 해결을 시도
- 데이터가 늘어남에 따라 모델도 늘어나는 구조
- 테스트 과정에서는 전체 모델을 구현하고 전체 모델별 Anomaly Score가 산출
  - 이때, 하나의 모델이라도 정상이라고 한다면 정상으로 간주
- 데이터가 지속적으로 생기면서 모델도 늘어나면 추론시간이 길어짐