TL;DR

  • Pinball Loss는 quantile regression에서 쓰는 비대칭 절대 오차 손실이다.
  • 에서는 절대오차의 절반이 되고, 평균 Pinball Loss에 2를 곱하면 MAE가 된다.
  • 를 낮추면 낮은 분위 예측을 학습한다.

Pinball Loss

Pinball Loss 또는 Quantile Loss는 특정 분위수 를 추정하기 위한 손실 함수다.

여기서 이다.

일반 정의

Pinball Loss는 과소예측과 과대예측에 서로 다른 계수를 적용한다.

  • : 양쪽 계수가 같아지고 가 된다. 따라서 평균 Pinball Loss에 2를 곱하면 MAE가 된다.
  • : 과대예측 항의 계수가 상대적으로 커져 낮은 분위 예측을 학습한다.
  • : 과소예측 항의 계수가 상대적으로 커져 높은 분위 예측을 학습한다.

따라서 “어느 분위의 예측값을 학습할 것인가” 를 정하는 파라미터다.

예를 들어 실제값이 100이고 예측값이 90이면 과소예측 오차는 10이다. 에서는 손실이 이고, 에서는 다. 높은 는 과소예측에 더 큰 페널티를 준다.

일반 시계열에서의 사용

Pinball Loss는 점 예측 하나보다 특정 분위수 예측 또는 예측 구간이 필요한 시계열 문제에서 사용한다. 선택한 는 모델이 조건부 분포의 어느 위치를 예측할지 정한다.

비용 구조가 비대칭인 문제에서는 평균이나 중앙값보다 특정 quantile forecast가 더 적절할 수 있다.

수요 예측에서의 사용

수요 예측에서 Pinball Loss는 예측 구간, 서비스 레벨, 비대칭 운영 비용을 반영할 때 유용하다. 예를 들어 결품 비용이 폐기 비용보다 크면 높은 quantile을, 과대 발주 비용이 더 크면 낮은 quantile을 선택할 수 있다.

right-skewed(오른쪽 꼬리가 긴) 소매 수요에서는 낮은 가 작은 실제값 구간의 과대예측을 줄여 MAPE를 낮출 수 있다. 다만 예측이 전체적으로 실제 수요보다 낮아지면 Forecast Bias는 음수가 된다.

한계

  • 선택한 가 목표 quantile 또는 비용 구조와 다르면 낮은 손실값이 좋은 의사결정을 보장하지 못한다.
  • 수요 예측에서 낮은 는 과대예측 항의 손실 계수를 키워 낮은 분위 예측을 유도한다. 이 예측은 작은 실제값에서 MAPE를 낮출 수 있지만, 전체적으로 실제 수요보다 낮은 예측을 반복해 음수 Forecast Bias를 만들 수 있다.
  • quantile 모델은 반드시 MAE, WAPE, Forecast Bias와 함께 평가해야 한다.

Connections

  • MAE pinball loss는 절대오차의 절반이다.
  • MAPE — right-skewed(오른쪽 꼬리가 긴) 수요에서는 낮은 quantile이 작은 실제값 구간의 과대예측을 줄일 수 있다.
  • Forecast Bias — quantile 선택으로 생기는 과대예측/과소예측 경향을 확인한다.
  • WAPE — 운영 총량 기준의 보조 평가 메트릭.