상관관계란?상관관계의 정의상관관계 해석상관관계의 한계① 관측치별로 중요도가 같을까?② 상관관계가 높으면 좋을까?상관계수 올바르게 사용하기상관관계란?상관계수는 연속형 변수간 상관성을 확인하기위해 사용되는 통계치 입니다. 상관관계 분석을 통해서 두 변수간 관계의 방향성과 강도를 파악할 수 있어 많이 사용합니다. 상관관계의 정의와 일부 단점에 대해서 살펴보도록 하겠습니다.상관관계의 정의우선, 변수XXX와 YYY의 상관계수(ρ\rhoρ)의 정의는 아래 수식으로 표현됩니다.ρX,Y=Cov(X,Y)σXσY\rho_{X,Y} = \frac{Cov(X,Y)}{\sigma_{X} \sigma_{Y} }ρX,Y=σXσYCov(X,Y)Cov(X,Y)Cov(X,Y)Cov(X,Y)는 공분산을 의미하고σX\sigm..
모델의 종류와 상관없이 해석을 할 수 있는 방법들에 대해 살펴보고자 한다.1. 필요성Model Interpretability모델의 결과를 자연스럽게 납득 시켜주는 수단으로서 필요모델 개선을 위한 수단으로서 의미를 지님ex) 자율 주행차의 사고원인ex) 특정 인자에 따른 편향 파악Balck Box Model입력값을 통해 출력값을 도출할 수 있지만, Interpretability가 낮은 모델Ensemble, NN기반 모형등은 복잡한 문제에 대해 높은 성은을 보이지만 해석력은 떨어지는 대표적인 블랙박스 모델2. Model-Agnostic Method일반적인 모델을 Black Box 모델로 생각하여, 모델 내부에 접근하지 않고 모델 input과 output을 조절하며 그 변동에 대해 해석하는 방법Permutat..