통계 심슨의역설(Simpson’s Paradox)
개념 심슨의 역설은 데이터의 상세 그룹에서 나타나는 평균, 추세 등과 이를 전체 그룹화 시켜서 평균, 추세 등을 비교 해보면 서로 상반되거나 다른 결론에 이룰 수 있다는 역설이다. 좀 더 간단하게 표현해 보자면
개념 심슨의 역설은 데이터의 상세 그룹에서 나타나는 평균, 추세 등과 이를 전체 그룹화 시켜서 평균, 추세 등을 비교 해보면 서로 상반되거나 다른 결론에 이룰 수 있다는 역설이다. 좀 더 간단하게 표현해 보자면
chebishev’s Rule 체비셔프 부등식 : $P(| x- \mu | < k \sigma) = P[\mu -k \sigma < x < \mu +k \sigma] \geq 1 - \frac{1}{k^2}$ chebishev’s Rule에 의하면, ...
데이터 분석시 많이 발생하는 것이 단위의 불일치 이다. 이에 대한 해결로는 정규화(Normalization)과 표준화(Standardization)이 있다.이 스케일링 방법은 단위가 다를 때 대상 데이터를 같은 기준으로 보도록 한다.
범주형 자료의 표현 방법
자료의 표현 및 Data Visualization
통계의 자료의 요약 방법에 대해 알아본다.
통계 용어중 정확도(Accuracy)와 정밀도(Precision)에 대해서 알아보자
통계의 자료는 측정도구 등에 따라 달라지고 그 분류에 따라 처리 방식이 달라 진다.