변동성 측정 — 범위, 분산, 표준 편차, 변동 계수

가변성은 데이터 세트의 평균값을 중심으로 데이터가 분산되는 방식에 대한 아이디어를 제공합니다. 데이터가 얼마나 멀리 분산되어 있는지 알 수 있습니다. 예를 들어 우리가 매일 일어나는 시간은 범위에 따라 다릅니다. 너무 많은 변동성은 낮 동안 다른 이벤트에 영향을 미치고 결과가 좋지 않을 수 있습니다. 마찬가지로 식당에서 가장 좋아하는 요리가 많이 다르면 좋아하지 않을 것입니다. 이 변동을 측정 할 수 있습니다. 다음은 예입니다.

중심 경향의 3 가지 척도처럼 우리는 많은 변동 척도를 가지고 있습니다.

  1. 범위
  2. 변화
  3. 표준 편차
  4. 변동 계수 / 상대 표준 편차
  1. 범위 : 범위는 분포의 가장 간단한 매개 변수이며 데이터 포인트가있는 범위, 즉 최소값과 최대 값 사이를 알려줍니다. 위 분포의 범위는 (62.0, 78.5)입니다.
  2. 분산 : 분산은 평균 주변의 데이터 포인트 분산을 나타냅니다. 위 분포의 평균은 69.09888입니다. 위 그래프는 아래 데이터 세트의 시각화입니다.

표본 분산 공식은 다음과 같습니다 (모집단 공식을 사용하지 않음).

위의 데이터 세트에 대해 s2 = 6.484943 inch2를 얻습니다. 보시다시피 분산은 각 데이터 포인트 X1 X2 X3… Xn과 M을 자유도 즉, 즉. N-1.

참고 : Variance는 값을 제곱 단위, inch2로 제공하는데 이는별로 의미가 없습니다.

3. 표준 편차 : 매우 큰 데이터 세트에서 대부분의 경우 분산 값이 너무 커서 계산하기 어렵습니다. 따라서 우리는 분산의 제곱근을 취합니다. 이를 표준 편차라고합니다. 표준 편차를 계산하는 공식은 분산의 제곱근 일뿐입니다. 따라서

위 데이터 세트의 경우 s = 2.546555입니다.

4. 상대 표준 편차 / 변동 계수 : 데이터 세트의 평균에 대한 상대적 표준 편차입니다. 더 나은 단위 덜 분산 측정은 분산 계수입니다. 변동 계수는 표준 편차를 표본의 평균으로 나누어 얻습니다. 데이터 세트의 상대 표준 편차는 0.03675069입니다.

참고 : 분산 및 표준 편차 모두 우리의 경우 인치 단위를가집니다. 서로 다른 단위의 두 데이터 세트의 분산을 비교해야하는 시나리오를 상상해보십시오. 따라서 이러한 상황에서는 분산 계수가 선호됩니다.

Suggested posts

첫 번째 데이터 과학 대시 보드를 만드는 동안 배운 5 가지 교훈

첫 번째 데이터 과학 대시 보드를 만드는 동안 배운 5 가지 교훈

최근에 저는 여러 Excel 또는 CSV 파일, 다양한 jupyter-notebook, python 스크립트 및 Excel 요약을 중심으로 모든 개인 금융 분석 및 문서를 구성하는 데 지쳤습니다. 그래서 모든 데이터 처리, 집계 및 시각화를 한 곳에서 수행하고 필요한 모든 정보가 간단하고 쉬운 방법으로 표시되는 단일 대시 보드를 구축하기로 결정했습니다.

실패에 대한 CDO (Chief Data Officer) 설정을위한 5 가지 전략

실패에 대한 CDO (Chief Data Officer) 설정을위한 5 가지 전략

소개 CDO (Chief Data Officer) 역할은 CXO 판테온에서 새로 부여 된 역할입니다. Fortune 500 대 기업 중 68 % 이상이 CDO 역할을 맡고 있다고보고했습니다.

Related posts

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

고유 분해 및 SVD에 유용한 기저의 선형 대수 개념 이해이 기사에서는 고유 분해 또는 특이 값 분해 (SVD)와 같은 행렬 분해 방법을 이해하는 흥미로운 방법 인 기저 개념에 대해 알아 봅니다. 정의 기본은 벡터 공간 (벡터 집합)을 설명하는 데 사용되는 좌표계입니다.

판다와 에라스무스 연구 교환 분석

판다와 에라스무스 연구 교환 분석

Erasmus 프로그램 2011-12에서 발생한 20 만 개의 연구 교환으로 데이터 세트를 분석 한 결과 1987 년 이후 Erasmus 프로그램은 매년 수십만 명의 유럽 학생들에게 한 학기 또는 1 년을 해외에서 보낼 기회를 다른 유럽에서 보낼 수있는 기회를 제공합니다. 경제적 인 지원뿐만 아니라 쉬운 교환 과정을 제공합니다. 유럽의 다양한 사람, 언어 및 문화에 대한 마음과 마음을 열어주는 정말 귀중한 경험입니다.

데이터 과학을위한 8 가지 기본 통계 개념

… 평범한 영어로 설명

데이터 과학을위한 8 가지 기본 통계 개념

통계는 "수량 데이터의 수집, 분석, 해석 및 표현을 다루는 수학의 한 분야"입니다. 프로그래밍과 기계 학습을 혼합하면 데이터 과학의 핵심 기술에 대해 꽤 잘 설명 할 수 있습니다.

데이터 과학의 9 가지 거리 측정

일반적인 거리 측정의 장점과 함정

데이터 과학의 9 가지 거리 측정

감독되거나 감독되지 않는 많은 알고리즘은 거리 측정을 사용합니다. 유클리드 거리 또는 코사인 유사성과 같은 이러한 측정은 종종 k-NN, UMAP, HDBSCAN 등과 같은 알고리즘에서 찾을 수 있습니다.