Python으로 확률 분포를위한 모멘트 생성 함수

Python의 완전한 파생 및 코드 예제를 사용하여 확률 분포를위한 모멘트 생성 함수에 대해 알아보기

출처 : Pexels

저자 : Pratik Shukla, Roberto Iriondo

이 튜토리얼의 코드는 Github 및 전체 구현뿐만 아니라 Google Colab 에서 사용할 수 있습니다 .

목차 :

  1. 통계의 순간.
  2. 원시 순간.
  3. 중심 순간.
  4. 표준화 된 순간.
  5. 순간 생성 기능.
  6. 순간 생성 기능 증명.
  7. 원시 모멘트와 중심 모멘트 간의 관계 유도.
  8. Python 구현.

통계의 순간이란 무엇입니까?

일반적으로 통계, 기계 학습 , 수학 및 기타 분야 에서 모멘트를 사용 하여 분포의 특성을 설명합니다.

관심 변수가 X라고 가정하고 순간은 X의 기대 값입니다. 예 : E (X), E (X²), E (X³), E (X⁴),… 등.

그림 1 : 통계의 순간.

통계의 순간 :

1) 첫 번째 순간 : 중심 위치 측정.

2) 두 번째 순간 : 분산 / 확산 측정.

3) 세 번째 순간 : 비대칭의 측정.

4) 네 번째 순간 : 특이 치 / 꼬리의 측정.

이제 우리는 첫 번째 순간 (평균)과 두 번째 순간 (분산)에 대해 잘 알고 있습니다. 세 번째 모멘트를 왜도라고하고 네 번째 모멘트를 첨도라고합니다. 세 번째 모멘트는 분포의 비대칭을 측정하고 네 번째 모멘트는 꼬리 값이 얼마나 무거운지를 측정합니다. 물리학 자들은 일반적으로 물리학 응용에서 고차 모멘트를 사용합니다. 세 번째와 네 번째 순간의 시각화를 살펴 보겠습니다.

세 번째 순간 (비틀림) :

1) 스큐 없음 :

그림 2 : 왜곡이없는 그래프 데이터.

2) 포지티브 스큐 :

그림 3 : 양의 스큐가있는 데이터 그래프.

3) 음의 스큐 :

그림 4 : 음수 스큐가있는 데이터 그래프.

네 번째 순간 (첨도) :

그림 5 : 첨도의 유형을 나타내는 그래프.

우리는 기술 통계에 대한 다음 튜토리얼에서 이러한 각 순간을 자세히 연구 할 것입니다. 이 튜토리얼에서는 Moment Generating Function (MGF)에 대해 알아 봅니다. 그것에 들어가기 전에 잠시 동안 공식을 살펴 보겠습니다.

원시 순간 :

다음 공식에서 "A"는 임의의 변수입니다. 일반적으로 원시 모멘트를 계산하는 동안 A = 0을 사용합니다.

그림 6 : 원시 순간에 대한 공식.

중심 순간 :

그림 7 : 중심 모멘트에 대한 공식.

표준화 된 순간 :

그림 8 : 표준화 된 순간에 대한 공식.

모멘트 생성 기능 (MGF)이란?

이름에서 알 수 있듯이 Moment Generating Function은 E (X), E (X²), E (X³), E (X⁴),…, E (X ^ n)과 같은 순간을 생성하는 함수입니다.

MGF의 정의를 살펴 보겠습니다.

그림 9 : 순간 생성 기능의 정의.

이제 우리는 E [X ^ n]의 값을 찾는 데 관심이있는 동안 Moment Generating Function의 공식에 E [e ^ tx]가 있습니다.

E [e ^ tx]의 n 차 도함수를 취하고 t = 0을 대입하면 E [X ^ n]이됩니다.

그림 10 : 모멘트 생성 함수의 n 번째 도함수 사용.

a) 첫 번째 원시 순간 찾기 :

그림 11 : 순간 생성 함수의 1 차 도함수.

b) 두 번째 원시 순간 찾기 :

그림 12 : 순간 생성 함수의 2 차 도함수.

증명 : MGF의 n 번째 미분은 n 번째 모멘트입니다.

여기서 우리는 그것을 증명하기 위해 Taylor의 시리즈 를 사용할 것입니다.

그림 13 : Taylor 시리즈를 사용한 e ^ x 확장.

그것으로부터 우리는 말할 수 있습니다.

그림 14 : Taylor 시리즈를 사용한 e ^ tx 확장.

e ^ tx의 예상 값 찾기 :

그림 15 : e ^ tx의 예상 값.

이제 E (e ^ tx)의 n 번째 미분이 n 번째 순간이라는 것을 증명해 보겠습니다.

a) 1 차 도함수 찾기 :

그림 16 : 모멘트 생성 함수의 1 차 도함수 가져 오기.

여기서 우리는 그것이 우리에게 첫 순간을주는 것을 볼 수 있습니다.

b) 2 차 도함수 찾기 :

그림 17 : 순간 생성 함수의 2 차 도함수 취하기.

여기서 우리는 그것이 우리에게 두 번째 순간을주는 것을 볼 수 있습니다.

이 두 가지 도출로부터 모멘트 생성 함수의 n 번째 파생물이 n 번째 모멘트라고 자신있게 말할 수 있습니다.

모멘트 생성 기능에서“t”의 역할은 무엇입니까?

위의 파생에서 변수 "t"가 도우미 변수로 작동 함을 알 수 있습니다. "t"를 사용하면 Moment Generating Function에서 다른 파생 항목을 찾을 수 있습니다.

MGF가 필요한 이유는 무엇입니까?

연속 확률 분포의 경우 분포 모멘트를 찾기 위해 확률 밀도 함수 (PDF)를 통합해야합니다. 또한 통합을 찾는 것은 알고리즘에 복잡성을 추가하고 프로그램의 실행 시간을 증가시키는 것으로 나타났습니다. 그에 대한 대안으로 순간 생성 함수와 그 파생물을 사용하여 순간을 찾습니다. 모멘트 생성 기능을 사용하지 않아도 모멘트를 얻을 수 있지만, 고차 모멘트를 계산하기 위해 진행함에 따라 복잡해집니다.

원시 순간과 중심 순간의 관계 :

이 시점에서 우리는

그림 18 : n 번째 중심 모멘트.

이제 우리는 중심 순간과 원시 순간의 관계를 찾을 것입니다.

a) 공식을 다른 형식으로 작성하십시오.

그림 19 : n 번째 중심 모멘트 공식 수정.
그림 20 : 다른 형태의 n 번째 중심 모멘트.

b) 이항 정리를 사용하여 주요 용어 확장 :

그림 21 : 이항 정리.

c) 기본 용어 확장 :

그림 22 : 확장을 위해 이항 정리 사용.

d) 주요 공식에 넣으십시오.

그림 23 : 확장 된 용어를 기본 수식에 넣습니다.

e) 원시 순간의 정의를 사용하여 용어 단순화 :

그림 24 : 원시 모멘트의 중심 모멘트.

f) 간단한 형식으로 공식을 작성하십시오.

그림 25 : 원시 모멘트의 중심 모멘트.

짜잔! 우리는 원시 순간과 중심 순간 사이의 관계를 찾기 위해 공식을 도출했습니다. 이제 그들 사이의 관계를 찾아 봅시다.

a) 원시 모멘트의 첫 번째 중심 모멘트 :

그림 26 : 원시 모멘트 측면에서 첫 번째 중심 모멘트.

2) 원시 모멘트 측면에서 두 번째 중심 모멘트 :

그림 27 : 원시 모멘트 측면에서 두 번째 중심 모멘트.

3) 원시 순간의 관점에서 세 번째 중심 순간 :

그림 28 : 원시 모멘트 측면에서 세 번째 중심 모멘트.

4) 원시 모멘트 측면에서 네 번째 중심 모멘트 :

그림 29 : 원시 모멘트 측면에서 네 번째 중심 모멘트.

요약하자면,

그림 30 : 원시 모멘트의 중심 모멘트.
그림 31 : 중심 순간과 원시 순간 간의 관계 요약.

Moment Generating Function (MGF)으로 순간을 찾는 동안 원시 순간을 얻습니다. 위에서 파생 된 공식을 사용하여 원시 순간에서 중심 순간을 찾을 수 있습니다. 중심 순간을 사용하여 표준화 된 순간을 쉽게 찾을 수 있습니다. 확률 분포에 대한 향후 자습서에서이 공식을 사용할 것입니다.

Python 구현 :

Python을 사용하여 데이터 세트의 중심 순간을 찾을 수 있습니다. 몇 가지 예를 살펴 보겠습니다.

1) 1 차원 데이터 :

그림 32 : 1 차원 데이터에 대한 모멘트 찾기.

2) 2 차원 데이터 :

그림 33 : 2 차원 데이터에 대한 모멘트 찾기.

3) 축 = 1 인 2 차원 데이터 :

그림 34 : 축 = 1 인 2 차원 데이터에 대한 모멘트 찾기.

4) 다차원 데이터 :

그림 35 : 다차원 데이터에 대한 모멘트 찾기.

5) 고차 순간 :

그림 36 : 고차 모멘트 찾기.

키 포인트:

  1. 유효한 모멘트 생성 함수에 대해 0 번째 모멘트는 1과 같다고 말할 수 있습니다.
  2. Moment Generating Function을 사용하여 미분을 찾는 것은 원시 순간을 제공합니다.
  3. 확률 분포에 대한 MGF가 있으면 n 번째 모멘트를 쉽게 찾을 수 있습니다.
  4. 각 확률 분포에는 고유 한 모멘트 생성 함수가 있습니다.
  5. 모멘트 생성 기능을 사용하지 않고도 모멘트를 찾을 수 있지만 MGF를 사용하면 시간과 공간의 복잡성이 줄어 듭니다.

면책 조항 : 이 기사에 표현 된 견해는 저자의 견해이며 Carnegie Mellon University의 견해를 대변하지 않습니다. 이 글은 최종 결과물이 아니라 토론과 개선의 촉매제가되는 현재의 사고를 반영한 ​​것입니다.

Towards AI 를 통해 게시

참조 :

[1] scipy.stats.moment, SciPy.org, https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.moment.html

[2] 통계의 순간 : 정의, 예, 통계 방법, https://www.statisticshowto.com/what-is-a-moment/

[3] 모멘트 생성 함수, 위키 백과, https://en.wikipedia.org/wiki/Moment-generating_function

[4] Taylor 시리즈, Wikipedia, https://en.wikipedia.org/wiki/Taylor_series

[5] 이항 정리, 위키 백과, https://en.wikipedia.org/wiki/Binomial_theorem

Suggested posts

블랙 미러의 음악적 관련성

블랙 미러의 음악적 관련성

공상 과학 소설은 Netflix 시리즈 Black Mirror에서 현실을 만납니다. 영국 시나리오 작가 Charlie Brooker가 만든 준 무관 한 이야기의 선집으로, 사회가 기술에 의존하게 된 몇 가지 방식과 그렇지 않은 사람들에게 의미 할 수있는 의미를 자세히 살펴 봅니다. 아주 먼 미래. 이 시리즈는 2011 년부터 2013 년까지 BBC 채널 4에서 처음 방영 된 후 2015 년 넷플릭스에서 선정되었으며 디지털 스트리밍 서비스 전용으로 12 개의 에피소드를 더 공개하도록 의뢰했습니다.

Hyperledger Fabric Blockchain은 어떻게 작동합니까? 설명했습니다!

Hyperledger Fabric Blockchain은 어떻게 작동합니까? 설명했습니다!

이 블로그 게시물의 목표는 Hyperledger Fabric 블록 체인의 작동 방식에 대한 주요 개념을 설명하여 사용 방법에 대한 기본적인 이해를 얻는 것입니다. 내용.

Related posts

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

데이터 과학을위한 필수 수학 : 기초 및 기초 변경

고유 분해 및 SVD에 유용한 기저의 선형 대수 개념 이해이 기사에서는 고유 분해 또는 특이 값 분해 (SVD)와 같은 행렬 분해 방법을 이해하는 흥미로운 방법 인 기저 개념에 대해 알아 봅니다. 정의 기본은 벡터 공간 (벡터 집합)을 설명하는 데 사용되는 좌표계입니다.

판다와 에라스무스 연구 교환 분석

판다와 에라스무스 연구 교환 분석

Erasmus 프로그램 2011-12에서 발생한 20 만 개의 연구 교환으로 데이터 세트를 분석 한 결과 1987 년 이후 Erasmus 프로그램은 매년 수십만 명의 유럽 학생들에게 한 학기 또는 1 년을 해외에서 보낼 기회를 다른 유럽에서 보낼 수있는 기회를 제공합니다. 경제적 인 지원뿐만 아니라 쉬운 교환 과정을 제공합니다. 유럽의 다양한 사람, 언어 및 문화에 대한 마음과 마음을 열어주는 정말 귀중한 경험입니다.

데이터 과학을위한 8 가지 기본 통계 개념

… 평범한 영어로 설명

데이터 과학을위한 8 가지 기본 통계 개념

통계는 "수량 데이터의 수집, 분석, 해석 및 표현을 다루는 수학의 한 분야"입니다. 프로그래밍과 기계 학습을 혼합하면 데이터 과학의 핵심 기술에 대해 꽤 잘 설명 할 수 있습니다.

데이터 과학의 9 가지 거리 측정

일반적인 거리 측정의 장점과 함정

데이터 과학의 9 가지 거리 측정

감독되거나 감독되지 않는 많은 알고리즘은 거리 측정을 사용합니다. 유클리드 거리 또는 코사인 유사성과 같은 이러한 측정은 종종 k-NN, UMAP, HDBSCAN 등과 같은 알고리즘에서 찾을 수 있습니다.