저자 : Pratik Shukla, Roberto Iriondo
이 튜토리얼의 코드는 Github 및 전체 구현뿐만 아니라 Google Colab 에서 사용할 수 있습니다 .
일반적으로 통계, 기계 학습 , 수학 및 기타 분야 에서 모멘트를 사용 하여 분포의 특성을 설명합니다.
관심 변수가 X라고 가정하고 순간은 X의 기대 값입니다. 예 : E (X), E (X²), E (X³), E (X⁴),… 등.
1) 첫 번째 순간 : 중심 위치 측정.
2) 두 번째 순간 : 분산 / 확산 측정.
3) 세 번째 순간 : 비대칭의 측정.
4) 네 번째 순간 : 특이 치 / 꼬리의 측정.
이제 우리는 첫 번째 순간 (평균)과 두 번째 순간 (분산)에 대해 잘 알고 있습니다. 세 번째 모멘트를 왜도라고하고 네 번째 모멘트를 첨도라고합니다. 세 번째 모멘트는 분포의 비대칭을 측정하고 네 번째 모멘트는 꼬리 값이 얼마나 무거운지를 측정합니다. 물리학 자들은 일반적으로 물리학 응용에서 고차 모멘트를 사용합니다. 세 번째와 네 번째 순간의 시각화를 살펴 보겠습니다.
1) 스큐 없음 :
2) 포지티브 스큐 :
3) 음의 스큐 :
우리는 기술 통계에 대한 다음 튜토리얼에서 이러한 각 순간을 자세히 연구 할 것입니다. 이 튜토리얼에서는 Moment Generating Function (MGF)에 대해 알아 봅니다. 그것에 들어가기 전에 잠시 동안 공식을 살펴 보겠습니다.
다음 공식에서 "A"는 임의의 변수입니다. 일반적으로 원시 모멘트를 계산하는 동안 A = 0을 사용합니다.
이름에서 알 수 있듯이 Moment Generating Function은 E (X), E (X²), E (X³), E (X⁴),…, E (X ^ n)과 같은 순간을 생성하는 함수입니다.
MGF의 정의를 살펴 보겠습니다.
이제 우리는 E [X ^ n]의 값을 찾는 데 관심이있는 동안 Moment Generating Function의 공식에 E [e ^ tx]가 있습니다.
E [e ^ tx]의 n 차 도함수를 취하고 t = 0을 대입하면 E [X ^ n]이됩니다.
a) 첫 번째 원시 순간 찾기 :
b) 두 번째 원시 순간 찾기 :
여기서 우리는 그것을 증명하기 위해 Taylor의 시리즈 를 사용할 것입니다.
그것으로부터 우리는 말할 수 있습니다.
e ^ tx의 예상 값 찾기 :
이제 E (e ^ tx)의 n 번째 미분이 n 번째 순간이라는 것을 증명해 보겠습니다.
a) 1 차 도함수 찾기 :
여기서 우리는 그것이 우리에게 첫 순간을주는 것을 볼 수 있습니다.
b) 2 차 도함수 찾기 :
여기서 우리는 그것이 우리에게 두 번째 순간을주는 것을 볼 수 있습니다.
이 두 가지 도출로부터 모멘트 생성 함수의 n 번째 파생물이 n 번째 모멘트라고 자신있게 말할 수 있습니다.
위의 파생에서 변수 "t"가 도우미 변수로 작동 함을 알 수 있습니다. "t"를 사용하면 Moment Generating Function에서 다른 파생 항목을 찾을 수 있습니다.
연속 확률 분포의 경우 분포 모멘트를 찾기 위해 확률 밀도 함수 (PDF)를 통합해야합니다. 또한 통합을 찾는 것은 알고리즘에 복잡성을 추가하고 프로그램의 실행 시간을 증가시키는 것으로 나타났습니다. 그에 대한 대안으로 순간 생성 함수와 그 파생물을 사용하여 순간을 찾습니다. 모멘트 생성 기능을 사용하지 않아도 모멘트를 얻을 수 있지만, 고차 모멘트를 계산하기 위해 진행함에 따라 복잡해집니다.
이 시점에서 우리는
이제 우리는 중심 순간과 원시 순간의 관계를 찾을 것입니다.
a) 공식을 다른 형식으로 작성하십시오.
b) 이항 정리를 사용하여 주요 용어 확장 :
c) 기본 용어 확장 :
d) 주요 공식에 넣으십시오.
e) 원시 순간의 정의를 사용하여 용어 단순화 :
f) 간단한 형식으로 공식을 작성하십시오.
짜잔! 우리는 원시 순간과 중심 순간 사이의 관계를 찾기 위해 공식을 도출했습니다. 이제 그들 사이의 관계를 찾아 봅시다.
a) 원시 모멘트의 첫 번째 중심 모멘트 :
2) 원시 모멘트 측면에서 두 번째 중심 모멘트 :
3) 원시 순간의 관점에서 세 번째 중심 순간 :
4) 원시 모멘트 측면에서 네 번째 중심 모멘트 :
요약하자면,
Moment Generating Function (MGF)으로 순간을 찾는 동안 원시 순간을 얻습니다. 위에서 파생 된 공식을 사용하여 원시 순간에서 중심 순간을 찾을 수 있습니다. 중심 순간을 사용하여 표준화 된 순간을 쉽게 찾을 수 있습니다. 확률 분포에 대한 향후 자습서에서이 공식을 사용할 것입니다.
Python을 사용하여 데이터 세트의 중심 순간을 찾을 수 있습니다. 몇 가지 예를 살펴 보겠습니다.
1) 1 차원 데이터 :
2) 2 차원 데이터 :
3) 축 = 1 인 2 차원 데이터 :
4) 다차원 데이터 :
5) 고차 순간 :
면책 조항 : 이 기사에 표현 된 견해는 저자의 견해이며 Carnegie Mellon University의 견해를 대변하지 않습니다. 이 글은 최종 결과물이 아니라 토론과 개선의 촉매제가되는 현재의 사고를 반영한 것입니다.
Towards AI 를 통해 게시
[1] scipy.stats.moment, SciPy.org, https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.moment.html
[2] 통계의 순간 : 정의, 예, 통계 방법, https://www.statisticshowto.com/what-is-a-moment/
[3] 모멘트 생성 함수, 위키 백과, https://en.wikipedia.org/wiki/Moment-generating_function
[4] Taylor 시리즈, Wikipedia, https://en.wikipedia.org/wiki/Taylor_series
[5] 이항 정리, 위키 백과, https://en.wikipedia.org/wiki/Binomial_theorem
공상 과학 소설은 Netflix 시리즈 Black Mirror에서 현실을 만납니다. 영국 시나리오 작가 Charlie Brooker가 만든 준 무관 한 이야기의 선집으로, 사회가 기술에 의존하게 된 몇 가지 방식과 그렇지 않은 사람들에게 의미 할 수있는 의미를 자세히 살펴 봅니다. 아주 먼 미래. 이 시리즈는 2011 년부터 2013 년까지 BBC 채널 4에서 처음 방영 된 후 2015 년 넷플릭스에서 선정되었으며 디지털 스트리밍 서비스 전용으로 12 개의 에피소드를 더 공개하도록 의뢰했습니다.
이 블로그 게시물의 목표는 Hyperledger Fabric 블록 체인의 작동 방식에 대한 주요 개념을 설명하여 사용 방법에 대한 기본적인 이해를 얻는 것입니다. 내용.
고유 분해 및 SVD에 유용한 기저의 선형 대수 개념 이해이 기사에서는 고유 분해 또는 특이 값 분해 (SVD)와 같은 행렬 분해 방법을 이해하는 흥미로운 방법 인 기저 개념에 대해 알아 봅니다. 정의 기본은 벡터 공간 (벡터 집합)을 설명하는 데 사용되는 좌표계입니다.
Erasmus 프로그램 2011-12에서 발생한 20 만 개의 연구 교환으로 데이터 세트를 분석 한 결과 1987 년 이후 Erasmus 프로그램은 매년 수십만 명의 유럽 학생들에게 한 학기 또는 1 년을 해외에서 보낼 기회를 다른 유럽에서 보낼 수있는 기회를 제공합니다. 경제적 인 지원뿐만 아니라 쉬운 교환 과정을 제공합니다. 유럽의 다양한 사람, 언어 및 문화에 대한 마음과 마음을 열어주는 정말 귀중한 경험입니다.
통계는 "수량 데이터의 수집, 분석, 해석 및 표현을 다루는 수학의 한 분야"입니다. 프로그래밍과 기계 학습을 혼합하면 데이터 과학의 핵심 기술에 대해 꽤 잘 설명 할 수 있습니다.
감독되거나 감독되지 않는 많은 알고리즘은 거리 측정을 사용합니다. 유클리드 거리 또는 코사인 유사성과 같은 이러한 측정은 종종 k-NN, UMAP, HDBSCAN 등과 같은 알고리즘에서 찾을 수 있습니다.