통계
-
기초통계 #4 정규분포통계 공부방 2020. 4. 28. 20:58
* 정규분포 : 중심을 나타내는 평균과 산포를 의미하는 표준편차에 의해 형태가 결정되는 분포 (많은 분야에서 연속형 변수로서 나타나는 현상을 표현하는 확률모형으로 사용되면서 정규 분포라고 불리게 되었다고 합니다.) 어떤 확률현상이 정규 분포를 따른다고 할 때 평균(μ)과 표준편차(σ)에 따라서 아래와 같은 특성을 따른다. [특성1] - 이 현상의 한 관찰값이 P(μ-1σ < X < μ+1σ)에서 나타날 확률이 0.6826 - 이 현상의 한 관찰값이 P(μ-2σ < X < μ+2σ)에서 나타날 확률이 0.9544 - 이 현상의 한 관찰값이 P(μ-3σ < X < μ+3σ)에서 나타날 확률이 0.9974 * 표준정규분포 : 평균이 0이고, 표준편차가 1인 정규분포 N(0,1) (개체의 관찰값과 평균의 차이를..
-
기초통계 #3 모집단과 표본통계 공부방 2020. 3. 21. 00:30
* 모집단 : 관심을 가지고 있는 전체 집단 * 표본 : 모집단의 일부분으로서, 모집단에 대한 정보를 얻기 위해서 모집단으로부터 추출된 집단 * 모집단과 표본의 평균, 분산 표준편차 공식 - 표본의 편차를 N-1로 나누어 주는이유 통계량의 자유도는 통계량의 값을 구할 때 이용되는 자료의 수에서 통계량을 계산하기 위해 추정된 모수의 수만큼 뺀 값으로 표본평균은 추정된 모수가 없어서 자료의 수인 N이 자유도가 되지만 표본분산은 편차를 구하기 위해서 모평균을 표본평균으로 추정했기 때문에 N-1이 표본분산의 자유도가 된다.
-
기초통계 #2 자료의 요약통계 공부방 2020. 3. 18. 00:41
집단의 관찰값들을 대표할만 한 값을 통해 자료의 형태를 파악할 수 있다. * 대표값 정의 - 평균 : 관찰값의 합을 관찰한 개체의 수로 나눈 값(자료의 무게중심) - 중앙값(중위수) : 자료를 크기 순으로 나열했을 때 가운데 위치하는 값 - 최빈수(최빈값) : 관찰값이나 관찰값의 구간 중 빈도가 가장 높은 값 - 산포도 : 자료의 퍼짐의 정도 (산포도를 나타내는 잣대 : 범위, 편차, 분산 등) - 범위 : 최대값과 최소값의 차이 - 편차 : 각 자료값들이 평균으로부터 떨어진 정도 - 분산 : 각 관찰값과 평균값과의 차이의 제곱의 평균 * 평균과 표준편차를 활용한 자료의 표현 평균은 자료가 분포하고 있는 중심을, 표준편차는 그 중심으로부터 자료의 퍼진 정도를 표현한다. 예) 어느 한 반의 수학, 영어 점..
-
기초통계 #1 자료의 유형통계 공부방 2020. 3. 16. 21:39
통계학이란, 현상에 대해 인식하고 파악한 것을 적절하게 표현하고 전달하는 일로 분석을 하기 전에 자료를 바라보는 관점이 중요하다. 자료는 크게 질적자료와 양적 자료로 나뉘는데, 질적자료란 수적인 의미없이 범주만을 나타내는 데이터를 의미하며 양적자료란 수적인 의미가 있는 데이터를 의미한다. 질적자료는 순수하게 범주로서의 의미만 갖는 명목형 자료와 범주간의 크고 작음이 존재하는 순위형 자료로 나뉘고, 양적자료는 무수히 많은 값을 가지는 연속형 자료와 정수의 값만 가지는 이산형 자료로 나뉜다. 자료의 유형 상세 유형 예 질적자료 명목형자료 거주지, 종교, 성별 순위형자료 연령대, 난이도 양적자료 연속형자료 키, 몸무게, 혈압 이산형자료 자녀의 수, 휴대폰 수신 횟수, 나이