728x90
반응형
통계학
:불확실한 현상을 이해하기 위해 데이터를 수집하고,
데이터 패턴을 요약, 분석하여
분확실한 현상에 대한 결론을 찾는 학문
기술통계
: 데이터가 가진 특징과 패턴을 정확하고 효과적으로
드러내기 위한 통계적인 방법을 사용
ex) 국민의 키와 몸무게 평균 중앙값, 사분위수등 요약통계량을 구하고
그래프를 작성, 미세먼지, 판매량
추측통계(추론통계)
: 데이터를 이용하여 우리 관심 대상에 대해 추측하고 그 추측의 신뢰성을 계량화
ex) 임금 노동자의 평균연봉을 알아내기위해서 랜덤 표집한 300명의 연봉을 조사하여
평균연본 추정치와 95%신뢰구간을 구한다.
ex) 새로 개발된 항암제의 효과를 알아보기 위하여
무작위 배정 임상시험에서 관측한 치료군과 대조군의 암재발률을 비교한다.
데이터의 기본요소
- 단위(unit) : 관측되는 개별 대상
- 변수(variable) : 각 단위에 대한 관측되는 특성
- 관찰값(observation) : 각 단위로부터 간측한 특성의 값
- 데이터 : 하나 이상의 변수에 대한 관찰값의 모음
ex)
A는 키가 161, 몸무게가 50kg
B는
C는
-단위: A,B,C
-변수: 키, 몸무게
모집단(population): 관심 대상이 되는 모든 개체의 모임
표본(sample): 모집단을 알기 위해 실제로 관측한 모집단의 일부
모수(parameter): 모집단의 특성을 나타내는 대푯값
통계량(Statistic): 표본의 특성을 나타내는 대푯값
표봉과 통계량
모집단을 잘 반영하는 표본을 뽑는 것은 매우 중요하다
단순랜덤표집(simple random sampling): 유한모집단에서 m 개의 개체로 이루어진 가능한 모든 부분집합이 표본으로 선택될 확률이 같도록 설계된 표본 표집 방법
통계량:
모수를 추정하기 위해. 표본에서 얻은 값
표본을 새로 뽑으면 통계량의 값이 달라진다(표본분포)
728x90
반응형
'Statistics > [강의정리] 통계학개론' 카테고리의 다른 글
[통계학개론]03강. R 내장함수 그래프와 요약통계량 (0) | 2024.05.07 |
---|---|
[통계학개론] 03강. 데이터요약2 (0) | 2024.05.06 |
[통계학개론] 02강_R 시각화(ggplot2 ) - 막대그래프, 원그래프 (0) | 2024.05.05 |
[통계학개론] 02강. 데이터 요약1 (1) | 2024.05.05 |
[통계학개론] R기초 (0) | 2024.05.03 |