728x90
반응형
hist()¶
- hist (x, breaks, main, xlab, ylab, xlim, ylim,.)
- X: 데이터 벡터
- breaks: 계급에 대한 정보
- 계급의 개수
- 계급을 나누는 값들의 벡터
- main: 그래프의 제목
- xlab: x축 제목
- ylab: y축 제목
- xlim: x축의 범위 (xlim=c(최소값, 최대값)
- ylim: y축의 범위
예제 2-6
In [ ]:
score <- c(93, 83, 91, 68, 83, 88, 76, 91,78, 72, 80, 69, 80, 75, 87, 89, 96, 97, 67, 83, 81, 87, 80, 64, 84, 71, 91, 81, 88, 73)
In [ ]:
hist(score)
In [ ]:
hist(score,main="")
예제 2-7
In [ ]:
rv <- c(0.8, 0.8, 0.8, 0.9, 0.9, 0.9, 0.9, 0.9, 1, 1, 1.8, 2, 2.1, 2.3, 2.4, 2.8, 2.9, 3, 3.2, 3.3, 3.5, 3.8, 3.8, 3.9, 4, 4.2, 4.4, 4.5, 5.1, 5.3, 5.3, 5.4, 14, 17, 18, 19, 21, 21, 23, 25, 27, 28, 32, 34, 36, 41, 42, 44, 48, 49, 51, 54, 59, 60, 61, 62, 80, 240)
In [ ]:
hist(rv, main="", xlab="CRP")
In [ ]:
hist(rv, main="", xlab="CRP", breaks = 20 ) #breaks 계급을 어떻게 나눌지 성절
In [ ]:
hist(rv, main="", xlab="CRP", breaks = seq(0, 240, 20) ) #20씩 나누려면 c(0,20,40.. )이렇게 해도되지만 seq쓰는것이 간편
예제 2-8
In [ ]:
set.seed(2021)
rn <- c(rnorm(100, 5, 2), rnorm(100, 10, 2)) # rnorm(난수 갯수, 평균, 표준편차) : 정규분포를 따르는 난수생성
breaks를 어떻게 하느냐,
즉, 계급을 어떻게 하는지에 따라서
쌍봉우리 분포와 종모양 분포를 띈다.
In [ ]:
hist(rn, breaks=20, main="",xlab='value')
In [ ]:
hist(rn, breaks=5, main="",xlab='value')
boxplot()¶
- boxplot(x, ...)
예제 2-15
In [ ]:
age <- c(57, 61,47, 57, 48, 58, 57, 61, 54, 50, 68, 51)
In [ ]:
boxplot(age, ylab="Age")
예제 2-16
In [ ]:
member <-c(92, 107, 180, 90, 78, 91, 102, 88, 106, 125, 95, 102, 162)
In [ ]:
boxplot(member, ylab='Number of board members')
요약통계량¶
- 평균: mean(x)
- 분산: var(x)
variance - 표준편타: sd(x)
standard deviation - 중앙값: median(x)
- 다섯수치 요약: fivenum(x)
- 사분위수 범위: IQR(x)
- 범위: range(x)
In [ ]:
member <- c(92, 107, 180, 90, 78, 91, 102, 88, 106, 125, 95, 102, 162)
In [ ]:
cat('mean : ',mean(member),
'\nvariance : ', var(member),
'\nstandard devision : ', sd(member),
'\nmedian : ',median(member),
'\nfivenum : ', fivenum(member),
'\nIQR : ',IQR(member),
'\nrange : ', range(member)
)
mean : 109.0769
variance : 899.0769
standard devision : 29.98461
median : 102
fivenum : 78 91 102 107 180
IQR : 16
range : 78 180
- fivenum: 78 91 102 107 180 에서 107 - 91 한 값. \
IQR함수로 계산한 값과 다를경우에는 코드의 사분위수 계산문제의 차이
728x90
반응형
'Statistics > [강의정리] 통계학개론' 카테고리의 다른 글
[통계학개론] 03강. 데이터요약2 (0) | 2024.05.06 |
---|---|
[통계학개론] 02강_R 시각화(ggplot2 ) - 막대그래프, 원그래프 (0) | 2024.05.05 |
[통계학개론] 02강. 데이터 요약1 (1) | 2024.05.05 |
[통계학개론] 01강. 통계학의 주요 개념 (0) | 2024.05.03 |
[통계학개론] R기초 (0) | 2024.05.03 |