데이터의 기본적인 특징을 알려주는 기초 통계량
- 평균
- 분산
- 표준 편자
- 다섯 수 치 요약
- 최빈값
평균 (Mean)
평균을 계산한다.
mean : 평균을 계산한다.
|
mean( x, trim=0, na.rm=FALSE, ...)# trim은 절사평균을 사용할 때 (0, 0.5)로 지정 # na.rm는 평균 계산전 NA를 제거할지 여부 절사평균(Trimmed Mean)이란?
데이터를 크기 순서로 나열한 뒤 값이 작은 쪽과 큰 쪽에서 얼마만큼의 데이터를 제거한 다음 평균을 계산
|
분산 (var)
var : 분산을 계산한다.
|
var(x, na.rm=FALSE) |
> var(1:5) [1] 2.5 > var(mpg) [1] 36.3241028225806
표준 편차 (sd)
sd: 표준 편차를 계산한다.
|
sd(x, na.rm=FALSE) |
다섯 수치 요약
최소값, 제1사분위수, 중앙값, 제3분위수, 최댓값으로 요약
fivenum : 다섯 수치 요약을 구한다.
|
fivenum(x, na.rm=TRUE) |
summary는 fivenum과 유사하지만 추가로 평균까지 계산한다.
최빈값(mode)
데이터에서 가장 자주 나타난 값을 말한다. table()을 사용해 각 데이터가 출현한 횟수를 센 분할표(Contigency Table)를 만든다.
table : 분할표를 작성한다.
|
table(
... # 팩터로 해석할 수 있는 하나 이상의 객체
)
반환 값은 table 클래스의 인스턴스이고 인자에 지정한 팩터들의 빈도수를 구한 결과를 저장
|
분할표(Contigency Table)란? 값의 빈도를 변수들의 값에 따라 나누어 그린 표
评论
发表评论