Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- concave
- qqplot
- pycaret
- 선형회귀
- 회귀분석
- MachineLearning
- toolbox
- MATLAB
- R
- GradientDescent
- VSCode
- ~
- Python
- 데이터사이언스
- numpy
- Convex
- cs229
- Factor
- 머신러닝
- LinearRegression
- rstudio
- 가상환경
- normalprobabilityplot
Archives
- Today
- Total
부런의 부지런한 데이터분석
[R] t.test()에서 '~' 물결, 틸다 의미, factor() 본문
수강 중인 한 과목이 R도 쓰고 Matlab도 쓴다. 근데 둘 다 안 알려주고 냅다 쓰라고 한다... 그래서 기본적인 문법도 잘 몰라서 차근차근 공부하는 중.
data에 heights, country 라는 2개의 column들이 있고, country는 1,2로 나뉘어져 있으며, heights에는 사람들의 키가 기록되어 있다. 이러한 데이터를 이용해 나라별로 키 차이가 나는지 아닌지를 t test를 통해 확인하는 과정이다.
#이거는 country별로 나눠서 따로 array 만들어서 한 거고
country1 <- c(data$heights[data$country==1])
country2 <- c(data$heights[data$country==2])
t.test(country1, country2, paired=FALSE, var.equal = TRUE)
처음에 시도한 방법은 country값을 이용해 따로 분리하고, t. test()에 넣는 방법이었는데, 수업자료에 다른 방법이 있어서 그 방법으로 시도해보았다.
#이거는 데이터프레임 그대로 살려서 한 것.
#'~' 표시가 a를 b로 test한다는 의미.
#country가 1,2로 표기되어 있어서 numeric -> nominal로 만들어줌
data$country <- factor(data$country)
t.test(data$heights~data$country, paired=FALSE, var.equal=TRUE)
우선 country에 있는 1,2가 numeric으로 되어 있기 때문에 nominal로 만들어주고( factor()), data에 있는 heights를 data에 있는 country로 나눠서 test한다. => 즉, '~' 이 물결 표시는 a~b => a를 b 기준으로 나눠서 test 한다는 의미를 갖고 있다.
'Q&A' 카테고리의 다른 글
[R] qq plot(normal probability plot) x축 y축 변경 (0) | 2023.04.11 |
---|---|
[matlab] 함수 'cdf'은(는) 'char'형 입력 인수에 대해 정의되지 않았습니다. 해결 방법 (0) | 2023.04.09 |
[pycaret] 가상환경 만들고 설치하기 (0) | 2023.04.09 |
[vscode] 기본 설치, 파이썬 환경변수 설정, 가상환경 만들기, 파이썬 버전 변경 (0) | 2023.04.09 |
[pycaret] Importing the numpy c-extensions failed. 해결 방법 (0) | 2023.04.09 |
Comments