일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Convex
- 회귀분석
- 선형회귀
- concave
- GradientDescent
- MATLAB
- LinearRegression
- 데이터사이언스
- 가상환경
- normalprobabilityplot
- Factor
- pycaret
- MachineLearning
- rstudio
- 머신러닝
- toolbox
- VSCode
- Python
- ~
- numpy
- cs229
- qqplot
- R
- Today
- Total
목록분류 전체보기 (7)
부런의 부지런한 데이터분석

qq plot = normal probability plot 을 그리는 게 과제였는데 수업 자료에 나온 코드는 qqnorm(data$column, datax=TRUE) 였다. 그런데 그대로 따라하니까 형태가 이상했다. 원래 데이터가 right skewed*인데 qq plot의 형태가 convex**가 아니고 concave** 모양이었다. 살펴보니 x축이 theoretical이어야 하고, y축이 sample quantiles여야 하는데 반대로 출력되고 있었다. * 처음 skewed라는 단어를 접했을 때 right skewed면 오른쪽으로 치우친 거라고 생각했는데 그게 아니라는 것을 유의하자. right skewed면 오른쪽 꼬리가 길다는 것으로 "왼쪽"으로 치우는 것이다 ** convex와 concave는..
수강 중인 한 과목이 R도 쓰고 Matlab도 쓴다. 근데 둘 다 안 알려주고 냅다 쓰라고 한다... 그래서 기본적인 문법도 잘 몰라서 차근차근 공부하는 중. data에 heights, country 라는 2개의 column들이 있고, country는 1,2로 나뉘어져 있으며, heights에는 사람들의 키가 기록되어 있다. 이러한 데이터를 이용해 나라별로 키 차이가 나는지 아닌지를 t test를 통해 확인하는 과정이다. #이거는 country별로 나눠서 따로 array 만들어서 한 거고 country1 a를 b 기준으로 나눠서 test 한다는 의미를 갖고 있다.

p = cdf('t', t, df); p = 2*min(p, 1-p); matlab을 이용하는 과제가 있어서 하는데 이게 스켈레톤 코드인데 계속 오류가 발생했다. 함수 'cdf'은(는) 'char'형 입력 인수에 대해 정의되지 않았습니다. 검색을 엄청 오래 했는데도 잘 안 나와서 아마 에 help cdf 라고 검색했던 것 같은데, 그랬더니 toolbox를 뭐 설치해야 한다고 떠서 그대로 했더니 됐다... 지금은 help cdf 치니까 함수 설명만 나와서 다른 방법을 찾아왔다 앱 > 추가 앱 다운로드 눌러서 '애드온 탐색기' 창 열기 애드온 검색 부분에 'Statistics and Machine Learning Toolbox' 검색해서 설치하고 실행하면 된다... 결국 설치가 안 돼서 오류가 뜬 거였다.
이전에 가상환경이 뭔지 모를 때 pycaret을 알게 되었는데, 냅다 설치하니까 엄청난 패키지들 간의 충돌을 경험했다. 그래서 pycaret은 가상환경을 따로 만들어서 설치하는 것을 강력히 추천한다. 가상환경: 여러 학생들을 왕창 한 교실에 몰아넣으면 문제 생겨서 분반 시스템을 도입했다고 보면 된다 https://buzirundata.tistory.com/6 [vscode] 기본 설치, 파이썬 환경변수 설정, 가상환경 만들기, 파이썬 버전 변경 주피터 노트북만 쓰다가 최근 연구실 인턴으로 들어가면서 vscode를 입문했다. 아무도 나한테 vscode를 쓰라고 하지 않았지만 다 이거 쓰는데 나만 모르니까 내가 너무 한심해서 쓰기로 함 ㅇㅇ. 연 buzirundata.tistory.com 여기서 3번 참고 ..
주피터 노트북만 쓰다가 최근 연구실 인턴으로 들어가면서 vscode를 입문했다. 아무도 나한테 vscode를 쓰라고 하지 않았지만 다 이거 쓰는데 나만 모르니까 내가 너무 한심해서 쓰기로 함 ㅇㅇ. 연구실 컴퓨터에서 anaconda 설치하고 jupyter notebook 설치했는데 vscode로 해보려니까 뭐가 안돼서 겪었던 문제와 해결 방법을 담아놓을 예정이다. 1. 계속 pip가 없다고 떴다 -> 환경변수 설정 문제라고 함. https://bigphu.tistory.com/96 [Python] 파이썬 설치 환경 변수 설정 / pip 명령어 오류 오랜만에 파이썬 작업을 하려고 하는데 아래 오류메시지와 함께 vs code 에서 pip 명령어가 먹지 않았다. 'pip' 용어가 cmdlet, 함수, 스크립트..
IMPORTANT: PLEASE READ THIS FOR ADVICE ON HOW TO SOLVE THIS ISSUE! Importing the numpy c-extensions failed. his error can happen for different reasons, ften due to issues with your setup. Original error was: No module named 'numpy.core._multiarray_umath' [해결방법] - 가상환경에 pycaret 설치 후 vscode 종료하고 다시 시작하고 코드 돌리기 => 해당 방법으로 성공 기존 검색으로 얻은 방법 - numpy 삭제 후 재설치 (pip uninstall numpy / pip install numpy) p..

* 혼자 보고 이해한 내용 적은 거라 틀린 내용 있을 수 있음. 발견 시 댓글 부탁드립니당,, * 출처 : CS229 notes1 외 google... - Epoch : one epoch is when an entire dataset is passed forward and backward through the neural network only ONCE NN에서 전체 데이터셋에 대해 한 번 학습을 완료한 상태(forward랑 backpropagation까지 완료한 걸 하나의 epoch라고 한다) epoch가 너무 작으면 underfitting / 너무 크면 overfitting - Batch & iteration batch 덩어리 / iteration은 반복 횟수라고 보면 되겠다 1 epoch가 모든 데..