분류 전체보기
-
[모델 평가] 정확도(Accuracy)머신러닝 공부방 2020. 6. 16. 10:34
정확도 : 분류 모델을 평가할 때 대표적인 평가지표로, 만든 모델이 예측한 결괏값이 정답과 일치한 수를 의미한다. 예. 타이타닉 승객의 생존여부 - 전체 승객 수에서 정확하게 예측한 승객의 비율 티켓 등급, 성별, 요금 데이터를 가지고 탑승객의 생존 여부를 예측하는 모델을 만들었다고 하였을 때 만든 모델 중에 가장 높은 정확도를 기록하는 모델을 사용하기로 하였습니다. 테스트 데이터에 모델을 적용하기 전 트레인 데이터를 검증데이터로 나누어 실제 결과 값과 비교하기 위하여 train_test_split을 통해 트레인 데이터 분할 작업을 진행합니다. 각 모델을 분리된 트레인 데이터를 가지고 학습시킨 후 검증데이터에 예상 결과값과 실제 결과값을 비교해서 보다 높은 정확성을 기록하는 모델 확인 => 위 결과에서는..
-
기초통계 #4 정규분포통계 공부방 2020. 4. 28. 20:58
* 정규분포 : 중심을 나타내는 평균과 산포를 의미하는 표준편차에 의해 형태가 결정되는 분포 (많은 분야에서 연속형 변수로서 나타나는 현상을 표현하는 확률모형으로 사용되면서 정규 분포라고 불리게 되었다고 합니다.) 어떤 확률현상이 정규 분포를 따른다고 할 때 평균(μ)과 표준편차(σ)에 따라서 아래와 같은 특성을 따른다. [특성1] - 이 현상의 한 관찰값이 P(μ-1σ < X < μ+1σ)에서 나타날 확률이 0.6826 - 이 현상의 한 관찰값이 P(μ-2σ < X < μ+2σ)에서 나타날 확률이 0.9544 - 이 현상의 한 관찰값이 P(μ-3σ < X < μ+3σ)에서 나타날 확률이 0.9974 * 표준정규분포 : 평균이 0이고, 표준편차가 1인 정규분포 N(0,1) (개체의 관찰값과 평균의 차이를..
-
SQL #6 JOINSQL 공부방 2020. 4. 13. 18:05
JOIN은 서로 다른 테이블을 합칠 때 사용되는 문구로, 합치기 전 데이터의 구조를 파악한 후 진행해야 합니다. - 아래 링크 내 예시 파일 데이터 구조 내용 확인 가능 2020/03/25 - [SQL 공부방] - SQL #2 데이터 파악하기 SQL #2 데이터 파악하기 구문을 공부하기 전에 실습 데이터 구조를 확인해보겠습니다. - #1에서 가져온 데이터베이스 구조 확인하기(ER-diagram) Customers: 업체의 고객데이터 Products: 업체의 상품 목록 ProductLines: 상품 카테고리.. dduji-studyroom.tistory.com [ JOIN ] SELECT * FROM 테이블1 a(테이블1의 약칭) 기준(LEFT/INNER/FULL) JOIN 테이블2 b(테이블2의 약칭) ..
-
SQL #5 GROUP BYSQL 공부방 2020. 3. 27. 11:51
[ 집계 함수 ] 집계 함수 의미 AVG 평균 SUM 합 COUNT 개수 +) DISTINCT 구문을 함께 쓰면 중복된 값을 제거한 개수 [ GROUP BY ] SELECT 칼럼명1(그룹화를 원하는 컬럼), 집계 함수(칼럼명2(그룹화를 통해 확인 원하는 컬럼)) FROM DB명.테이블명, GROUP BY 칼럼명1(그룹화를 원하는 컬럼) ; - GROUP BY 구문은 집계함수와 함께 많이 쓰인다. - GROUP BY 에 넣은 칼럼명이 결과표에 표시되어져야 확인히 용이하기 때문에 SELECT문에 항상 넣어주는 게 좋다.