카테고리 없음
파이토치 통계분석
sooho93
2024. 12. 16. 17:44
목표
와인의 속성을 분석하여 품질 등급을 예측합니다.
핵심 개념
- 기술 통계
- 회귀 분석
- t-검정
- 히스토그램
데이터 수집
- 레드 와인과 화이트 와인 데이터셋
- 출처: 캘리포니아 어바인 대학교 머신러닝 저장소
데이터 준비
수집한 데이터 파일을 변환합니다.
데이터 탐색
- 정보 확인
- info()
- 기술 통계 확인
- describe(), unique(), value_counts()
데이터 모델링
- 데이터 그룹 비교 분석
- 그룹별 기술 통계 분석: describe()
- t-검정: scipy ttest_ind()
- 회귀 분석: statsmodels.formula.api ols()
- 품질 등급 예측
- 샘플 데이터를 독립 변수(x) 로 지정
- 회귀 분석 모델 적용
- 종속 변수 (y: quality) 예측
결과 시각화
- 히스토그램
- 와인 품질 등급의 밀도 분포 시각화 (레드 와인 vs 화이트 와인 비교)
- 부분 회귀 플롯
- 특정 독립 변수와 종속 변수의 관계 시각화
요약
이 프로젝트는 기술 통계와 회귀 분석을 활용하여 와인의 품질을 예측합니다. scipy와 statsmodels 라이브러리를 통해 통계적 분석과 모델링을 수행하며, 히스토그램과 회귀 플롯으로 분석 결과를 시각화합니다.