카테고리 없음

파이토치 통계분석

sooho93 2024. 12. 16. 17:44

 

버전
분석 미리 보기

 

목표

와인의 속성을 분석하여 품질 등급을 예측합니다.


핵심 개념

  • 기술 통계
  • 회귀 분석
  • t-검정
  • 히스토그램

데이터 수집

  • 레드 와인과 화이트 와인 데이터셋
  • 출처: 캘리포니아 어바인 대학교 머신러닝 저장소

데이터 준비

수집한 데이터 파일을 변환합니다.


데이터 탐색

  1. 정보 확인
    • info()
  2. 기술 통계 확인
    • describe(), unique(), value_counts()

데이터 모델링

  1. 데이터 그룹 비교 분석
    • 그룹별 기술 통계 분석: describe()
    • t-검정: scipy ttest_ind()
    • 회귀 분석: statsmodels.formula.api ols()
  2. 품질 등급 예측
    • 샘플 데이터를 독립 변수(x) 로 지정
    • 회귀 분석 모델 적용
    • 종속 변수 (y: quality) 예측

결과 시각화

  1. 히스토그램
    • 와인 품질 등급의 밀도 분포 시각화 (레드 와인 vs 화이트 와인 비교)
  2. 부분 회귀 플롯
    • 특정 독립 변수와 종속 변수의 관계 시각화

요약

이 프로젝트는 기술 통계회귀 분석을 활용하여 와인의 품질을 예측합니다. scipy와 statsmodels 라이브러리를 통해 통계적 분석과 모델링을 수행하며, 히스토그램과 회귀 플롯으로 분석 결과를 시각화합니다.

병합