파이썬
여러가지 통계분석
코린이도이
2021. 6. 13. 20:56
1. 빈도 분석하기: collections패키지의 counter 함수 이용
import collections
sal_all = [970,950,990,380,430,430,380,420,450,320,550,320,380,420,970]
sal_count = collections.Counter(sal_all)
print(sal_count)
⇨출력 값: Counter({380: 3, 970: 2, 430: 2, 420: 2, 320: 2, 950: 1, 990: 1, 450: 1, 550: 1})
2. 최대 / 최소값 구하기: mix, max
print('최대연봉:', max(sal_all))
print('최소연봉:', min(sal_all))
print('전체 건수:',len(sal_all))
⇨출력 값: 최대연봉: 990 최소연봉: 320 전체 건수: 15
3. 전체 값 정렬하기: sorted 함수 이용
sal_sort = sorted(sal_all) #기본설정: 오름차순
print(sal_sort)
print('첫번째 값:', sal_sort[0])
print('마지막 값:', sal_sort[-1])
#끝에서 거꾸로는 -1, -2, -3... 으로 표시하면 됨
⇨출력 값: [320, 320, 380, 380, 380, 420, 420, 430, 430, 450, 550, 950, 970, 970, 990] 첫번째 값: 320 마지막 값: 990
4. 평균값 계산하기: numpy의 mean 함수 이용하기
import numpy as np
print('numpy 평균값:', np.mean(sal_all))
⇨출력 값: numpy 평균값: 557.3333333333334
5. 상관관계 분석하기: corr 함수 이용하기
import pandas as pd
lst = [[1, 2, 3, 4, 5], [3, 5, 8, 11, 13]]
df = pd.DataFrame(lst).T
corr = df.corr(method = 'pearson')
print(corr)
⇨출력 값: 1.000000 0.997054