티스토리 뷰

파이썬

여러가지 통계분석

코린이도이 2021. 6. 13. 20:56

1. 빈도 분석하기: collections패키지의 counter 함수 이용

import collections

sal_all = [970,950,990,380,430,430,380,420,450,320,550,320,380,420,970]
sal_count = collections.Counter(sal_all)

print(sal_count)

⇨출력 값: Counter({380: 3, 970: 2, 430: 2, 420: 2, 320: 2, 950: 1, 990: 1, 450: 1, 550: 1})

 

2. 최대  / 최소값 구하기: mix, max

print('최대연봉:', max(sal_all))

print('최소연봉:', min(sal_all))

print('전체 건수:',len(sal_all))

출력 값: 최대연봉: 990 최소연봉: 320 전체 건수: 15

 

3. 전체 값 정렬하기: sorted 함수 이용

sal_sort = sorted(sal_all)  #기본설정: 오름차순

print(sal_sort)
print('첫번째 값:', sal_sort[0])
print('마지막 값:', sal_sort[-1])

#끝에서 거꾸로는 -1, -2, -3... 으로 표시하면 됨

출력 값: [320, 320, 380, 380, 380, 420, 420, 430, 430, 450, 550, 950, 970, 970, 990] 첫번째 값: 320 마지막 값: 990

 

 

4. 평균값 계산하기: numpy의 mean 함수 이용하기

import numpy as np
print('numpy 평균값:', np.mean(sal_all))

출력 값: numpy 평균값: 557.3333333333334

 

5. 상관관계 분석하기: corr 함수 이용하기

import pandas as pd
lst = [[1, 2, 3, 4, 5], [3, 5, 8, 11, 13]]

df = pd.DataFrame(lst).T

corr = df.corr(method = 'pearson')
print(corr)

출력 값: 1.000000 0.997054

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/10   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함