ggplot2() 데이터를 시각화하는데 있어서 간단한 설정만으로 다양한 그래픽 표현이 가능 하나의 데이터를 가지고도 여러 그래픽 표현이 가능 ggplot2패키지를 이용하기 위해서는 아래와 같은 작업이 필요 install.packages("ggplot2") library(ggplot2) 1. qplot() r에서 기본적으로 사용하는 plot()함수와 비슷한 구조를 가진 함수 형식: qplot(x,y,data=,color=,shape=,size=,alpha=,geom=,method=,formula=,facets=,xlim=,ylim=,xlab=,ylab=,main=,sub=) > a b qplot(b,a,col="yellow") 결과 2. ggplot() ggplot(data,aes(x=x축 데이터,y=y축..
1. 그래프 중첩하여 그리기 두 개 이상의 그래프를 하나의 그래프에서 보여주는 작업 구현방법: par(new=TRUE) 사용 > plot.new() > y1 y2 x par(new=TRUE) > plot(x,y1,ylab="소비자물가상승률",type='l',col='red',ylim=c(0.3,1.5)) > par(new=TRUE) > plot(x,y2,lty="dotted",type='l',col='blue',ylim=c(0.3,1.5)) > legend(5,1.4,legend=c("2015년","2016년"),lty=1,bg="yellow",col=c("red","blue")) 결과 2. 막대 그래프 그리기: barplot() 막대 그래프를 구현하기 위한 함수: barplot(인자) 주요인자 name..
1. plot() 형식 plot(x,y,옵션) x-x축 데이터, y-y축의 데이터 옵션 main: 그래프 제목 sub: 그래프 부 제목 xlab: x축 제목, ylab: y축 제목 type: plot의 형태 axes: plot의 테두리선(예: axes=F -> x,y축 테두리선 표시하지 않음) col: plot의 색상 > height weight plot(weight,height,main="키와 몸무게 분포",xlab="몸무게",ylab="키") ⇒ 결과 type의 형태 type='p': 포인트가 점의 형태로 그래프 그려짐 'l': 선의 형태로 그래프 그려짐 'o': 점이 선과 중첩되며 통과죔 'h': 히스토그램과 같이 수직선 평태 's'/'S': 계단형 그래프 2. 그래프에 유용한 par()함수 화면분..
함수(function) 특정한 작업을 독립적으로 수행하는 프로그램 코드의 집합체 함수 기능 함수 기능 mean() 평균값을 계산 min(), max() 최소값, 최대값을 계산 sum() 합계를 계산 median() 중위수 계산 sd() 표준편차를 계산 cor() 상관계수 계산 var() 분산 계산 range() 범위 계산 sort() 정렬작업 수행 rev() 요소의 나열순서를 반대로 표시 > a rev(a) [1] 16 77 66 55 12 33 > mean(a) [1] 43.16667 > sort(a) [1] 12 16 33 55 66 77 > range(a) [1] 12 77 > median(a) [1] 44 > sd(a) [1] 26.90291 > var(a) [1] 723.7667 > sum(a)..
1. if 문 조건에 따라 문장을 선택적으로 실행 형식 if (조건식) { 참일 때 수행할 문장 } else { 거짓일 때 수행할 문장 } > a if(a%%2==0){ + result result df df a result 1 10 짝수 2 13 홀수 3 7 홀수 4 8 짝수 5 100 짝수 #ifelse(조건식,참,거짓) 작성 > a resultmean(a),"평균초과",ifelse(a df2 df2 a result 1 10 평균미달 2 13 평균미달 3 22 평균초과 4 15 평균초과 5 9 평균미달 3. 반복문 - for 한 개 이상의 문장을 특정횟수만큼 반복처리 형식 for (변수명 in 반복횟수){ 반복할 실행 문장 } #for 기본 예문 > y for(x in 1:5){ + y y [1] 1..
1. 데이터프레임 생성하기 read.table()함수를 이용하여 외부 텍스트 파일을 불러들이는 방법 data.frame() 함수를 이용하여 여러 종류의 자료객체들을 결합시키는 방법 #data.frame()함수 이용해서 데이터프레임 생성 > df df name age 1 joey 21 2 emily 24 3 ellen 25 4 ronja 25 #벡터 생성 후 결합하여 데이터프레임 생성 > name age df1 df1 이름 나이 1 joey 21 2 emily 24 3 ellen 25 4 ronja 25 #특정 컬럼 조회 > df1$나이 [1] 21 24 25 25 #행렬 생성 후 데이터프레임으로 변환 > carinfo carinfo [,1] [,2] [1,] "11km" "h사" [2,] "13km" "..
리스트(list) - 숫자형, 문자형 데이터를 섞어서 저장이 가능하며 벡터와 같이 인덱스 번호로 내부 데이터 접근이 가능 1. 리스트 만들기 리스트 값들도 결국은 변수에 할당 list()함수를 이용하여 생성 list(키1=값1,키2=값2...): 해당 키에 값을 할당 #list생성 > myfavorite myfavorite $friend [1] "홍길동" $mymum [1] 7 $myalpha [1] "z" #리스트의 특정키 조회 -> $이용 > myfavorite$myalpha [1] "z" 2. 리스트에 항목 추가 형식: 변수명$추가할key myfavorite$mysong myfavorite $friend [1] "홍길동" $mymum [1] 7 $myalpha [1] "z" $mysong [1] "..
벡터(VECTOR) 같은 유형의 데이터를 여러 개 변수로 보관해야 할 경우 벡터를 사용 여러 변수들을 하나의 이름으로 묶은 집합 벡터의 항목을 변경할 수 있으며, 추가 작업이 가능 벡터의 각 항목에 이름을 부여하여 인덱스 뿐만 아니라 이름으로도 접근이 가능 1. 벡터 생성작업 c()함수를 이용하여 벡터 생성 벡터 항목의 요소들은 한가지 데이터 타입이어야 하며, 그렇지 않을 경우 강제 형변환을 일으키게 됨. 2. 벡터 항목에 이름설정하기 names()함수을 이용하여 이름 설정 names() 반환값은 지정한 이름값을 문자열 벡터에 할당 names(이름을 저장할 객체) c_v setequal(a_v,c_v) [1] TRUE 5. 벡터에 연속적 데이터 할당하기 연속적 데이터(일정 규칙대로 값을 할당)를 벡터에 ..
R의 데이터 구조 R은 통계 데이터 분석용으로 널리 사용되는 프로그래밍 언어이며, 기계학습에서 많이 사용하는 R 데이터 구조는 벡터(vector), 팩터(factor), 리스트(list), 어레이(array), 데이터 프레임(data frame)이 있다. 벡터(vector) 기본 R 데이터 구조는 벡터이다. 벡터는 원소(element)라고 불리는 값의 순서 있는 집합(ordered set)으로 저장한다. 벡터는 원소의 개수를 상관하지 않지만 모든 원소는 같은 타입이어야 한다. 예를 들면 벡터는 숫자와 문자를 둘 다 포함하지 못한다. 데이터 타입 - 정수(interger) - 소수점이 있는 수(numeric) - 텍스트(character) - 논리 값(logical): TRUE 또는 FALSE - NULL..