[R] R 시각화

김민수·2023년 4월 18일

R

목록 보기
2/2
post-thumbnail

📌 R 시각화

1. 그래프

1) 산점도

  • 개념

    • 주어진 데이터를 점으로 표시해 흩뿌리듯이 시각화한 그림
    • plot() 함수 이용
  • plot() 함수 옵션

    • xlab, ylab: x, y축 이름 지정
    • main: 그래프의 제목을 지정
    • pch: 점의 모양을 지정(숫자 지정, 문자 지정)
    • cex: 점의 크기(기본값은 1)
    • col: 표현되는 산점도의 색을 지정
    • xlim, ylim: 그래프에 그려질 값의 범위를 지정할 수 있음
    • type: p(점), l(선), b(점과 선), o(점과 선을 중첩한 형태), n(아무것도 그리지 않음)
    • lty
      • 숫자일 경우 0=그리지 않음, 1=실선(기본값), 2=대시(-) 등
      • 문자일 경우 "blank", "solid", "dashed", "dotted", "dotdash", "longdash", "twodash"
  • par(): 연관된 그래프 다수를 한번에 출력하는 함수

2) 기타 그래프 함수

  • points(): 점을 그리는 함수
    • 이미 그려진 그래프에 추가로 표시
  • lines(x,y, ...) : 연결된 선들을 그래프에 추가하여 그림
  • lowess(): 데이터를 설명하는 일종의 추세선(회귀분석시 많이 사용)
  • abline(): 일차식에 대한 그래프를 표현하는 함수
  • curve(표현식, 구간시작점, 구간끝점): 주어진 표현식에 대한 곡선을 그리는 함수

3) 그래프 옵션

  • identify(): 그래프를 그린 뒤 표현된 산점도의 점을 식별하는 함수
  • legend(): 범례를 표시해주는 함수
  • matplot(), matlines(), matpoints(): 행렬 형태로 주어진 데이터를 그래프에 그리는 함수
  • boxplot(): 상자그림을 그리며, 데이터의 분포를 부여줌
    • 그래프의 점들은 이상치(outlier)에 해당
  • hist(): 값의 범위를 빈도로 표현한 히스토그램을 그리는 함수
    • 빈도가 아닌 밀도를 확인하고 싶다면 freq = FALSE 입력
  • density(): 막대의 너비를 가정하지 않고 모든 점에서 데이터의 밀도를 추정하는 커널밀도를 추정
  • barplot(): 막대그래프를 그리는 함수
  • pie(): 데이터의 비율을 표현하는 목적으로 사용되는 함수
  • pairs(): 산점도 행렬(다변량 데이터에서 변수 쌍 간의 산점도들을 그리는 함수)
    • 상관관계 등의 특징을 쉽게 확인할 수 있음

0개의 댓글