R 프로그래밍_변수,패키지,조건문과 반복문 [혼자 공부하는 R 데이터 분석 2주차]

김서윤·2025년 7월 25일
0
post-thumbnail

변수 만들기

변수 = 특정 범위 안에서 다양하게 변하는 값

  • 첫 문자는 반드시 영문자(알파벳) 또는 마침표를 사용
  • 첫 문자에는 숫자, 밑줄 문자(_) 를 사용할 수 없음
  • 마침표(.) 와 밑줄 문자(_)를 제외한 특수 문자는 사용할 수 업승ㅁ
  • 대문자와 소문자를 구분
  • 변수명 중간에 빈칸을 넣을 수 없음 빈칸은 밑줄 문자(_) 활용

변수명 코드

변수명 <- 값 

## ex) x <- 10 = '데이터 10을 변수 x에 할당합니다' 의미 

함수 호출하기

함수 = 특정한 기능을 수행하기 위해 사전에 만들어진 프로그래밍 구문을 묶어놓은 것

함수 코드

함수명(인자)

내장 함수 사용하기

내장함수 = 별도의 패키지를 설치하지 않고 사용할 수 있는 함수

  • 문자 출력하기
Print ("문자")
  • 더한 값 출력하기
sum (1 : 100) -> 1부터 100까지 더한 값을 의미
  • 날짜 출력하기
Sys.Date()

사용자 정의 함수 만들기

사전에 정의된 내장 함수 이외에도 사용자가 임의로 함수를 만들 수 있음

사용자 정의 함수 코드

함수명 <- function(매개변수1, 매개변수2, ....){
	함수가 구형할 내용
    
    ...
    
    return(결괏값)
}
  • 함수명 : 함수의 이름 - 함수를 호출할 때 사용
  • 매개변수 : 함수의 변수 - 함수가 호출될 때 전달되는 어떠한 값 = 파라미터
  • 함수가 구현할 내용 : 사용자가 함수의 기능을 프로그램 언어로 정의한 구문
  • 결괏값 : 함수의 기능이 수행된 결과로 함수 본문의 마지막 표현식

사용자 정의 함수를 만들 때는 return()함수가 반드시 필요

return()을 넣는다면 변수를 따로 출력하기 전에는 값이 출력되지 않지만 return()을 넣지 않고 함수를 만들게 되면 변수에 저장하여 변수를 따로 호출하지 않았는데도 값이 출력됩니다.



패키지

패키지 = 여러 함수를 기능에 따라 묶어서 제공하는것

패키지 설치하기

  1. 함수를 이용해서 설치하는 방법
  2. R 스튜디오의 인터페이스를 이용하는 방법

함수를 이용해서 설치하는 방법

install.packages("패키지명")

R 스튜디오 Packages 탭

  1. [Packages] 탭에서 [Install] 버튼 클릭
  2. Packages 입력란에 패키지명 입력한 후 Install 버튼을 클릭합니다.
    Console 탭을 보면 Script 탭을 이용할 때와 동일하게 서치가 진행되는 것을 확인
  • library()함수
    R 스튜디오에 설치되어 있는 전체 패키지 목록을 확인할 수 있음

패키지 로드하기

패키지 로드 코드

library(패키지명) -> 큰 타옴표를 사용하지 않음

패키지 삭제하기

패키지 삭제 코드

remove.packages("패키지명")

필요한 패키지 찾아보는 방법
주요 패키지 외에 필요한 패키지는 CRAN 웹 사이트의 패키지 목록 페이지에서 찾을 수 있음 현재 R에서 사용할 수 있는 거의 모든 패키지가 알파벳 순서로 정리되어 있음



조건문과 반복문

연산자

연산자 = 프로그램에서 데이터를 처리하는 연산 기호

  • 할당 연산자
  • 산술 연산자
  • 관계 연산자
  • 논리 연산자

할당 연산자 = 대입 연산자

특정 값을 변수에 저장하며 우항에 있는 값이 좌항에 할당

할당 연산자기능
<-변수에 값을 저장

<- 와 =의 차이점
두 연산자 모두 문제없이 변수가 생성됨
<-가 =보다 우선순위가 높음

산술 연산자

숫자를 계산하는 연산자

산술 연산자기능
+더하기
-빼기
*곱하기
/나누기
%/%
%%나머지
** 또는 ^제곱수

관계 연산자 = 비교 연산자

변수 간의 혹은 변수와 값을 비교하여 관계를 TRUE(참), FALSE(거짓)의 진릿값으로 알려주는 연산을 수행하는 연산자

관계 연산자기능
>크다
>=크거나 같다
<작다
<=작거나 같다
==같다
!=같지 않다
!아니다

논리 연산자

관계 연산자로 얻은 진릿값을 다시 연산할 때 사용

논리 연산자기능
&그리고(and)
|또는(or)

if-else 조건문

조건문 = 조건이 TRUE면 실행되는 코드 구문

if(조건) {
	조건이 TRUE(참)일 때 실행되는 구문1
} else {
	조건이 FALSE(거짓)일 때 실행되는 구문2
}
  • else if문
if(조건1) {
	조건이 TRUE(참)일 때 실행되는 구문1
} else if (조건2){
	조건1은 FALSE(거짓)dlrh, 조건2는 TRUE(참)일 때 실행되는 구문2
} else {
	조건1과 2 모두 FALSE(거짓)일 때 실행되는 구문3
}

반복문

반복문 = 정해진 조건만큼 반복 실행되는 구문
보통 반복문은 for()함수, while()함수가 대표적이지만, R에서는 데이터를 정리할 때 빠르게 연산해주는 apply()함수가 주로 쓰임

for()함수

for (변수 in 반복 횟수) {
	반복 조건만큼 실행되는 구문
 }

apply()함수

  • x에는 행렬을 넣고 margin 옵션이 1이면 행, 2이면 열에 함수가 적용
apply(x, margin, 함수)

lapply()함수

  • 연산 결과를 리스트로 반환하는 함수 (벡터, 행렬, 리스트, 데이터 프레임 등 모두 사용)
lapply(x, 함수)

sapply()함수

  • 연산 결과를 벡터로 반환하는 함수
sapply(x, 함수)

R 코드 오류 해결하기
디버깅 = 정상적으로 돌아가고 있는 중간 중간에 값을 출력해 보거나 browser()함수를 이용해 디버깅 모드를 이용하는 것

1. 변수나 객체를 기반으로 함수를 실행할 때 객체가 있는지 확인
2. 괄호나 따옴표가 쌍을 이루는지 확인
3. 특정 패키지의 함수를 사용할 때 패키지를 로드했는지 확인
4. 결과에서 Warning 또는 Error가 났을 경우에는 잘 읽어보기

profile
데이터 분석 취업 준비중

0개의 댓글