[ R ] 002

이하나·2022년 8월 28일

R

목록 보기
2/4

[1] list

: 여러 자료형을 가진 key와 value로 이루어진 데이터

변수 선언

name <- list( key1 = "value1", key2 = "value2", key3 = "value3" )
: key를 생략하고도 선언이 가능한데, 이 경우 자동으로 각자 기본키가 생성됨

참조

name$key1 => value1

추가 / 삭제

name$key4 = "value4" / name$key4 <- NULL

[2] 문자열 처리

: stringr 패키지를 설치하여 사용

1) str_extract / str_extract_all ( "string", "[a-z]{num}")

: 정규표현식으로 정해진 조건에 따라 추출된 첫문자열 / 모든문자열 을 반환

정규표현식
: [a-z]{2} 영문자 2자 연속될때 반환
: [가-힣]{3,} 한글 3자 이상 연속될때 반환
: [1-9]{1,5} 숫자 1 ~ 5 자 연속될때 반환
: [^가-힣]{3} 한글을 제외한 문자가 3자 연속될때 반환
: [^a-z] 영문자 제외하고 반환
: \\d{2} 숫자 2자 연속될때 반환
: \\w{3,} 숫자 포함 문자가 3자 이상 연속될때 반환

2) str_length( "string" )

: 문자열의 길이 반환

3) str_locate( "string", "tri") => 2, 4

: 일치하는 문자의 첫글자 위치와 마지막 글자 위치를 반환

4) str_sub ( "string", start, end )

: 시작위치부터 끝위치까지 문자열을 슬라이싱하여 부분문자 추출

5) str_to_upper / str_to_lower ( "strIng" )

: 문자열을 모두 대문자 / 소문자로 변환

6) str_replace( "string", "find", "replace")

: 문자열에서 해당 문자를 찾아 바꿈

7) str_c( "string", "more")

: 문자열과 두번째 인수로 지정된 문자열을 이어 반환

8) str_split( "string", "구분자" )

: 문자열을 구분자로 분리

9) paste( vector, collapse = "구분자" )

: 여러 문자열 요소로 구성된 벡터를 구분자로 이음

[3] 데이터 입력

1) scan()

: 입력을 받아 벡터로 받아줌
: what = 자료형 인수를 통해 특정 자료형으로 입력 받을 수도 있음

2) edit(data)

: 해당 데이터를 직접 편집할 수 있는 데이터 편집기를 표시

3) read.table( file = "경로", sep = "구분자", header = T/F, na.string = "결측치 처리" )

: 테이블을 읽어옴

4) read.csv( file = "경로", sep = ",", header = T/F, na.string = "결측치 처리" )

: csv 파일을 읽어옴

5) read.exel( path = "경로", sheet = "읽어올시트", col_names = T/F )

: exel 파일을 읽어옴

6) table( data$column )

: 해당 열의 데이터의 종류와 각 갯수를 반환

7) head / tail ( data )

: 해당 데이터의 상위 / 하위 데이터 를 표시

8) table( data$ column1, data$column2 )

: 데이터의 열 2개의 교차 분할표를 표시

[4] 데이터 출력

1) cat( "print", data, "with strint" )

: 지정된 문자열과 데이터를 출력해줌

2) print( data )

: 변수 혹은 수식 결과만 표시

[5] 데이터 저장

1) sink()

작동 순서

  1. setwd("경로") 디렉토리 설정
  2. library(RSADBE) 패키지 로드
  3. data( 저장할 데이터 ) 저장할 데이터 로드
  4. sink( "저장파일.txt" ) 저장될 파일 오픈
  5. data <- 저장할 데이터 데이터를 변수에 넣기
  6. data 변수 출력 => 파일에 저장
  7. sink() 파일 클로즈

2) write.csv()

작동 순서

  1. setwd("경로") 디렉토리 설정
  2. data <- 저장할 데이터 데이터를 변수에 넣기
  3. write.csv( data, "저장파일.csv", row.names = T/F, quote = T/F )

[응용] grep을 이용하여 원하는 데이터 뽑아내기

find <- grep( "찾을단어$", data$찾을열 )

profile
코딩을 배우는 비전공자 코린이!

0개의 댓글