wc,csplit

박태영·2024년 4월 4일
0

wc

  • 해당 파일의 내용을 단위별로 세서 갯수를 리턴해주는 함수
  • 옵션없이
  • -l 옵션을 주면 라인갯수를 리턴함
  • -c 옵션을 주면 바이트 수를 리턴함
  • -w 옵션을 주면 단어 갯수를 리턴함
wc k
13921   68849  677977 k
라인     단어     바이트

csplit

  • 파일을 패턴으로 나누는 명령어
  • 뒤에 숫자를 입력하면 해당 라인을 기준으로 파일을 나눔
  • 뒤에 숫자를 나열해서 해당 라인 만큼 파일을 나눌 수 있다
csplit 파일이름 10 50 1000
(10줄 50줄 1000줄 이 될때마다 나눔 ,총 4개파일)
  • 정규표현식을 이용해서 파일을 나눌 수 있음
csplit 파일이름 /sync/
(첫번째 "sync"가 들어가는 줄을 기준으로 이전과 이후로 나눔)
  • 정규표현식을 나열함으로써 해당 패턴이 나타날때마다 파일로 나눌 수 있음
  • 패턴뒤에 숫자를 붙이면 해당 패턴이 들어간 줄에서 몇줄 더 가져오거나 덜가져옴
csplit 파일이름 /test/1 (혹은 음수도 가능)
  • -f옵션을 주면 접두사를 설정할 수 있음
csplit -f t_ k  /패턴/1 
-rw-r--r--  1 nayuta  staff    53K  4  3 12:25 t_00
-rw-r--r--  1 nayuta  staff   609K  4  3 12:25 t_01
  • {*}를 입력하면 해당패턴이 나올때 마다 파일로 나눔
csplit -f pre_ 파일명 /pattern1/ {*}
"pattern1"이 나올때 마다 파일로 나눔
  • 패턴을 %% 사이에 넣으면 해당 패턴이 나온 이후만 가져온다
csplit 파일명 %http% 
csplit 파일명 %http% {20} ("http"가 20번째 나온 이후의 내용을 가져옴)
profile
어른 아이

0개의 댓글