문자열 메서드

GreenBean·2021년 12월 3일
0
post-thumbnail

문자열 메서드

텍스트 시퀀스 형 — str

  • 파이썬의 텍스트 데이터는 str, 또는 문자열 (strings), 객체를 사용하여 처리
  • 문자열은 유니코드 코드 포인트의 불변 시퀀스

문자열 메서드

  • 문자열은 공통 시퀀스 연산들을 모두 구현하고 추가적인 메서드도 구현

str.isalnum()

  • 문자열의 구성이 알파벳 혹은 한글 또는 숫자인지 확인하는 방법

  • 문자열 내의 모든 문자가 알파벳과 숫자이고, 적어도 하나의 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌

  • 문자 c 는 다음 중 하나가 True 를 반환하면 알파벳이거나 숫자

    • c.isalpha(), c.isdecimal(), c.isdigit(), c.isnumeric()

str.isalpha()

  • 문자열의 구성이 알파벳 혹은 한글인지 확인하는 방법

  • 문자열 내의 모든 문자가 알파벳이고, 적어도 하나의 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌

  • 알파벳 문자는 유니코드 문자 데이터베이스에서 《Letter》로 정의된 문자

    • 일반 범주 속성이 《Lm》, 《Lt》, 《Lu》, 《Ll》, 《Lo》 중 하나인 문자
    • 이것은 유니코드 표준에서 정의된 《Alphabetic》 속성과 다름에 주의

str.isascii()

  • 문자열이 비어 있거나 문자열의 모든 문자가 ASCII이면 True를 돌려주고, 그렇지 않으면 False를 돌려줌
  • ASCII 문자는 U+0000-U+007F 범위의 코드 포인트를 가짐
  • 버전 3.7에 추가

str.isdecimal()

  • 문자열 내의 모든 문자가 십진수 문자이고, 적어도 하나의 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌
  • 십진수 문자는 십진법으로 숫자를 구성할 때 사용될 수 있는 문자들
    • 예를 들어, U+0660, ARABIC-INDIC DIGIT ZERO
    • 형식적으로 십진수 문자는 유니코드 일반 범주 《Nd》 에 속하는 문자

str.isdigit()

  • 문자열의 구성이 숫자인지 확인하는 방법

  • 문자열 내의 모든 문자가 디짓이고, 적어도 하나의 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌

  • 디짓에는 십진수 문자와 호환성 위 첨자 숫자와 같은 특수 처리가 필요한 숫자가 포함

    • 여기에는 카로슈티 숫자처럼 십진법으로 숫자를 구성할 때 사용될 수 없는 것들이 포함
    • 형식적으로, 디짓은 속성값이 Numeric_Type=Digit 또는 Numeric_Type=Decimal인 문자

str.isidentifier()

  • 문자열이 섹션 section 식별자와 키워드 의 언어 정의에 따른 유효한 식별자면 True를 돌려줌
  • 문자열 s가 def 나 class와 같은 예약 식별자인지 검사하려면 keyword.iskeyword()를 호출해야 함

str.islower()

  • 문자열 내의 모든 케이스 문자가 소문자이고, 적어도 하나의 케이스 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌

str.isnumeric()

  • 문자열 내의 모든 문자가 숫자이고, 적어도 하나의 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌
  • 숫자는 디짓과 유니코드 숫자 값 속성을 갖는 모든 문자를 포함
    • 예를 들어, U+2155, VULGAR FRACTION ONE FIFTH.
    • 형식적으로, 숫자는 속성 값이 Numeric_Type=Digit, Numeric_Type=Decimal, Numeric_Type=Numeric인 문자

str.isprintable()

  • 문자열 내의 모든 문자가 인쇄할 수 있거나 문자열이 비어있으면 True를 돌려주고, 그렇지 않으면 False를 돌려줌
  • 인쇄할 수 없는 문자는 유니코드 문자 데이터베이스에 《Other》 또는 《Separator》로 정의된 문자
    • ASCII 스페이스 (0x20) 는 예외인데, 인쇄 가능한 것으로 간주
      • 인쇄 가능한 문자는 문자열에 repr() 을 호출했을 때 이스케이프 되지 않아야 하는 것들
      • sys.stdout 또는 sys.stderr 로 출력되는 문자열의 처리에 영향을 주지 않음

str.isspace()

  • 문자열 내에 공백 문자만 있고, 적어도 하나의 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌
  • 유니코드 문자 데이터베이스에서, 일반 범주(general category)가 Zs(《Separator, space》)이거나 양방향 클래스(bidirectional class)가 WS, B 또는 S 중 하나이면 문자는 공백(whitespace)

str.istitle()

  • 문자열이 제목 케이스 문자열이고 하나 이상의 문자가 있는 경우 True를 돌려줌
    • 예를 들어 대문자 앞에는 케이스 없는 문자만 올 수 있고 소문자는 케이스 문자 뒤에만 올 수 있음
    • 그렇지 않은 경우는 False를 돌려줌

str.isupper()

  • 문자열 내의 모든 케이스 문자가 대문자이고, 적어도 하나의 케이스 문자가 존재하는 경우 True를 돌려주고, 그렇지 않으면 False를 돌려줌
profile
🌱 Backend-Dev | hwaya2828@gmail.com

0개의 댓글