구글 코랩 3

tnaql·2024년 10월 29일
0

SQL 2

목록 보기
4/26

이제부터 사내 조직을 파악할건데, 사내 조직 파악에 필요한 컬럼들만 모아보겠다.

앞으로 이 컬럼들만을 사용해서 구조를 분석할거기 때문에 tmp0 이라는 변수에 원본을 copy 해서 해당 컬럼만 빼온 데이터프레임을 넣어준다

그러면 department부터 살펴보도록 하겠다

department 컬럼의 각 분류마다 몇 명이 있는지를 알기 위해서는 아래와 같은 코드를 작성한다

df.groupby('컬럼명').size()

컬럼명의 분류마다 count를 해서 숫자를 나타내준다

위와 같은 결과를 내는 방법이 하나 더 있다

위와 같이 하는 건데, 이 방식을 더 자주 사용하게 될 것이다.
여기서 [] 내부의 값은 임의로 지정한 것이며, 이 데이터프레임에 존재하는 다른 컬럼값을 넣어도 값을 똑같다 (count는 셀의 갯수만 세는 거기 때문에)
그러니까 이 방식은 department에서 각각 항목에 속하는 ' 컬럼명 '의 셀의 갯수를 세어라 라는 명령이라고 볼수 있는 것이다. 즉, []내부에 들어가는 컬럼명의 값은 아무 영향도 미치지 않는다.

또 하나 같은 값을 내는 것은 위의 명령과 같다.

세 가지 방법을 기억해두면 도움이 될 것

profile
이직 준비중

0개의 댓글