일곱번째 수업 | 판다스 Pandas

Faithful Dev·2024년 9월 11일

김수정 강사님

강의

Pandas

  • 강력한 데이터 분석 라이브러리
  • Series: 1차원 배열 / DataFrame: 2차원 배열 형태

loc

[pandas.loc]는 데이터프레임의 행과 열을 라벨(인덱스와 컬럼 이름) 기반으로 선택하는 데 사용된다. 인덱스 값이나 조건을 통해 원하는 데이터를 검색하거나 수정할 수 있으며, 행과 열을 명시적으로 지정할 수 있다.

df.loc[row_label, column_label]
  • row_label: 선택할 행의 라벨 조건
  • column_label: 선택할 열의 라벨 (생략 가능)

Personal Insight

EDA와 웹 크롤링에 대하여

작년 파이썬 기초까지만 공부했었던 때와 달리 올해 다시 심기일전하여 배우기 시작한 EDA와 웹 크롤링은 막막하고 어려웠다. 강의에서 제공된 해답 코드를 외우기에 급급했다. 복잡한 데이터를 마주하면 한숨부터 나왔고, 웹에서 필요한 정보를 가져오는 크롤링도 어디부터 어떻게 시작해야 할지 막막했다. HTML 태그는 무엇인지, 앵커는 또 무엇인지, 아무것도 모르는 채로 시작한 공부는 벽에 부딪힌 것만 같았다. 실시간 강의의 장점은 이런 곳에 있는 것 같다. 바로바로 생기는 질문을 던질 수 있는 것. 조금씩 개념이 이해되기 시작하고, 내가 이제껏 작성해왔던 코드들, 혹은 해석을 보고 따라 적어왔던 코드들이 무슨 의미인지 깨닫게 되며, 내 스스로 뭔가를 만들어 가는 즐거움을 다시 회복한 오늘이었다.

뿌듯함

단순한 예제를 따라 겨우겨우 코드를 작성했던 이전과는 다르게, 내가 원하는 데이터를 필터링 해나가는 과정에서 드는 성취감이 생겼다. pandas 라이브러리를 활용한 데이터 분석을 다시 한 번 배우면서, 이전에는 몰랐던 감각? 감?을 잡은 것 같다. BeautifulSoup과 requests를 활용하는 것에 대한 자신감이 생기자 '가능하다'라는 생각에 뿌듯함이 커졌다.

욕심

AI 과정을 선택했던 것도 결국 데이터에서 더 나아가고 싶은 욕심이었다. 이제는 단순한 데이터 분석이나 웹 크롤링을 넘어, 더 복잡하고 의미 있는 작업을 하고 싶은 욕심이 생긴다. 주어진 데이터를 단순히 분석하는 것을 넘어서, 패턴을 찾아내고 예측하는 과정으로 나아가고 싶고, 이것을 또 자동화하고 싶고, 누군가에게 의미있는 데이터를 만들어주고도 싶다. 그만큼 아직 배워야 할 것도 많고, 부족한 부분도 어마무시하지만, 계속해서 도전하고 배우는 과정을 즐기는 시간들이 되기를!

profile
Turning Vision into Reality.

0개의 댓글