클로드 코드로 18년간의 구글 드라이브 파일 11,571개 메타데이터 분석하기

Jerry·2025년 7월 11일
0

매일 AI

목록 보기
2/5

2006년부터 구글 드라이브에 파일을 저장하고 있었습니다. 해당 데이터를 클로드 코드를 이용하여 분석 하였습니다.

문제

  • 구글 드라이브에 언제인지도 모르게 나의 데이터를 많이 쌓아 두고 있음
  • 쌓아만 두고 활용은 못함
    • 재활용이 안되어 쓰레기가 되는 듯한 느낌
  • 일별/주별 어떤 주기로 쌓고 있는지 궁금함

데이터

  • 구글 드라이브 내 파일

AI 도구

  • 클로드 코드, 커서(혹은 VSCode 가능할 듯)

TL;DR

  • 클로드 코드로 구글 드라이브의 18년 간 11,571개의 메타 데이터를 분석했습니다. 20년 가까운 데이터인데, 비록 메타 데이터이지만 분석했다는 것이 무척 만족스럽습니다.
  • 하지만 파일 내용을 읽어오지는 못하고 단순히 생성 날짜, 제목 등 메타 데이터만 검색합니다. 파일 내용은 제미나이 혹은 구글 API(아마도)를 사용해야 합니다.

내용

구글 드라이브를 로컬 디스크로 마운트 하여 로컬 구글 드라이브를 사용합니다.
해당 디스크의 루트 드라이브 위치에서 클로드 코드를 실행합니다.

프롬프트

  • 구글 드라이브의 전체 파일을 분석해줘. 언제부터 파일을 저장했는지, 주별/월별 얼마나 많은 파일을 생성하였는지 알려줘.

답변

  • Todos 형식으로 클로드 코드가 일합니다.

  • 파일이 많아 분석 작업에 30분 이상 오래 걸렸습니다.

  • 아래와 같이 클로드 코드에 권한을 주면 자동으로 파일을 저장하고 코드를 실행합니다.

  • 파이썬 파일 만들고, CSV 파일도 만듭니다.

  • 과연 파일 갯수가 얼마나 될까? 많으면 그걸 다 분석할 수 있을까? 쫄립니다.

  • 일부 작업이 완료되면 Toods 리스트를 알아서 업데이트 합니다. Taskmaster MCP 등에서 보던 방식입니다.

  • 필요한 파이썬 모듈(Pandas 등) 실행하고 알아서 열심히 일한다. 파이썬 노트북도 실행한다.

  • 파이썬 가상환경에서 코드를 실행합니다.

  • 작업 시간이 오래 걸려 이러저런 생각을 합니다.

    • 이걸 하면 어떤 것이 도움이 될까?
    • 이건 마치 데이터 분석해서 뭘할래랑 비슷한 질문인 듯
  • Task 실행하다 중간에 짤리면 어떻게 될까?

    • 작업 시간이 20분 넘어가니 당연히 불안합니다.
    • 작업을 쪼개서 요청해야 하는데, 너무 일반적인 요청이었습니다. 역시 똑똑하게 요청해야 똑똑하게 일합니다.
  • 다행히 Todos 완료합니다.

결과

  • 전체 11,571개라는 엄청난 정보를 분석했습니다. 만족스럽습니다.
## 1. 가장 오래된 파일 정보

### 최초 파일 (2006년 6월 6일)
1. 에이브레인.gsheet
2. 상수도 3차 사업.gsheet
3. 형님 컴터 견적.gsheet

### 초기 파일들의 특징
- 2006년: 3개 (모두 Google Sheets 파일)
- 2008년: 7개 (주로 프로젝트 관리 및 업무 관련)
- 2009년: 24개 (업무, IT 시스템, 자기계발 관련)
- 아주 오래전에 형님 컴퓨터 견적도 뽑아준 기억이 납니다. 
  • 파이썬으로 그래프도 그려주고 일 잘합니다.
  • 하지만 잘못된 정보도 있습니다. 2022년 도입을 기점으로 지식 관리 방식을 전환했다고 합니다. 저는 그 때 옵시디언을 알지도 못했을건데,,,, (혹은 내가 기억을 못하는 것일수도)
  • 추가 질문

  • 2022년 데이터 분석 결과 - 구글 계정을 이전하면서 파일 이전 배치 작업을 실행하였습니다.

  • 근거를 물어보아야 겠다. 너는 어떻게 2022년 옵시디언으로 관리 체계가 변경되었는지 알고 있는거야?

  • 2022년 아니라 2024년 2월이라고 알려줍니다. 잘 기억은 안나지만 GPTers 세미나 듣고 시작한 것 같습니다. 나도 몰랐는데, 그래도 옵시디언을 꽤 오래전에 사용했네요.

  • 이 데이터를 이용해서 뭘 할 수 있을까?

    • 일단 나에 대하여 좀 더 자세하게 알게되었다. 이것만 해도 매우 훌륭한 성과다.
  • 현재 정리되지 않은 파일을 알아서 디렉토리로 옮겨달라고 하였습니다.

  • 일 잘합니다.

  • 매우 다행히도 이미 정리가 되어 있는 하위 Obsidian 디렉토리는 유지하였습니다.

    • 폼 미쳤다. 그대로 유지했다.
  • 결과

비록 파일의 내용을 읽지는 못했지만, 클로드 코드 이용해서 구글 드라이브에 언제부터 파일을 저장했는지, 얼마나 많이 파일을 생성했는지 등을 알게되었습니다.

나의 데이터를 이용해서 데이터를 분석한 만족스러운 경험이었습니다.

profile
도서 <24단계 실습으로 정복하는 쿠버네티스> 저자. 쿠버네티스/EKS 관련 문의 erdia22@gmail.com.

0개의 댓글