이번 수업에서는 프로젝트 진행 시 착수보고서 작성 및 발표자료 작성 시 유의사항에 대해 구체적으로 학습하였다.
착수보고서 작성 시 유의사항
- 프로젝트 시에는 착수보고서, 결과보고서, 산출물, 발표자료 제출이 필수된다.
- 착수보고서는 제안요청서의 내용 요약 및 실현 가능/불가능 여부 작성하여 제출(조건표를 통해 작성).
- 실현 불가능이거나 부분가능인 경우 이유를 명시해야 한다. 불가능의 경우 어떻게 하면 가능할 수 있는지 추가 제안을 함께 명시해야 한다(ex. 대체, 시간 연장, 교육 추가 등).
- 내용은 짧아도 괜찮으니 부풀림X
- 요약 문단은 필수로 포함되어야 하며 두괄식으로 작성하기!
- 국제표준 문서 사용(odf, pdf, docx, pptx, odp).
- 영문약어 뿐만 아니라 약어 사용 시 모두 설명 필요. 약어를 정리해서 주석으로 표시하는 것도 좋다.
- 착수보고서에 대해서는 제안자와의 사전 협의가 반드시 요구된다.
- 최종 프로젝트에서는 클라이언트의 의견이 최우선되어야 한다.
1) 일반현황: 관리 책임자 중심 기술. 분석작업에서는 기본적으로 전체참여 필요.
2) 전략 및 방법론: 콘텐츠가 들어가야하는 경우 콘텐츠 정의서 필요하다. 개발방법론은 기술 및 기능 정의서 요약을 포함하여 작성되는 경우가 많다.
3) 기술 및 기능: 스토리보드 사용. 필요 시 와이어프레임 내용으로 작성.
4) 성능 및 품질
5) 프로젝트 관리: 일정계획의 경우 WBS를 잘 작성하면 생략 가능.
분석 계열 보고서 작성 시 유의사항
- IMRaD 양식 기반으로 하며 키워드 설명이 있으면 좋다!
- 서론에는 목적을 명확히 명시해야 한다. 결과에는 코드를 그대로 보고서에 쓰는 것이 아니며 의사코드 및 순서도를 사용하여 개발 구조를 보여주는 것이 좋다.
- 데이터 자료, 파이썬 패키지 모두 인용을 적어야 한다.
전처리 및 데이터 분석에 대한 방법도 함께 학습하였다.
데이터 전처리: 데이터를 정보로 바꾸는 작업
- 누락 값을 적당히 처리해야 데이터 분석에 용이하다.
- 오차: 수정하거나 명확한 오차 수정이 모호한 경우 다른 방법으로 해결해야 한다.
- 이상치: 다른 데이터와 대조 등의 방법을 통해 수정해야 한다.
- 데이터 클리닝: 중복 삭제, 관련 없는 데이터 삭제, 대소문자 일치, NA표기 통일, 이상치 처리, 누락 데이터 처리, 수정된 데이터 평가 등이 포함.
- 데이터 통합: 동일한 데이터 통합, 두 데이터 간 차이 확인, 같은 의미 가지는 데이터 검토 등이 포함.
- 데이터 변환: 단위 변환, 파싱, 형태 변환, 여러 의미를 가진 데이터의 경우 분리 저장 등이 포함.
- 데이터 축소: 차원 축소(PCA, LDA), 유효숫자 변경, 수량 감소, 데이터 속성 제거, 클러스터링, 샘플링(랜덤샘플링 등), 데이터 용량 축소 등이 포함.
- 표준화, 정규화
데이터 분석
.head(n) # 위에서 n번째 줄까지 본다.
.unique() # 분류에서 종류별로 하나씩 본다.
.dropna(how= ,axis=0) # how=all -> 모두 결측치일 때 / how=any -> 하나만이라도 결측치 있을떄
.inplace=True # 실제 데이터프레임에도 변경된 형태 적용.
- 직접 데이터프레임에 적용되는 함수는 함부로 적용하지 말자!
현재에서의 회고) 데이터 전처리는 어떤 작업을 할 때도 가장 중요하게 이루어지는 작업이기 때문에 어떤 작업들이 있는지 여러번 해보며 익히는 것이 중요하다!!