데이터 사이언스 시작하기

yiseonline·2023년 7월 17일
0

datascience

목록 보기
1/28
post-thumbnail

0. 목적 및 동기

저번주에 파이썬 중급과정 강의를 끝마치고 이번에는 코드잇이라는 강의 사이트를 결제를 해서 머신러닝 공부를 하려고 한다 내 목표는 8개의 토픽을 개강 전까지 다 듣고 실습하는 것이 목표 !!


1.1 데이터 사이언스란?

학교에서 시험 보는 시험지 - data
그 시험지 뭉텅이 - data set
이 data set을 가지고 평균점수, 잘하는 학생을 추리는 데이터 분석을 할 수 있음

데이터 사이언스 - 데이터를 다루는 일
데이터가 많을 수록 할 수 있는 일이 많다는 뜻 ! - 소프트웨어가 데이터를 많이 수집할 수 있음


1.2 데이터 사이언스가 무엇인가요?

데이터 과학이란 다양한 데이터로부터 지식과 인사이트를 추출하는 분야
필요 역량 - 프로그래밍, 수학과 통계, 전문성


1.3 데이터 사이언스에 대한 오해

  1. 데이터를 모으는 과정
  2. 데이터를 옮기고 저장하는 과정
  3. 데이터를 정리하는 과정
    -- 데이터 엔지니어링
  4. 분석
  5. A/B 테스트
  6. 인공지능

자꾸 인공지능, 딥러닝만 말해대니까 먼저 해야하는 데이터 엔지니어링이 과소평가됨


1.4 왜 파이썬으로 데이터 사이언스 ?

데이터 사이언스 언어 양대산맥 둘은 PythonR 이다
하지만 목적이 다름

R = 데이터 분석이랑 시각화만 할 수 있는 언어 (연구 쪽에서 많이 사용)
Python = R 에 비해 통계와 시각화는 떨어지지만 다른 분야에서 많이 사용되기 때문에 다양한 분야와 접목 가능 (개발을 했던 사람들이 많이 사용)

예전에는 R이 압도적으로 인기가 많았지만 파이썬 라이브러리들에 통계할 수 있는 것들이 많이 생기면서 파이썬이 역전함


1.5 선수 과제

"토마토"나 "기러기"처럼 거꾸로 읽어도 똑같은 단어를 팔린드롬(palindrome)이라고 부릅니다. 문자열 word가 팔린드롬인지 확인하는 함수 is_palindrome를 쓰세요. is_palindrome은 word가 팔린드롬이면 True를, 팔린드롬이 아니면 False를 리턴합니다.
반드시 for문을 사용하셔야 합니다.
append, insert 메소드와 del 함수를 사용하면 안됩니다.

def is_palindrome(word):
    length = len(word)
    for i in range(length // 2):  # 단어의 반 이하까지만 비교하면 됨
        if word[i] != word[length - 1 - i]:
            return False
    return True

# 테스트 코드
print(is_palindrome("racecar"))
print(is_palindrome("stars"))
print(is_palindrome("토마토"))
print(is_palindrome("kayak"))
print(is_palindrome("hello"))

1강 완료 !

0개의 댓글