Big Data Processing Using Python [4]

Ann Jongmin·2025년 4월 3일
0

Data Processing

목록 보기
4/9

Python 기초 문법 정리

1. 반복문

1) for문

기본 개념:
for문은 리스트, 문자열, 튜플, 딕셔너리 등 iterable 객체의 각 원소에 대해 반복 작업을 수행합니다.

2) for문과 리스트

리스트 순회 및 리스트 컴프리헨션:
for문을 사용해 리스트의 각 원소를 처리하거나, 한 줄의 코드로 새로운 리스트를 생성할 수 있습니다.

3) for문과 문자열

문자열 순회:
문자열의 각 문자를 순회하며 원하는 작업을 수행할 수 있습니다.

4) for문과 range()

range() 함수:
range()는 지정한 범위의 숫자를 생성하는 range 객체를 만듭니다. 이 객체는 리스트와 유사하게 순회할 수 있으나, 실제 리스트가 아니므로 메모리 효율적입니다.

for문 + range() 사용 예제
사용 예제:
for문과 range()를 결합해 숫자 범위를 순회하는 예제를 보여줍니다.

range 객체 출력:
print(s)와 같이 출력하면, range 오브젝트 형태인 range(0, 5)가 나타납니다.

리스트 컴프리헨션 내 for문
for문을 리스트 컴프리헨션에 사용하면,
1. 단순 반복으로 리스트를 생성하거나,
2. 먼저 반복문이 실행된 후 각 원소에 연산을 적용하거나,
3. 조건문과 결합하여 필터링 후 연산을 적용할 수 있습니다.

풀어서 쓰면,
1번째 원래하던 for문을 이용한 리스트 오브젝트 생성.
2번째 for문이 먼저 실행되고 num3이 실행.
3번째 for문이 먼저 실행되고 그다음 if문이 실행되고 그다음 num3이 실행.

5) while 반복문

기본 개념:
while문은 주어진 조건이 참인 동안 반복 실행되며, 조건을 제어하기 위한 카운터 변수의 초기화 및 업데이트가 필요합니다.
-> condition을 제어하는 카운터 필요
-> condition을 제어하는 카운터의 초기화 필요


2. 제어문: continue, break, pass

continue:

현재 반복의 남은 코드를 건너뛰고 다음 반복으로 진행

break:

반복문 전체를 종료하여 루프를 탈출

pass:

해당 코드 블록을 비워두어 에러 없이 넘어가도록 하는 자리 채움용 명령어
(주로 슈도코드 작성 시 사용)

(슈도코드, pseudocode)는 프로그램을 작성할 때 각 모듈이 작동하는 논리를 표현하기 위한 언어.
-> 정확한 문법이 아니어도 다른 사람이 이해할 수 있을 정도

데이터 입력 예제
개수를 모르는 데이터 입력:
예제에서는 입력받은 데이터를 split() 함수를 이용해 분리하는 방법을 보여줍니다.


3. 파일 입출력

파일 열기와 텍스트 파일 다루기:
파이썬에서는 open() 함수를 사용하여 파일을 열고 데이터를 읽거나 씁니다.

텍스트 파일의 특징:
텍스트 파일은 아스키 또는 UTF-8 등의 인코딩 방식으로 저장되며, 파일 입출력 시 인코딩 설정과 예외처리가 필요합니다.

이 기능은 OS에 파일 입출력 권한을 요청하는 것 입니다.

추가 파일 입출력 예제:

파일 쓰기 예제:
예제에서는 파일에 데이터를 기록하는 방법을 보여줍니다.


4. 함수

함수 정의 및 호출:
함수는 def 키워드를 사용하여 정의하며, 필요에 따라 인자를 받아 특정 작업을 수행한 후 결과를 반환합니다.

로컬 변수와 글로벌 변수:
함수 내부에서 정의된 변수는 로컬 변수이며, 동일한 이름의 글로벌 변수와는 별개입니다.

글로벌 변수 수정:
함수 내에서 글로벌 변수를 수정하려면, 함수 시작 시 global 변수명을 선언해야 합니다.

객체 복사 및 값 수정:
리스트나 딕셔너리 등 mutable 객체를 다룰 때는 복사(shallow copy, deep copy) 방식에 주의해야 합니다.

예를 들어, swap 함수 내에서 변수 a와 b가 교환되더라도, 이는 함수 내부의 로컬 변수에 국한되며 글로벌 변수에는 영향을 주지 않습니다.

네임테이블 및 메모리 할당 관련 예시:

참고:
기존 객체를 보존하면서 복사한 객체를 수정하는 방법(예: decopy 활용)에 대해 고민해 볼 필요가 있습니다.


5. 모듈

모듈의 개념:
모듈은 파이썬 파일(.py)로 구성되어 있으며, 다른 코드에서 import 문으로 불러와 사용할 수 있는 코드 집합입니다.

사용자 모듈:
직접 작성한 모듈도 다른 파일에서 불러와 사용할 수 있으며, 이를 위해 모듈 파일이 같은 디렉토리나 파이썬 경로에 있어야 합니다.

패키지 관리(PIP):
PIP는 외부 라이브러리의 의존성을 자동으로 관리해주어, 필요한 패키지를 쉽게 설치할 수 있도록 도와줍니다.

profile
AI Study

0개의 댓글