웹개발 종합반 3주차 로그 - Python, Beautiful Soup, MongoDB, Pymongo

abeeec·2023년 1월 8일

Python

프로그램을 만들 수 있는 개발 언어.
사람이 이해하기 쉬운 방식으로 만들어졌다.
들여쓰기(Indentation)가 중요하다.

Javascript와 마찬가지로 반복문과 조건문에 대해 익혀야한다.

반복문

for tr in trs:
	print(tr)

조건문

if a is not None:
	print(tr)

Beatiful Soup

HTML, CSS 등 웹 정보를 가져와서 조작할 수 있는 파이썬 패키지(Python Package)

Package

누군가 만들어둔 프로그램. 직접 만들지 않고 만들어진 것을 가져다 쓸 수 있다.

아래와 같은 방식으로 불러올 수 있다.

  • import requests
  • from bs4 import BeautifulSoup

MongoDB

NoSQL의 일종. NoSQL은 Not only SQL 이라는 뜻.
JSON 형태로 데이터를 저장할 수 있다.
저장된 내용들을 Collection 이라고 함.

저장된 데이터 예시

[
	{
    	'_id': '...',
        'name': '영희',
        'age': '25'
    },
	{
    	'_id': '...',
        'name': '철수',
        'age': '30'
    },    
]

Pymongo

MongoDB에 쉽게 접근하고 데이터를 컨트롤할 수 있는 Python Package.
from pymongo import MongoClient 로 가져옴.

Key Takeaways

BeautifulSoup

  • 처음에는 HTML이 잘 가져와지는지 전체 호출을 해봐도 좋다.
  • 가져오고 싶은 HTML의 일부 위치를 브라우저에서 (검사, 개발자도구로) 찾아서 해당 HTML 태그 묶음에 selector를 찾아야한다. (해당 HTML 위치에서 우클릭)
  • text(HTML 태그 안의 텍스트 가져오기), strip()(특정 내용 없애기) 등의 개념이 있다.

기타

  • 모든 과정을 쪼개서 생각하자.
  • 모든 언어와 패키지에는 버전(Version)이 있다. 버전이 다른 경우에는 예상치 못한 일이 생길 수 있다.
  • 파일이나 프로젝트별로 언어, 패키지를 설정해주는게 좋다. (용량도 얼마 차지 하지 않음)
  • 가상환경(venv: Virtual Environment)라는 개념이 있다. 파일을 가상으로 구분해서 저장할 수 있음.
  • 재시작했을 때는 항상 어떤 환경에 있는지 잘 확인하자. e.g. '(venv)로 시작하나?'

0개의 댓글