빅 데이터의 특징: 4V (Volume, Velocity, Variety, Value)
DBMS란? 데이터베이스와 응용 프로그램을 중계해주는 일종의 관리인 역할.
File System의 문제(중복, 일관성 없음, Atomicity(트랜젝션이 모두 성공하거나 모두 실패), 동시 접속)을 해결.
즉, 응용 프로그램은 응용 프로그램 대로 두고, DBMS가 DB를 관리하는 것.
Data Processing Task는 크게 2개. OLTP, OLAP로 나뉨.
OLTP는 Transaction과 관련된, 은행업무, 고지서 발급, Facebook, 압축 등을 말하는 것.
OLAP는 Analysis와 관련된, DW기반 DSS, 데이터 마이닝, 멀티미디어 검색, SNS 관계도 등을 말함.
DB의 역사
최초 DB: 1970s CACM Paper. "모든게 Table에 있고, 집합 기반 Query Language"
이후 IBM의 System R, UC Berkley의 Ingress 등의 등장, ORACLE 등장.
최근에는 Opensource가 늘어나는 추세.
file = open("[FILE]", "[OPTION]")
OPTION - r(Read), w(Write), a(append) / t(Text), b(Binary)
try:
f = open(filename,"rt")
try:
data = f.read()
finally:
f.close()
except IOError:
print("IOError occured")