[데이터베이스] 데이터와 정보

k·2024년 2월 10일
0

데이터베이스

목록 보기
1/2

데이터와 정보

데이터가 뭘까?

데이터는 개발자가 되고부터, 자주 듣는 말일 이다. 그런데도 아직까지 정확한 데이터에 대한 개념을 알고있지 못했다.

데이터는 현실세계(Real-world)로부터 단순 관찰이나 측정을 동해 수집된 사실이나 값을 말한다.

말 그대로 단순히 수집된 무의미한 값이라는 것이다.
무엇인가를 의사결정(Decision) 할 정도의 효력이 있지 않다는 말이다.

그럼 어떻게 의사결정(Decision) 가능한 상태로 만들어?

이 때, 나오는 개념이 정보이다.

정보는 데이터의 유효한 해석이나 데이터의 상호간의 관계를 통해 의사결정이 가능한 지식이다.

즉, 데이터를 정제(Processing)해서 정보로 만들어서, 유의미한 데이터를 만들어 내는 것이다.

  • Processing 방식
    • data processing ( 초기 데이터를 획득하는 과정 )
    • information processing ( 데이터를 유의미한 지식으로 만드는 과정)

정보 시스템이란?

정보 기술을 이용하여 조직 활용에 필요한 데이터를 수집, 조직, 저장, 그리고 처리하여 의사결정에 필요한 정보를 추출하고 제공하는 수단이다.

간단히 말해서 조직내에서 필요한 데이터를 가지고 의사결정에 필요한 정보를 추출하는 수단이다.

데이터 처리 시스템 ( Data Processing System)

🖥️일괄 처리 (batch processing)

순차 접근 방식을 사용하는 업무에 적합하며, System 친화적이다.

  • 장점

    1. 작업을 일괄적으로 처리하다 보니 작업을 처리하는데 드는 처리 비용이 적게 들게 된다.

    2. 짧은 시간에 한꺼번에 작업을 처리할 수 있다보니 시스템 측면에서는 단위 시간당 작업 수가 많게되지만, 이를 순차 접근 방식으로 처리하기 때문에 효율성에 따라 시스템 성능을 높일 수 있다.

  • 단점

    1. 한꺼번에 작업을 처리하기 위해서 사전에 데이터를 한곳에 지속적으로 수집해야한다.

    2. 수집한 데이터를 분류하고 분류된 데이터를 컴퓨터가 처리할 수 있게 파일에 수록해야하는 작업이 필요하다.

    3. Batch Processing 만으로 사용자의 니즈를 만족시킬 수 없는 특성이 존재한다.

🖥️실시간 처리 (On-line(Real-time) processing )

사전 준비없이 데이터를 즉시 처리하는 방식(온라인 채팅 등에 유효)이며, 사용자 친화적이다.

  • 장점

    1. 데이터 입력에 대해서 분류나 정리 작업 등이 거의 필요없다.

    2. 작업을 즉시 수행하기 때문에 오류 발생시, 즉시 발견할 수 있다.

    3. 즉시 처리하는 방식의 특성상 데이터의 최신성을 유지할 수 있다.

  • 단점

    1. 많은 원격 터미널들과 계속적인 통신을 유지해야하므로, 으를 위한 통신 제어기가 필요하기 때문에 구조가 필연적으로 복잡해진다.

    2. 응답 시간을 최소화 하기 위해서는 지속적으로 정상 가동 상태를 유지해야하고 잠시의 정지도 허용되지않는다. 이는 결과 적으로 작업당 처리 비용이 높아지게 되는 원인이 된다.

    3. 시스템이 항상 가동되어야하므로, 테스트나 시스템 유지보수가 어렵고, 고장 시 회복이 어렵다.

🖥️분산처리 (Distributed processing(upgraded real-time processing method))

모든 지역들을 통신 네트워크로 연결하여 각 지역에서 수행한 작업들을 통합하여 원하는 결과를 얻는 시스템이다.

마치 하나의 컴퓨터에서 하나의 컴퓨터 화면을 통해 처리 되는 것처럼 구현되어있다. (투명성)

  • 장점

    1. 지역 문제 발생 시 신속한 조치 가능(분리의 특성)

    2. 지역 업무에 대한 명확한 책임 구분 가능(분리의 특성)

    3. 새로운 응용 시, 기존의 시스템을 모듈식으로 사용하여 구축에 용이

    4. 장애에 대한 자원 재편성으로 신뢰성 증대

    5. 다른 H/W의 허용으로 CI/CD 가 가능하다.

  • 단점

    1. 자원 관리가 어렵다.

    2. 통신 네트워크로 인해서, 하나의 시스템 처럼 보이도록 구현해야하므로 시스템의 구현이 복잡하다.

    3. 네트워크에 부하로 인한 성능저하가 발생할 수있다.

    4. 테스트 및 유지보수의 어려움이 존재한다.

다 언제 쓰이는 건데..?

일괄 처리

배치처리 방식 같은 경우에는 은행업무가 대표적인 예시이다.
은행 창구에서 정산 업무를 맡아서 하고, 이를 은행 영업이 끝나면 거래내역이 자동으로 갱신되어 입력된다.

실시간 처리

카카오톡이 그 대표적인 예시이다. 바로 바로 실시간으로 요청에 대한 응답을 하게 된다.
사용자A가 있고 사용자B가 있다.
둘이 대화 하는 것이 일괄 처리 방식처럼 채팅을 한번 보내면, 하루가 지나야 도착하면 이는 서비스로써 실격이다. 이러한 서비스형태에서 주로 쓰인다.

분산 처리

분산 처리는 여러 지역 또는 시스템 간에 작업을 나누어 처리하는 방식이다.

인터넷 검색 엔진이 그 대표적인 예시이다.

엄청난 양의 트래픽이 검색 엔진으로 몰렸을 때, 단일 시스템의 경우 바로 시스템 마비가 될 수 있다. 하지만, 분산 처리를 통해서 일정 사용자만큼 분산된 곳에서 처리를 하여 좀 더 대용량에 효율적으로 대응할 때 주로 사용된다.

profile
You must do the things you think you cannot do

0개의 댓글