[CS] 자료구조(Data Structure)

buckshot·2024년 7월 10일

cs

목록 보기

10/15

자료구조는 데이터를 보다 효율적으록 관리하고 저장하기 위한 하나의 방법과 이론을 뜻한다.
이는 데이터의 저장, 검색, 수정, 삭제 등의 작업에 있어서 보다 효율적으로 처리가 가능하도록 해주는 이점이 있기에 백엔드 개발에 있어서 중요한 부분이라고 생각을 한다.

자료구조의 필요성

필자의 경험으로 예전에는 어떠한 가게나 회사의 전화번호를 알고싶을 때 114에 전화를 걸어서 확인하는 방법과 전화번호부 책자에서 찾아서 확인하는 방법이 있었다. 여기서 후자의 방법을 보면 내가 찾고자하는 회사나 가게 등 분류를 거치고 가나다 순서로 정렬이 되어있어 생각보다 빠르게 찾을 수 있다는 장점이 있다.

이렇게 전화번호부를 메모리, 하나의 요소를 데이터로 비유하여 일상에서 예를 찾아볼 수 있다.

이 처럼 자료구조를 이용한다면 데이터의 접근 속도와 처리 속도가 크게 향상이 되어 성능에 최적화가 되며, 보다 효율적으로 메모리를 관리할 수 있다는 점이 있다.

알고리즘에서 자료구조

자료구조는 알고리즘에 있어서 성능과 효율을 결정짓는 중요한 요소라고 생각을 한다. 자료구조는 데이터가 저장되고 조직되는 방식이기 때문에, 특정한 작업을 수행하는데 있어서 필요한 시간과 공간의 효율성에 직접적인 영향을 끼친다고 본다.

만약에 알고리즘에 있어서 잘못된 자료구조를 사용한다면 문제에 있어서 해결은 가능하겠지만 다소 비효율적인 결과를 얻을 수 있다.

간단한 예를 들어보겠다.

수천 개의 전화번호가 저장된 시스템에서 특정 전화번호를 검색하는 코드를 만들어라

이러한 문제를 해결해야 할 때 어떤 방법으로 해결을 할까?
뭐 진짜 간단하게 반복문을 사용해도 해결은 가능할 것이다. 다만 수천 개의 번호에서 진짜 셀 수 없을 정도로 많은 번호가 있는 시스템에서 한다면... 아마 결과를 받기에는 지칠 수 있겠다는 생각이 든다.

그래서 단순한 반복문 대신에 자료구조를 이용해서 해결해보자

정렬된 배열 사용
- 이진 검색 알고리즘을 이용할 수 있다. 해당 알고리즘을 사용하면 시간 복잡도는 $O(lon$ $n)$ 이다. 그러면 기존의 방법보다 훨씬 빠른 검색이 가능해진다.
해시 테이블 사용
- 평균적으로 $O(1)$ 의 시간 복잡도로 매우 빠르게 처리가 가능하다.

Time Complexity, Space Complexity

시간 복잡도(Time Complexity)
알고리즘이 실행되는 데 소모되는 시간을 나타낸다. 데이터의 크기에 따라 시간이 얼마나 소모되는지 분석한다.
공간 복잡도(Space Complexity)
알고리즘이 사용하는 메모리의 양을 나타낸다. 데이터의 크기에 따라 얼마나 많은 메모리를 사용하는지 분석한다.

결과적으로 자료구조는 알고리즘의 성능과 효율성을 결정하는 핵심적인 요소가 된다. 알고리즘을 설계할 때, 문제의 특성과 요구사항을 이해하고, 이에 적절한 자료구조를 선택하는 것이 중요하다.

올바른 자료구조를 사용한다면 보다 좋은 성능으로 해결할 수 있다.

자료구조 분류

이제는 어떻게 자료구조를 분류하는지와 어떠한 자료구조들이 있는지 확인해보자

위 이미지에서 자료형을 저장방식을 기준으로 선형 자료구조와 비선형 자료구조로 구분해서 분류를 했다.

그렇다면 선형과 비선형은 어떠한 차이점이 있을까??

선형 구조
쉽게 생각하면 데이터가 순차적으로 나열되는 구조이다. 이는 각 요소는 하나의 줄로 연결되어 있으며, 해당 자료구조에서는 순서가 중요하다.
- 특징
  데이터를 순차적으로 접근할 수 있다. 그리고 구조가 비교적으로 간단하다는 특징이 있다.
비선형 구조
데이터가 계층적이거나 망상 구조로 나열되어 있는 구조이다. 각 요소는 여러 경로로 연결될 수 있으며, 선형 구조와는 달리 순서가 그닥 중요하지 않다.
- 특징
  데이터 간의 계층적 관계나 네트워크 관계를 표현할 수 있고, 구조가 복잡하여 더 복잡한 문제를 해결할 수 있다는 특징이 있다.