타입과 추상화

김도비·2024년 10월 9일
post-thumbnail

객체지향의 사실과 오해 - 역할, 책임, 협력 관점에서 본 객체지향

03장: 타입과 추상화

  • 추상화를 통한 복잡성 극복
  • 객체지향과 추상화
    • 모두 트럼프일 뿐
    • 그룹으로 나누어 단순화하기
    • 개념
    • 개념의 세 가지 관점
    • 객체를 분류하기 위한 틀
    • 분류는 추상화를 위한 도구다
  • 타입
    • 타입은 개념이다
    • 데이터 타입
    • 객체와 타입
    • 행동이 우선이다
  • 타입의 계층
    • 트럼프 계층
    • 일반화/특수화 관계
    • 슈퍼타입과 서브타입
    • 일반화는 추상화를 위한 도구다
  • 정적 모델
    • 타입의 목적
    • 그래서 결국 타입은 추상화다
    • 동적 모델과 정적 모델
    • 클래스

타입과 추상화

일단 컴퓨터를 조작하는 것이 추상화를 구축하고, 조작하고, 추론하는 것에 관한 모든 것이라는 것을 깨닫고 나면 (훌륭한) 컴퓨터 프로그램을 작성하기 위한 중요한 전제 조건은 추상화를 정확하게 다루는 능력이라는 것이 명확해진다.
- Keith Devlin


해리 벡(Harry Beck)은, 사실적인 지형과 축척은 무시하고 역 사이의 연결성에만 집중한 혁신적인 지하철 노선도를 창조했다.

해리 벡 지하철 노선도의 핵심은 지도가 당연히 가져야 한다고 생각되는 '지형의 정확성'을 버리고 '연결(열차를 갈아타는 것)이라는 목적'에 집중한 결과다.

승객이 꼭 알아야 하는 사실만 정확하게 표현하고, 몰라도 되는 정보는 무시함으로써 이해하기 쉽고 단순하며 목적에 부합하는 노선도를 창조해낼 수 있었다. 즉, 지하철 노선도를 추상화 한 것이다.


추상화를 통한 복잡성 극복

현실에 존재하는 다양한 현상 및 사물과 상호작용하기 위해서는 우선 현실을 이해해야 한다. 문제는 복잡성의 총체인 현실을 그대로 수용하기에는 인간이 지니고 있는 인지 능력과 저장 공간이 너무 미흡하다는 점이다.

따라서 사람들은 본능적으로 이해하기 쉽고 예측 가능한 수준으로 현실을 분해하고 단순화하는 전략을 따른다.

해리 벡의 지하철 노선도는 불필요한 지형 정보를 제거함으로써 단순함을 달성한 추상화의 훌륭한 예다. 해리 벡이 고안한 추상화는 지형 정보를 제거하고 역 사이의 연결성을 강조함으로써 지하철 노선도를 이용하는 승객들의 목적에 맞게 현실을 단순화했다.

이 추상화가 유용했던 이유는 승객들이 지하철을 바라보는 모델과 일치했기 때문이다. 승객들이 지하철을 이용하는 이유와 해리 벡이 지형 정보를 제거한 이유는 동일하다. 역의 위치가 중요한 것이 아니라 역과 역 사이의 연결 관계가 중요했던 것이다.


진정한 의미에서 추상화란 현실에서 출발하되 불필요한 부분을 도려내가면서 사물의 본질을 드러나게 하는 과정이라고 할 수 있다. 추상화의 목적은 불필요한 부분을 무시함으로써 현실에 존재하는 복잡성을 극복하는 것이다. 추상화는 복잡한 현실을 단순화하기 위해 사용하는 인간의 가장 기본적인 인지 수단이라고 할 수 있다.


하지만 어떤 추상화도 의도된 목적이 아닌 다른 목적으로 사용된다면 오도될 수 있다. 추상화의 수준, 이익, 가치는 목적에 의존적이다.

현상은 복잡하다. 법칙은 단순하다. 버릴 게 무엇인지 알아내라.


복잡성을 다루기 위해 추상화는 두 차원에서 이루어진다.
1. 구체적인 사물들 간의 공통점은 취하고 차이점은 버리는 일반화
2. 중요한 부분을 강조하기 위해 불필요한 세부 사항은 제거


객체지향 패러다임을 객체라는 추상화를 통해 현실의 복잡성을 극복한다. 객체지향 패러다임을 이용한 애플리케이션 개발의 첫 걸음은 추상화의 두 차원을 올바르게 이해하고 적용하는 것이다.



객체지향과 추상화

모두 트럼프일 뿐

이상한 나라의 앨리스는 정원에서 정원사, 병사, 신하, 하객 등과 마주치지만 '기껏해야 트럼프에 불과해' 라고 생각한다. 계급, 나이, 성격 등의 차이점은 무시한 채 모든 객체를 '트럼프'라는 하나의 개념으로 단순화하고 추상화해 바라보고 있는 것이다.


그룹으로 나누어 단순화하기

명확한 경계를 가지고 서로 구별할 수 있는 구체적인 사람이나 사물을 객체지향 패러다임에서는 객체라고 한다.


앨리스는 인물들을 하나씩 살펴보면서 자신이 알고 있는 '트럼프'의 의미에 적합한 인물은 '트럼프' 그룹에 포함하고 '트럼프'라는 의미에 적합하지 않은 인물은 '트럼프' 그룹에서 제외했다.


개념 (concept)

앨리스가 인물들의 차이점을 무시하고 공통점만을 취해 트럼프라는 개념으로 단순화한 것은 추상화의 일종이다.

객체지향 패러다임의 중심에는 구체적이고 실제적인 객체가 존재하지만 수많은 객체들을 개별적인 단위로 취급하기에는 인간의 인지 능력이 부족하다. 따라서 사람들은 본능적으로 공통적인 특성을 기준으로 객체를 여러 그룹으로 묶어 상황을 단순화하려고 한다.

이처럼 공통점을 기반으로 객체들을 묶기 위한 그릇을 개념(concept)이라고 한다. 개념을 이용하면 객체를 여러 그룹으로 분류(classification) 할 수 있다.

결국 각 객체는 특정한 개념을 표현하는 그룹의 일원으로 포함된다. 객체에 어떤 개념을 적용하는 것이 가능해서 개념 그룹의 일원이 될 때 객체를 그 개념의 인스턴스(instance)라고 한다.

개념은 객체를 분류할 수 있는 틀을 제공한다. 즉, 객체란 특정한 개념을 적용할 수 있는 구체적인 사물을 의미한다.


개념의 세 가지 관점

개념은 특정한 객체가 어떤 그룹에 속할 것인지를 결정한다. 어떤 객체에 어떤 개념이 적용됐다는 것은 그 개념이 부가하는 의미를 만족시킴으로써 다른 객체와 함께 해당 개념의 일원이 됐다는 것을 의미한다.


객체 분류 장치로서 개념을 이야기 할 때는 다음의 세 가지 관점을 함께 언급한다.

심볼(symbol) : 개념을 가리키는 간략한 이름이나 명칭
내연(intension) : 개념의 완전한 정의. 개념을 객체에 적용할 수 있는지 여부 판단
외연(extension) : 개념에 속하는 모든 객체(인스턴스)의 집합

개념을 구성하는 심볼, 내연, 외연은 객체의 분류 방식에 대한 지침을 제공한다. 하지만 개념이 심볼, 내연, 외연으로 구성돼 있다는 사실보다는 개념을 이용해 객체를 분류할 수 있다는 사실이 더 중요하다.

개념을 이용해 공통점을 가진 객체들을 분류할 수 있다는 아이디어는 객체지향 패러다임이 복잡성을 극복하는 데 사용하는 가장 기본적인 인지 수단이다.


객체를 분류하기 위한 틀

외연의 관점에서 어떤 객체에 어떤 개념을 적용할 수 있다는 것은, 동일한 개념으로 구성된 객체 집합에 해당 객체를 포함시킨다는 것을 의미한다.

객체에 어떤 개념을 적용할지 결정하는 것은 결국 객체들을 개념에 따라 분류하는 것과 동일하다. 따라서 분류란 특정한 객체에 특정한 개념을 적용하는 작업을 의미한다.

어떤 객체를 어떤 개념으로 분류할지가 객체지향의 품질을 결정한다. 객체를 적절한 개념에 따라 분류한 애플리케이션은 유지보수가 용이하고 변경에 유연하게 대처할 수 있다.


분류는 추상화를 위한 도구다

개념을 통해 객체를 분류하는 과정은 추상화의 두 가지 차원을 모두 사용한다. 개념은 객체들의 복잡성을 극복하기 위한 추상화 도구다.



타입 (type)

타입은 개념이다

타입개념과 동일하다.
따라서 타입이란, 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 의미한다.
어떤 객체에 타입을 적용할 수 있을 때 그 객체를 타입의 인스턴스라고 한다.
타입의 인스턴스는 타입을 구성하는 외연인 객체 집합의 일원이 된다.


데이터 타입

컴퓨터가 어떤 작업을 수행하기 위해서는 작업에 필요한 데이터를 메모리 안으로 불러들여야 한다. 메모리에 불러들여진 데이터들은 무수히 많은 0과 1로 변환되어 메모리에 저장된다.

메모리 상에는 타입이라는 질서가 존재하지 않는다. 타입이 없는 체계 안에서 모든 데이터는 일련의 비트열(bit string)로 구성된다. '10010001'이라는 값은 숫자인지 문자인지 알 수 없다.

결국 사람들은 메모리 안의 데이터에 특정한 의미를 부여하기 시작했다. 어떤 데이터에 다른 데이터를 더하거나 빼거나 나누거나 곱할 수 있으면 그 데이터를 숫자형으로 분류했다. 데이터가 여러 문자로 구성돼 있고 다른 문자와 연결될 수 있다면 문자열형으로 분류했다. 어떤 사실에 대한 참/거짓을 이야기할 수 있는 데이터는 논리형으로 분류했다.

이에 프로그래밍 언어에서는 타입 시스템(type system)이 생겨났다. 타입 시스템의 목적은 데이터가 잘못 사용되지 않도록 제약사항을 부과하는 것이다.


타입은 데이터가 어떻게 사용되느냐에 관한 것이다. 타입에 속한 데이터를 메모리에 어떻게 표현하는지는 외부로부터 철저하게 감춰진다. 개발자는 해당 데이터 타입의 표현 방식을 몰라도 데이터를 사용하는 데 지장이 없다.


데이터 타입은 메모리 안에 저장된 데이터의 종류를 분류하는 데 사용하는 메모리 집합에 관한 메타데이터다. 데이터에 대한 분류는 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지 결정한다.


객체와 타입

객체지향 프로그램을 작성할 때 객체를 일종의 데이터처럼 사용한다. 객체를 타입에 따라 분류하고 그 타입에 이름을 붙이는 것은, 프로그램에서 사용할 새로운 데이터 타입을 선언하는 것과 같다.

객체는 행위에 따라 변할 수 있는 상태를 가지고 있다. 애플리케이션 내부의 모든 객체 상태를 모으면 결국 애플리케이션에서 관리해야 하는 전체 데이터를 표현할 수 있게 된다.

그렇다고 객체가 데이터인 것은 아니다. 객체에서 중요한 것은 객체의 행동이다. 상태는 행동의 결과로 초래된 부수효과를 쉽게 표현하기 위해 도입한 추상적인 개념일 뿐이다.


객체가 어떤 행동을 하느냐에 따라 객체의 타입이 결정된다. 어떤 객체들이 동일한 행동을 수행할 수 있다면, 그 객체들은 동일한 타입으로 분류될 수 있다.

객체의 타입은 객체의 내부 표현과는 무관하다. 객체의 행동을 가장 효과적으로 수행할 수만 있다면 객체 내부의 상태를 어떤 방식으로 표현하더라도 무방하다.


행동이 우선이다

객체의 내부 표현 방식이 다르더라도 어떤 객체들이 동일하게 행동한다면 그 객체들은 동일한 타입에 속한다. 그 객체가 어떤 데이터를 가지고 있는지는 타입을 결정하는 데 아무런 영향을 미치지 않는다.


같은 타입에 속한 객체는 행동만 동일하다며 서로 다른 데이터를 가질 수 있다. 여기서 동일한 행동이란 동일한 책임을 의미하며, 동일한 책임이랑 동일한 메시지 수신을 의미한다. 따라서 동일한 타입에 속한 객체는 내부의 데이터 표현 방식이 다르더라도 동일한 메시지를 수신하고 처리할 수 있다.

다만 내부 표현 방식이 다르기 때문에 동일한 메시지를 처리하는 방식은 서로 다를 수밖에 없다. 이는 다형성에 의미를 부여한다. 다형성이란, 동일한 요청에 대해 서로 다른 방식으로 응답할 수 있는 능력을 뜻한다.


데이터 내부 표현 방식과 무관하게 행동만이 고려 대상이라는 사실은 외부에 데이터를 감춰야 한다는 것을 의미한다. 따라서 객체지향 설계는 외부에 행동만을 제공하고 데이터는 행동 뒤로 감춰야 한다. 이 원칙을 캡슐화라고 한다.

이를 위해서는 객체가 외부에 제공해야 하는 책임을 먼저 결정하고, 그 책임을 수행하는 데 적합한 데이터를 나중에 결정한 후, 데이터를 외부 인터페이스 뒤로 캡슐화해야 한다. 이 설계 방법을 책임 주도 설계(Responsibility Driven Design)라고 한다.


객체를 결정하는 것은 행동이다.
데이터는 단지 행동을 따를 뿐이다.
이것이 객체를 객체답게 만드는 가장 핵심적인 원칙이다.



타입의 계층

트럼프 계층

트럼프 타입의 객체는 '납작 엎드릴 수 있고 뒤집어질 수 있다'. 트럼프 인간 타입의 객체는 '납작 엎드릴 수 있도 뒤집어질 수 있으며 걸을 때마다 몸이 종이처럼 좌우로 펄럭일 수 있다'. 여기서 트럼프 인간은 트럼프의 일종이지만 트럼프보다 더 특화된 행동을 할 수 있는 트럼프다.

트럼프 인간은 트럼프가 될 수 있지만 트럼프는 트럼프 인간이 될 수 없다. 즉, 트럼프 인간 타입에 속한 객체는 트럼프 타입 객체에도 함께 속해야 한다.

트럼프는 트럼프 인간을 포괄하는 일반적인 개념이며, 트럼프 인간은 트럼프보다 더 특화된 행동을 하는 특수한 개념이다. 이 두 개념 사이의 관계를 일반화/특수화(generalization/specialization) 관계라고 한다.


일반화/특수화 관계

타입과 타입 사이에는 일반화/특수화 관계가 존재할 수 있다. 일반화와 특수화는 동시에 일어난다.

객체지향에서 일반화/특수화 관계를 결정하는 것은 객체의 상태를 표현하는 데이터가 아니라 행동이다. 어떤 객체가 다른 객체보다 더 일반적인 상태를 표현하거나 더 특수한 상태를 표현한다고 해서 두 객체가 속하는 타입 간에 일반화/특수화 관계가 성립하는 것은 아니다.

일반적인 타입이란 특수한 타입이 가진 모든 행동들 중에서 일부 행동만을 가지는 타입을 가리킨다. 특수한 타입이란 일반적인 타입이 가진 모든 행동을 포함하면서 거기에 자신만의 행동을 추가하는 타입을 가리킨다. 따라서 일반적인 타입은 특수한 타입보다 더 적은 수의 행동을 가지고, 특수한 타입은 일반적인 타입보다 더 많은 수의 행동을 가진다.


슈퍼타입과 서브타입

일반화/특수화 관계에서 일반적인 타입을 슈퍼타입(super type)이라고 하고 특수한 타입을 서브타입(sub type)이라고 한다.

어떤 타입이 다른 타입의 서브타입이 되기 위해서는 행위적 호환성을 만족시켜야 한다. 서브타입은 슈퍼타입의 행위와 호환되게 때문에 서브타입은 슈퍼타입을 대체할 수 있어야 한다.


일반화/특수화 관계를 표기할 때는 슈퍼타입이 상단에, 서브타입이 하단에 위치하며 속이 빈 삼각형으로 연결해 표현한다. 이때 서브타입에서는 슈퍼타입과 중복된 행위를 생략할 수 있다. 슈퍼타입의 행동은 서브타입에게 자동으로 상속된다.


일반화는 추상화를 위한 도구다

추상화의 두 번째 차원은 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거시켜 단순하게 만드는 것이다. 일반화/특수화 계층은 객체지향 패러다임에서 이 두 번째 차원을 적절하게 활용하는 대표적인 예다.



정적 모델

타입의 목적

왜 타입을 사용해야 하는가? 객체지향은 객체를 지향하는 것이므로 객체만 다루면 되지 않을까? 타입을 사용하는 이유는 인간의 인지 능력으로는 시간에 따라 동적으로 변하는 객체의 복잡성을 극복하기 어렵기 때문이다.


앨리스라고 하는 객체의 상태는 변하지만 앨리스를 다른 객체와 구별할 수 있는 식별성은 동일하게 유지된다.

타입은 시간에 따라 동적으로 변하는 객체의 상태를 시간과 무관한 정적인 모습으로 다룰 수 있게 해준다.


그래서 결국 타입은 추상화다

앨리스의 키가 어떻게 변할 수 있는지 고려할 때는 구체적으로 키가 얼마인가보다는 단순히 키가 변할 수 있다는 가능성에 집중해야 한다. 앨리스가 버섯을 먹거나 음료를 마시거나 부채질을 할 때마다 키는 변할 것이다. 실제로 그런 행동을 할 때 키가 어떤 값을 가지는지는 중요하지 않다.

즉, 타입은 추상화다. 타입을 이용하면 객체의 동적인 특성을 추상화할 수 있다. 결국 타입은 시간에 따른 객체의 상태 변경이라는 복잡성을 단순화 하는 방법이다.


동적 모델과 정적 모델

객체를 생각할 때 객체가 특정 시점에 구체적으로 어떤 상태를 가지느냐객체가 가질 수 있는 모든 상태와 모든 행동을 시간에 독립적으로 표현하는 것을 동시에 고려해야 한다.

객체가 특정 시점에 가지는 상태를 스냅샷(snapshot)이라고 한다. UML에서는 객체 다이어그램(obejct diagram)이라고도 불린다. 스냅샷처럼 실제로 객체가 살아 움직이는 동안 상태가 어떻게 변하고 행동하는지 포착하는 것을 동적 모델(dynamic model)이라고 한다.

객체의 상태와 행동을 시간에 독립적으로 표현하는 모델을 타입 모델(type model)이라고 한다. 이 모델은 동적으로 변하는 객체의 상태가 아니라 객체가 속한 타입의 정적인 모습을 표현하기 때문에 정적 모델(static model)이라고도 한다.


객체지향 애플리케이션을 설계하고 구현하기 위해서는 객체 관점의 동적 모델과 타입 관점의 정적 모델을 적절히 혼용해야 한다. 객체지향 프로그래밍 언어로 클래스를 작성하는 시점에는 시스템을 정적인 관점에서 접근하는 것이다. 그러나 실제로 애플리케이션을 실행해 객체의 상태 변경을 추적하고 디버깅하는 동안에는 객체의 동적인 모델을 탐험하고 있는 것이다.


클래스

객체지향 프로그래밍 언어에서 정적인 모델은 클래스를 이용해 구현된다. 즉, 타입을 구현하는 가장 보편적인 방법은 클래스를 이용하는 것이다.

여기서 클래스와 타입은 동일한 것이 아니다. 타입은 객체를 분류하기 위해 사용하는 개념이고, 클래스는 단지 타입을 구현할 수 있는 여러 구현 매커니즘 중 하나일 뿐이다. 클래스는 타입 구현 외에도 코드를 재사용하는 용도로도 사용되기 때문에 클래스와 타입을 동일시하면 혼란을 불러일으킬 수 있다.


객체를 분류하는 기준은 타입
타입을 나누는 기준은 객체의 행동
타입을 구현할 수 있는 매커니즘 중 하나는 클래스

profile
Java Backend 4년차 Developer

0개의 댓글