
🔻 미디어 소비 경험의 진화
∙ 중앙처리 시대: 제한된 채널의 TV 방송(중앙화된 콘텐츠 배포)
∙ 클라이언트-서버 시대: DVD, PC 기반 미디어 플레이어(분산화된 소비)
∙ 웹 시대: 유튜브, 초기 스트리밍 서비스(중앙화된 플랫폼)
∙ 클라우드 시대: 넷플릭스, 스포티파이(글로벌 중앙화, 개인화)
∙ 엣지 시대: 캐싱 기술 활용 저지연 스트리밍, AR/VR 콘텐츠(분산 처리, 로컬 경험 최적화)
클라우드 컴퓨팅
∙ 인터넷을 통해 필요한 만큼 컴퓨팅 자원을 제공하는 모델
∙ 물리적 서버를 직접 구매하거나 관리하지 않고, 필요한 시점에 컴퓨팅 능력을 빌려 사용하는 방식
∙ 컴퓨팅을 '제품'에서 '서비스'로 전환한 패러다임 변화
∙ 물리적 자원에 대한 추상화 - "서버를 소유하지 않고 컴퓨팅 능력을 활용"
∙ 향상된 관리성, 유연성, 자원 효율성을 제공하는 모델

클라우드 서비스 모델 비교
IaaS (Infrastructure as a Service)
∙ 제공하는 것: 가상 서버, 스토리지, 네트워크 자원
∙ 관리 책임: 사용자가 OS부터 애플리케이션까지 모두 관리
∙ 사용 상황: 기존 애플리케이션 이동, IT 인프라 비용 절감
∙ 예시: AWS EC2, Google Compute Engine, Azure VMs
∙ 제품 관점: 가장 많은 통제권과 유연성, 그러나 관리 부담도 큼
PaaS (Platform as a Service)
∙ 제공하는 것: 애플리케이션 개발/실행 환경
∙ 관리 책임: 제공업체가 OS/미들웨어 관리, 사용자는 코드와 데이터만 관리
∙ 사용 상황: 신속한 개발, 복잡한 인프라 관리 없이 애플리케이션 개발
∙ 예시: Heroku, Google App Engine, Azure App Service
∙ 제품 관점: 개발 속도 향상, 운영 복잡성 감소, 그러나 일부 커스터마이징 제한
SaaS (Software as a Service)
∙ 제공하는 것: 완전한 애플리케이션
∙ 관리 책임: 제공업체가 모든 것 관리, 사용자는 단순 사용
∙ 사용 상황: 표준화된 비즈니스 프로세스, 협업 도구
∙ 예시: Salesforce, Microsoft 365, Slack, Zoom
∙ 제품 관점: 가장 빠른 도입, 최소 관리 부담, 그러나 가장 적은 커스터마이징
핵심 기술 요소:
∙ 가상화 기술: 물리적 하드웨어를 논리적 리소스로 추상화
∙ 분산 시스템: 다수의 서버가 하나의 시스템처럼 작동
∙ 자동화 관리: 자원 할당, 조정, 모니터링의 자동화
∙ 멀티테넌시(Multi-tenancy): 다수 사용자가 동일 인프라 공유
🌈 클라우드가 가져온 제품 개발 혁신
1. 민주화와 접근성 확대
누가 컴퓨팅 파워를 활용할 수 있는가?
∙ 메인프레임: 대기업과 연구기관만 → PC: 개인과 중소기업 → 클라우드: 창업자와 학생도
제품 개발자층의 확대
∙ 과거: 전문 개발팀만 가능 → 현재: 소규모 팀, 개인도 복잡한 서비스 구축 가능
사례 연구: Canva
∙ 복잡한 디자인 소프트웨어를 클라우드 기반으로 단순화
∙ 전문 디자이너가 아닌 일반인도 고품질 디자인 제작 가능하게 함
∙ 기존에는 접근하기 어려웠던 디자인 도구의 대중화 실현
2. 비용 구조와 위험 프로필의 변화
자본 지출(CAPEX) → 운영 비용(OPEX)으로 전환
∙ 과거: 서버 구매 위해 수십만 달러 선투자 필요
∙ 현재: 사용량 기반 지불, 초기 비용 최소화
실패 비용의 감소
∙ 제품-시장 적합성(PMF) 검증을 위한 실험 비용 급감
∙ 가설 검증과 피봇(방향 전환)이 경제적으로 가능해짐
사례 연구: Instagram
∙ 처음에는 Burbn이라는 위치 기반 앱으로 시작했으나 사용자 반응이 미미
∙ 클라우드 인프라로 사진 공유 기능만 추출해 빠르게 새 서비스 구축
∙ 저비용으로 피봇하여 10억 달러 기업으로 성장(2년 만에 Facebook에 인수)
3. 확장성의 재정의
성장 속도와 규모의 한계 변화
∙ 과거: 성장 = 물리적 인프라 확장 → 수개월 소요
∙ 현재: 자동 확장(Auto-scaling) → 수분 내 수천만 사용자 처리 가능
글로벌 시장 즉시 진입
∙ 지역별 데이터센터 활용으로 전 세계 사용자에게 빠른 서비스 제공
∙ 단일 코드베이스로 글로벌 서비스 운영 가능
사례 연구: Pokémon GO
∙ 출시 1주일 만에 예상 트래픽의 50배 이상 발생
∙ Google Cloud 인프라로 자동 확장하여 급증하는 수요 대응
∙ 이전 시대에는 이런 급속 성장이 인프라 붕괴로 이어졌을 것
📌 클라우드 전환 실패 사례 및 교훈
사례 1: 넷플릭스 크리스마스 이브 장애 (2012)
∙ 상황: AWS 동부 리전 서비스 중단으로 넷플릭스 스트리밍 서비스 24시간 중단
∙ 근본 원인: 단일 리전 의존성, 지역적 이중화 부족
∙ 교훈: 멀티 리전 아키텍처, 카오스 엔지니어링 도입으로 회복력 강화
∙ PM 시사점: 높은 가용성이 필요한 서비스는 초기부터 멀티 리전 설계 고려 필요
사례 2: 어도비 클라우드 전환 성장통
∙ 상황: 패키지 소프트웨어에서 Creative Cloud로 전환 시 사용자 반발
∙ 근본 원인: 갑작스러운 비즈니스 모델 변화, 오프라인 기능 제한
∙ 교훈: 점진적 전환 전략, 하이브리드 접근법 채택으로 사용자 적응 기간 제공
∙ PM 시사점: 기존 사용자 기반이 있는 제품의 클라우드 전환은 단계적 접근 필요
사례 3: 코드스페이스 클라우드 데이터 손실
∙ 상황: 클라우드 호스팅 코드 저장소 서비스가 해킹 후 데이터 완전 소실
∙ 근본 원인: 백업이 원본과 동일 클라우드에 저장됨, 재해 복구 계획 부재
∙ 교훈: 다중 클라우드 백업 전략, 오프사이트 백업 중요성
∙ PM 시사점: 클라우드 전환 시 데이터 보존 및 재해 복구 전략을 핵심 요구사항으로 포함
엣지 컴퓨팅이 부상한 기술적 맥락
∙ 데이터 폭발: IoT 기기에서 생성되는 데이터 양이 2025년까지 75ZB 예상∙ (IDC)
∙ 네트워크 한계: 모든 원시 데이터를 클라우드로 전송하기에는 대역폭 부족
∙ 연산 능력 향상: 모바일/IoT 기기의 프로세싱 파워 크게 증가
∙ 5G 확산: 초고속, 초저지연 연결로 분산 처리 모델 지원
엣지 컴퓨팅이란?
∙ 데이터가 생성되는 위치(엣지)나 그 근처에서 연산을 수행하는 분산 컴퓨팅 모델
∙ 중앙 데이터센터 대신 네트워크 가장자리에서 빠른 반응과 데이터 처리를 목표로 함
∙ 스마트폰, IoT 기기, 로컬 서버, 게이트웨이 등이 엣지 노드로서 직접 연산을 수행하고, 빠른 반응을 지원
클라우드와 엣지의 상호보완적 관계
∙ 엣지는 클라우드를 대체하는 것이 아닌 확장하는 개념
∙ 클라우드: 대규모 저장, 복잡한 분석, 모델 학습에 적합
∙ 엣지: 즉각적 결정, 실시간 처리, 지역 데이터 처리에 적합
로컬(Local)과의 차이점
∙ 로컬은 기기 내부에서만 데이터 저장 및 처리
∙ 엣지와 비슷해 보이나, 엣지는 기기 근처 서버를 통한 확장 처리 가능
∙ 구분 필요성: 로컬은 한정적이고, 엣지는 보다 넓은 연산과 연결을 담당

1️⃣ 실시간 응답이 필수적인 경우
∙ 지연 시간(Latency): 클라우드 왕복 통신은 최소 수십~수백 밀리초 소요
∙ 실시간 의사결정: 자율주행, 공장 자동화, 증강현실 등은 밀리초 단위 반응 필요
∙ 사용자 경험: 지연은 몰입형 경험(게임, AR/VR)의 품질 저하 초래
2️⃣ 네트워크 제약 환경
∙ 대역폭 비용: 대량 데이터 전송의 경제적 비효율성(비디오 스트림 등)
∙ 불안정한 연결: 원격지, 이동 환경 등에서 지속적인 클라우드 연결 보장 어려움
∙ 네트워크 혼잡: 트래픽 피크 시간대 성능 저하 방지
3️⃣ 데이터 주권과 개인정보 보호
∙ 개인정보 현지화: 민감 데이터를 발생 지점에서 처리하여 위험 최소화
∙ 규제 준수: GDPR, CCPA 등 데이터 로컬라이제이션 요구사항 충족
∙ 보안 향상: 중앙 저장소 공격 위험 감소, 분할 통치 보안 모델
4️⃣ 운영 탄력성 요구 사항
∙ 오프라인 동작: 인터넷 연결 없이도 핵심 기능 유지 필요
∙ 장애 격리: 클라우드 장애가 전체 시스템에 미치는 영향 최소화
∙ 지역적 자율성: 로컬 의사결정으로 중앙 의존성 감소
📌 사례: 애플의 엣지 컴퓨팅
1. Face ID
∙ 사용자의 얼굴 인식은 서버로 전송되지 않고, 아이폰 내부의 Secure Enclave라는 보안 칩에서 직접 처리
∙ 얼굴 데이터는 기기 내에만 저장되고, 외부 서버로 전송되지 않음
2. Siri 온디바이스 음성 인식
∙ 최신 iOS에서는 Siri 음성 명령 일부를 인터넷 없이 기기 내부에서 바로 처리
∙ 예를 들어, 알람 설정, 앱 실행 같은 기본 명령은 서버 통신 없이 즉시 동작
3. 사진 앱의 온디바이스 머신러닝
∙ 사진 앱의 피플 태깅(사람 분류), 장소 인식, 추억 추천(메모리 기능) 등은 아이폰, 아이패드, 맥 기기 내에서 머신러닝으로 처리
∙ 서버로 사진을 올리지 않고도 개인화 기능을 제공
4. Apple Watch의 건강 데이터 분석
∙ 심박수, 운동 기록, 수면 데이터 분석은 Apple Watch와 연결된 아이폰 기기 내에서 처리
∙ 민감한 건강 정보가 클라우드로 바로 업로드되지 않고, 엣지에서 우선 분석됨
📌 사례: 테슬라의 엣지 컴퓨팅
1. 자율주행(Full Self-Driving, FSD) 컴퓨터
∙ 테슬라는 차량에 자체 개발한 FSD 컴퓨터(자율주행 칩)를 탑재하여,
∙ 주행 중 발생하는 센서 데이터(카메라, 레이더, 초음파 등)를 차량 내부에서 바로 처리
∙ 대부분의 판단(차선 유지, 장애물 회피, 교차로 통과 등)을 클라우드 서버와 통신 없이 차량 스스로 실시간으로 수행
2. 센서 퓨전(Sensor Fusion) 처리
∙ 테슬라는 다양한 센서(카메라 8대, 초음파 센서 등)에서 들어오는 데이터를 실시간으로 종합하여 상황을 인식
∙ 이 복합적인 데이터 해석도 클라우드로 전송하지 않고 차량 내부 시스템에서 직접 계산해 반응
3. 오토파일럿 기능
∙ 고속도로에서 차선을 유지하거나 차량 간 거리를 조절하는 기능(오토파일럿)은 서버 연결 없이 차량 자체적으로 연산해 제어
∙ 네트워크 지연 없이 즉각적으로 반응할 수 있게끔 설계됨
어디에 엣지를 둘 것인지, 어디에 클라우드를 둘 것인가
∙ 엣지와 클라우드 컴퓨팅의 강점을 상황에 맞게 활용하는 컴퓨팅 아키텍처
∙ 단일 접근법의 한계를 극복하고 최적의 사용자 경험과 비용 효율성 추구
∙ 현대 제품의 복합적 요구사항에 대응하는 현실적 접근법
📌 디지털 헬스케어 앱: Apple의 건강 에코시스템 사례
엣지 층(Apple Watch/iPhone)
∙ 지속적인 건강 지표 모니터링(심박수, 활동량, 수면 패턴)
∙ 개인 건강 데이터의 로컬 암호화 저장
∙ 즉각적인 알림 및 피드백(비정상 심박수, 낙상 감지)
∙ 일일 활동 목표 추적 및 실시간 피드백
클라우드 층(iCloud/HealthKit)
∙ 장기적 건강 트렌드 분석 및 시각화
∙ 의료 기록 통합 및 제공자 연결
∙ 인구 수준의 익명화된 데이터 분석(Apple Heart Study)
∙ 건강 연구 참여 플랫폼(Research Kit)
CPU(Central Processing Unit): '다재다능한 일반주의자'
∙ 다양한 복잡한 작업을 유연하게 처리
∙ 적은 수의 강력한 코어(4~64개)
∙ 순차적 실행과 복잡한 제어 흐름에 최적화
∙ 예시: 웹 서버, 데이터베이스, 운영체제 관리
GPU(Graphics Processing Unit): '전문화된 병렬 작업자'
∙ 동일한 연산을 대규모 데이터에 병렬로 적용
∙ 수천 개의 단순한 코어
∙ 계산 처리량(throughput) 극대화에 특화
∙ 예시: 이미지 처리, 딥러닝 학습, 대규모 시뮬레이션
CPU에 적합한 작업
∙ 복잡한 분기와 조건부 로직이 많은 작업
∙ 순차적 처리가 필요한 작업
∙ 불규칙한 메모리 접근 패턴을 가진 작업
∙ 예시: 웹 서버, 데이터베이스 관리, 운영체제 기능
GPU에 적합한 작업
∙ 동일한 연산을 대량의 데이터에 적용하는 작업
∙ 데이터 간 의존성이 적은 병렬 처리 가능 작업
∙ 규칙적인 메모리 접근 패턴을 가진 작업
∙ 예시: 이미지 처리, 딥러닝, 물리 시뮬레이션, 암호화폐 채굴
AI 워크로드의 특성
∙ 대규모 행렬 곱셈: 딥러닝의 핵심 연산, 병렬 처리에 적합
∙ 예측 가능한 메모리 패턴: 특화된 메모리 계층으로 최적화 가능
∙ 정밀도 요구사항: AI 연산은 종종 낮은 정밀도(FP16, INT8)로 충분
실용적 성능 차이
∙ 학습 시간: GPU 사용 시 CPU만 사용할 때보다 10-100배 빠름
∙ 비용 효율성: 동일 작업에 대해 특화 하드웨어가 TCO(총소유비용) 낮음
∙ 에너지 효율성: 와트당 처리량 5-30배 향상

딥러닝 모델 학습
∙ NVIDIA Tesla V100 GPU vs 고성능 서버 CPU 비교
∙ 이미지 분류(ResNet-50): GPU가 CPU보다 약 30-35배 빠름
∙ 자연어 처리(BERT): GPU가 CPU보다 약 20-25배 빠름
모델 추론(Inference)
∙ 배치 크기가 클 때: GPU가 CPU보다 5-15배 빠름
∙ 배치 크기가 작을 때(실시간 추론): 격차 감소, 때로는 최적화된 CPU가 유리할 수 있음
사례: 모바일 기기의 CPU-GPU 협업
∙ 스마트폰 카메라의 실시간 이미지 처리
∙ CPU: 사용자 인터페이스 관리, 카메라 제어, 복잡한 결정 로직
∙ GPU: 실시간 필터 적용, 이미지 안정화, HDR 처리
∙ 결과: 배터리 효율성과 성능의 최적 균형점 달성
저전력 프로세서 아키텍처
∙ ARM 기반 서버 확산(AWS Graviton, Apple Silicon)
∙ 최신 CPU/GPU의 전력 효율성 향상 기술(동적 전력 관리)
냉각 기술 혁신
∙ 액체 냉각(Liquid Cooling) 시스템
∙ 자연 냉각(Free Cooling) 활용
∙ 전력사용효율(PUE) 지표 최적화
친환경 하드웨어 설계
∙ 재활용 가능 소재 사용
∙ 수명 연장 설계(Longevity by Design)
∙ 제조 과정의 탄소 배출 감소
그린 코딩 원칙
∙ 불필요한 연산 제거
∙ 메모리 및 스토리지 최적화
∙ 효율적 알고리즘 선택
에너지 인식 애플리케이션
∙ 배터리 사용량 모니터링 및 최적화
∙ 백그라운드 프로세스 관리
∙ 다크 모드 및 저전력 UI 설계
재생 에너지 활용
∙ 구글, MS, 페이스북 등 100% 재생 에너지 전환 계획
∙ 현장 태양광/풍력 설치 및 전력구매계약(PPA)
위치 전략
∙ 차가운 기후 지역 선호(스웨덴, 핀란드 등)
∙ 재생 에너지 풍부 지역 선택
∙ 열 재활용(주변 건물 난방 등에 활용)
순환 경제 적용
∙ 서버 장비 재사용 및 재활용
∙ 물 사용 효율화(WUE) 관리
∙ 서버 수명 연장 프로그램