[KDT_AISEC] 1주차 - 정보보안과 인공지능개론

Gloomy·2024년 1월 19일
0

KDT_AISEC

목록 보기
1/25

정보보안


정보보안이란?

정보의 수집, 가공, 저장, 검색, 송신, 수신 도중 정보의 훼손, 변조, 유출 등을 방지하기 위한 관리적, 기술적 방법을 의미한다.

정보보안의 3요소 : 기밀성, 무결성, 가용성 (C.I.A.)

  • 기밀성(Confidentiality): 허락되지 않은 사용자 또는 객체가 정보의 내용을 알 수 없도록 하는 것
  • 무결성(Integrity): 허락되지 않은 사용자 또는 객체가 정보를 함부로 수정할 수 없도록 하는 것
  • 가용성(Availability): 허락된 사용자 또는 객체가 정보에 접근하려 하고자 할 때 방해받지 않도록 하는 것

공격과 방어

공격자들은 기본적으로 방어자들의 방어 기술을 다 인지하고 있고 최대한 방어 기술을 피하며 공격하기 때문에 방어자들은 공격자들에 비해 늘 한 발씩 느릴 수 밖에 없다. 보안 솔루션을 설치하고 여러가지 보안 정책을 수립하는 이유이며, 공격에 대해서는 정책으로 대비하고 기술로 대응한다.

사이버보안 트렌드

  • 정보보안 위협 트렌드와 솔루션의 발전
    • 인공지능 기능을 탑재한 위협 탐지 솔루션의 등장: 다크트레이스, 맥스 등
    • 위협 데이터를 하나로, 보안 자동화 및 오케스트레이션(SOAR)
      • SOA(Security Orchestration and Automation): 한 조직이 보유한 여러 개의 워크플로우를 관리하는 기법
      • SIRP(Security Incident Response Platform): SIEM에서 탐지된 위협 대응 지원 시스템
      • TIP(Threat Intelligence Platform): 위협 인텔리전스 중 관련 데이터를 찾아 환경에 맞는 최적의 액션 제시

SIEM(Security information and event management)은 조직에서 비즈니스에 문제를 일으키기 전에 보안 위협을 탐지, 분석 및 대응하도록 도와주는 솔루션이다.

인공지능 개요


인공지능이란?

AI research is defined as the study of “intelligent agents”: any device that perceives its environment and takes actions that maximize its chance of successfully achieving its goals.

  • 주변 환경에 맞는 성공 확률을 보장하는 최적의 행동을 취하는 기계를 의미한다.

인공지능의 정의

빅데이터와 발전된 컴퓨팅 파워를 기반, 알려진 학습 기술을 통해 기계가 스스로 학습
→ 학습 결과가 인간에게 이롭게 이용될 수 있는 기술

인공지능 시스템의 구조

  • 1단계: 인지 → 센서로 주변 환경을 인식한다. (카메라, 초음파, 적외선 등)
  • 2단계: 처리 & 결정 → 학습한 결과(알고리즘)를 토대로 데이터를 처리한다.
  • 3단계: 행동 → 처리 결과를 실행에 옮긴다.
    인지 → 처리 & 결정 → 행동

인공지능 기술 관련 용어

  • 인공지능(Artificial Intelligence)은 인간의 학습 능력과 추론 능력을 인공적으로 모델링하여 외부 대상을 지각하는 능력을 컴퓨터 프로그램으로 구현하는 기술이다.
  • 패턴인식(Pattern Recognition)은 인지 과학과 인공지능 분야에 속하는 문제 중 하나로, 인공지능의 실제 구현 문제인 감지된 대상을 인식하는 문제를 주로 다룬다.
  • 머신러닝(Machine Learning)은 컴퓨터가 학습할 수 있도록 알고리즘과 기술을 개발하는 분야이다.
  • 딥러닝(Deep Learning)은 인간의 사고방식을 컴퓨터에게 가르치는 머신러닝의 한 분야이다.

인공지능의 역사


인공지능 역사 개괄

  • 1940년대부터 인공지능에 대한 연구 시작

1943년: 딥러닝의 기원을 열다

  • 논리학자인 월터 피츠와 신경외과의 워렌 맥컬럭
  • 뉴런의 작용을 0과 1로 이루어지는 이진법 논리 모델로 설명
  • 인간 두뇌에 관한 최초의 논리적 모델

1950년: 생각하는 기계/학습하는 기계

  • 영국 수학자 앨런 튜링
  • 기계가 생각할 수 있는지 테스트하는 방법, 지능적 기계의 개발 가능성, 학습하는 기계 등에 관해 저술

1956년: 인공지능 용어의 등장

  • 미국 다트머스 대학 존 매카시 교수
  • 다트머스 AI 컨퍼런스 개최
  • 초청장 문구에 Artificial Intelligence라는 용어를 처음으로 사용
  • 참석자들은 앨런 튜링의 ‘생각하는 기계’를 구체화하고 논리와 형식을 갖춘 시스템으로 이행시키는 방안 논의

1957년: 퍼셉트론

  • 코넬 항공연구소의 프랑크 로젠블랫에 의해 고안
  • 신경계 뉴런을 흉내 낸 다수의 신호를 입력 받아서 하나의 신호를 출력
  • 입력에 대한 각 weight(가중치)를 통해 출력을 결정
    - 퍼셉트론 학습 예시: 강아지와 고양이 분류 문제(Classification)

1969년: XOR 문제 대두

  • 시모어 페퍼트가 퍼셉트론의 한계를 수학적으로 증명
    • 분류 측면에서 XOR 선 긋기가 불가능한 문제가 발생
  • 로젠블랫의 퍼셉트론 붕괴
  • 1971년 로젠블랫이 사망하면서 인공지능의 빙하기 도래
  • 다중 퍼셉트론으로 XOR 문제 해결

2006년: 딥러닝 용어의 등장

  • 딥러닝의 아버지 제프리 힌튼
  • 초기값을 제대로 설정한다면 깊은 신경망을 통한 학습이 가능함을 증명
  • Deep을 붙인 DNN(Deep Neural Network)이라는 용어를 사용하면서 본격적으로 딥러닝 용어 사용

2012년: AlexNet

  • ImageNet: 2009년 페이페이 리가 만든 방대한 양의 이미지 데이터 베이스
  • 2010년부터 ILSVRC라는 이미지 인식 경진대회 진행
  • 제프리 힌튼 교수팀 AlexNet으로 2012년 대회에서 압도적으로 우승
    • 기존 우승팀의 점수가 60점~70점대였는데, 90점이상의 점수로 우승

빅데이터


빅데이터의 정의

  • 2001년 가트너(Gartner)가 내린 정의
  • 양(Volume)이 매우 많고, 증가 속도(Velocity)가 빠르며, 종류(Variety)가 매우 다양한 데이터: 3V
  • 최근, 정확성(Veracity)과 가치(Value)를 추가한 5V로 정의한다.

빅데이터 적용 사례

  • 타깃(Target)
    2002년 타깃은 데이터 분석 전문가인 앤드류 폴을 영입한 후 ‘임신 예측 모델’등을 개발한다. 타깃에서는 임산부들에게 보낼만한 쿠폰 우편을 한 여고생에게 보내 화제가 되었는데, 당시 그 학생의 아버지는 고등학생에게 이런 우편을 보냈다며 타깃에 항의하였다. 그러나 며칠 뒤, 해당 여고생은 실제 임신중인 것으로 확인되었다.
  • 아마존(Amazon)
    아마존에서는 고객의 구매 내역을 분석하고 간단한 설문조사 등을 통해 꾸준한 연구를 진행한 끝에 미래의 주문 가능한 상품을 예측하는 알고리즘의 개발에 성공하고 2014년에 예측 배송 시스템의 특허를 취득하였다.

정보보안 & 인공지능


인공지능의 정보보안 분야별 적용 사례

  • 네트워크 침입탐지(Network Intrusion Detection)
    가장 활발하게 연구, 개발되고 있는 분야 중 하나이다. 네트워크 트래픽 모델과 위협 모델을 토대로 탐지하는 방식을 사용하고, 충분한 양의 데이터와 Signature-based 방식을 함께 사용한다.
  • 위협 인텔리전스(Threat Intelligence)
    위협정보에 대한 큐레이션 및 분석, 실시간 정보 공유를 목표로 하는 시장이다. 차세대 보안 전략으로 각광받고 있으며 다양한 소스에서 수집한 빅데이터를 기반으로 보안 위협을 예측하고 탐지한다.
  • 악성코드 탐지(Malware Detection)
    대량의 악성코드 데이터에서 특성을 추출해 탐지 및 분류에 활용한다. 정적 특성에는 악성코드 데이터 특성 및 메타데이터 정보 등이 있고 동적 특성에는 악성코드 자체의 목적 코드를 실행하는 행위를 분석한 정보 등이 있다. 딥러닝 기반의 연구도 활발하게 진행되고 있다.
  • 디지털 포렌식(Digital Forensic)
    이미지, 영상 분석 기술의 분야에서 사용한다. 법적 증거물을 추가 확보하거나 검증하는 용도가 아닌 빅데이터에서 증거를 수집하고 분석하는 시간을 단축하고 분석관을 보조하는 용도로 사용한다.
  • 개인정보 보호
    법과 정책이 중요한 분야이고 표면적으로는 인공지능과 큰 관련이 없다. 하지만, 최근 들어 빅데이터 처리 및 이미지 기반 인공지능 기술이 발전하면서 개인정보 비식별 기술이 주목받고 있다.
  • 정보보호 정책
    대부분의 업무가 복잡한 계산보다는 경험과 사람의 판단이 중요한 분야이지만, AI 기술의 접목이 가능하다.
  • Adversarial Machine Learning
    머신러닝과 컴퓨터 보안의 교차 영역에 있는 연구 분야이고, 모델의 보안성 위반과 학습성 저해를 목표로 하는 머신러닝 모델이다.
  • 자동화 취약점 탐지
    자동으로 소프트웨어의 취약점을 찾아내 공격하는 기술이다.

인공지능 학습 방법


지도학습(Supervised Learning)

정답이 있는 데이터를 활용해 데이터를 학습하는 방법이다. 입력 값(X data)이 주어지면 입력값에 대한 Label(정답지, Y data)를 주어 학습한다. 대표적으로 분류(Classification)와 회귀(Regression) 문제가 있다.

비지도학습(Unsupervised Learning)

지도학습과는 달리 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하는 학습 방법이다. 새로운 데이터에 대한 결과를 예측하는 방법의 학습이고, 정답이 없는 데이터로부터 패턴이나 형태를 찾아야하기 때문에 지도학습보다 난이도가 높다. 실제로 지도학습에서 적절한 특징을 찾아내기 위한 전처리 방법으로 비지도 학습을 이용하기도 한다.

강화학습(Reinforcement Learning)

행동에 대한 보상을 받으며 학습하는 방법이다. 어떤 환경 안에서 선택 가능한 행동들 중 보상을 최대화하는 행동 또는 행동 순서를 선택하는 방법이다. 강화학습의 예로 게임이 가장 대표적이다.


출처: https://blog.naver.com/k0sm0s1/221863569856

profile
𝙋𝙤𝙨𝙨𝙤 𝙁𝙖𝙧𝙚!

0개의 댓글