Terror

안선경·2023년 6월 8일
0

My_Toy_Project

목록 보기
10/10

  • 이번에는 테러 데이터를 바탕으로 분석 및 민간인에 대한 테러를 멈춰야한다는 주장을 했다.
  • 먼저 데이터를 불러왔는데, 135개의 컬럼이 존재한다.
  • 해당 데이터를 캐글의 데이터를 바탕으로 분석을 했다.
  • 먼저 필요한 컬럼을 불러왔다.
  • 연도, 달, 일, 국가, 사망자, 부상자 등의 컬럼을 뽑고, 행은 18만개가 존재한다.
  • 데이터를 더 직관적으로 보기 위해 컬럼의 이름을 바꿔주고
  • 연도별로 테러의 발생빈도를 시각화했다.
  • 1998년부터 테러의 발생 빈도가 낮아지다 2005년부터 다시 상승하기 시작했다.
  • 위 시각화를 통해 2013~2015년 가장 큰 발생빈도를 보이며, 그 원인으로 이랍 및 파키스탄에서 테러의 잦은 발생이 생기며 종겨적 원인으로 가설을 세웠다.
  • 그리고 탈레반, IS 등의 단체에서도 발생시킨 테러가 종교적으로 많았다.
  • 이번에는 사망자와 부상자를 구분해서 수치를 구했다.
  • 1993년의 데이터를 존재하지 않았으며, 2010년 이후 급격한 테러 사건으로 사망자 및 부상자 전체 다 많아지며
  • 1983년~1984년까지 사망자 빈도가 급격히 늘어나며, 특정 연도인 2001년 및 2007년 부상자의 수가 사망자 대비 크게 차이남
  • 2001년의 경우 911테러로 인한 부상자로 추측됨

  • 이번에는 국가별로 테러발생빈도를 기준으로 상위 10개 국가 데이터를 뽑았다.
  • 이랍 국가에서 테러의 빈도가 눈에 띄게 많으며 그 뒤로 파키스탄에서 테러의 빈도가 많다.
  • 그리고 국가별로 사망자 및 부상자의 발생빈도와 수치의 합계 및 테러 발생빈도의 컬럼에 대한 데이터프레임을 만들었다.
  • 뽑은 데이터프레림을 통해 국가별 사망자-부상자의 추이를 본 결과
  • 대체로 테러 발생 빈도 상위 10개국 기준 사망자 대비 부상자가 많으나, 콜롬비아, 페루. 엘살바도르 3개의 국각의 경우 부상자 대비 사망자의 비중이 크다.
  • 그리고 기존의 프레임에 테러형태 컬럼을 추가했다.
  • 국가별, 테러형태별 사망자의 빈도 및 수치와 부상자의 빈도 및 수치 데이터프레임을 만들었다.
  • 부상자 대비 사망자가 많은 3개의 국가(페루, 콜롬비아, 엘살바도르)의 경우 7객 국가와 비교해 상대적으로 테러 공격 형태 중 무장 공격의 비중이 높다.
  • 무장공격의 비중이 높음으로써 사망자의 수가 많다라는 가설을 세웠다.
  • 이번에는 지역별(남미, 아시아, 유럽 등), 테러형태별 데이터를 뽑았다.
  • 위 데이터를 시각화한 결과 중동&아프리카에서 테러에 의한 사망자 합계가 많으며, 폭탄으로 인해 사망자 수가 가장 많이 나타난다.
  • 납치에 대한 테러 빈도가 중동&아프리카에서 예외적으로 많이 발생함
  • 남아시아에서는 무장 테러가 가장 많이 나타나며, 폭탄에 의한 테러가 중동&북아프리카 다음으로 많이 발생함
  • 지역별, 테러형태별 데이터를 시각화한 결과 테러 빈도 상위 10개 중 5개 항목인 폭발테러, 무장 테러로 인해 발생했대.
  • 그리고 남아시아 및 중동&북아프리카에서 빈도가 많이 발생했다.
  • 연도, 지역, 공격형태, 사망자 및 부상자에 대한 데이터프레임을 뽑고
  • 특정 연도(1992, 1994, 2014, 2015)의 데이터를 조건을 통해 다시 뽑았다.
  • 위 데이터의 특징은 테러 빈도의 변곡점에 해당하는 데이터를 뽑았다.
  • 연도별, 형태별, 지역별 사망자의 빈도 및 수치합계와 부상자의 빈도 및 수치합계 데이터프레임을 뽑았다.
  • 그리고 사망자 및 부상자의 합계 빈도와 수치를 구한 두 개의 컬럼을 추가했다.
  • 그리고 만든 프레임에서 사망자 및 부상자의 수치합계를 기준으로 정렬하고
  • 만든 프레임에서 연도, 공격형태, 지역을 합친 새로운 컬럼을 만들고
  • 1992년 및 1994년을 기준으로 새로운 데이터프레임, 2014년 및 2015년을 기준으로 데이터프레임을 나눴다.


  • 위에는 1992년 및 1994년 데이터를 통해 그린 시각화로, 1992년 무장테러로 인해 남아시아에서 테러가 발생한 빈도는 낮으나, 사상자수가 많은 것을 보아 사회적으로 큰 테러 발생 가능성이 존재한다.
  • 그리고 2014년 및 2015년 두 연도를 기준으로 분석한 결과 폭탄테러로 인해 중동&북아프리카에서 테러 빈도는 낮으나, 많은 사상자가 발생한 것으로 보인다.
  • 이번에는 10년 단위로 데이터를 구분해 프레임 형태로 만들었다.
  • 1970~1980년까지, 1980~1990년대까지...
  • 10년 단위로 사망자의 빈도 및 수치와 부상자의 빈도와 수치 그리고 합계와 빈도를 분모로 수치를 분자에 넣어 평균값을 넣었다.
  • 10년 단위로 확인한 결과
  • 납치 테러 형태의 데이터가 중간에 급격히 높아지는데 911테러로 인한 사상자의 수가 급격히 늘어났기 때문이다.

  • 10년 단위로 분석결과 발생 빈도 대비 사상자 수는 비무장폭력이 높은 수치를 보이며, 다음으로 폭탄 테러가 높은 수치를 보인다.
  • 다음으로 한국의 테러 데이터를 분석했다.
  • 연도, 달, 도시, 테러형태별로 사망자와 부상자의 데이터프레임을 만들었다.
  • 사상자의 컬럼을 추가하고, 상위 5개 사건을 집계한 결과 위와 결과 나왔다.
  • 다음으로 민긴인에 대한 테러가 잘못됐다는 주장을 제시하기 위한 분석을 했다.
  • 먼저 기존의 프레임에 공격의 타겟 컬럼을 추가했다.
  • 그리고 민간인을 상대로 한 테러의 데이터를 조건으로 새로운 데이터프레임을 만들었다.
  • 그리고 만든 프레임을 groupby를 통해 사망자의 빈도 및 수치와 부상자의 빈도 및 수치합계를 구했다.
  • 그리고 민간인 포함 테러 전체 데이터를 포함한 프레임을 만들었다
  • 두 프레임을 바탕으로 민간인에대한테러전체테러빈도\frac{민간인에 대한 테러}{전체 테러 빈도}를 통해 민간인에 대한 발생 발생 비율 컬럼을 만들었다.
  • 추세선을 통해 확인한 결과 전체 발생 빈도와 민간인에 대한 빈도는 비슷한 양상을 보인다.
  • 그리고 bar그래프로 확인한 결과 몇몇 연도의 경우 민간인에 테러가 전체 테러의 60%를 차지한다.
  • 마지막 결론이다.
profile
상황을 바꿀 수 없다면, 나를 바꾸자

0개의 댓글