[Apache NiFi(아파치 나이파이)설치 및 빌드] 데이터분석가의 삽지니어링2

생각하는 마리오네트·2023년 1월 28일
0

삽지니어링

목록 보기
2/10
post-thumbnail

요즘, 회사 생활을 하다보니 과연 내가 회사 소속이 아닐경우, 세팅된 환경이 아닌경우에도 데이터를 분석할 수 있을까??? 라는 질문에 절대 확신하지 못했기 때문에 데이터 파이프라인을 만드는 엔지니어링 부분도 관심을 가지고 있다. 그 중 데이터 파이프라인을 연결하는데 사용하는 Apache NiFi(아파치 나이파이)를 설치해 보았다. 이후 다음 포스팅에서는 똑같은 역할을 하는 Airflow(에어플로우)를 다루어 볼 생각이다.

AWS 인스턴스 생성 및 putty접속

먼저 저는 AWS의 인스턴스를 받아서 진행을 해보았습니다.

임시로 nifi_start라는 이름으로 설정해 주었고, ubuntu를 선택해 주었습니다.

그리고 사전에 putty gen을 통하여 만들어준 key를 선택합니다.(putty와 putty gen에 대한 설명도 올릴예정입니다.)

인스턴스 유형은 프리티어를 사용해도 되지만, 가격이 싼 t2.small을 사용하였습니다.

그리고 HoseName에 만든 인스턴스 "퍼블릭 IPv4 DNS"을 넣어줍니다.

그리고, 개인적으로 putty가 많이 끊겨서 해결방법으로 Connection -> Seconds between keepalives에 0에서 5로 변경해 줍니다.

그리고 창을 열면 다음과 같은 화면이 나타납니다. 여기서 ubuntu를 치고 엔터를 치면 준비가 완료됩니다.

NiFi설치

  1. 가장먼저 NiFi압축파일을 다운받아줍니다.
curl https://archive.apache.org/dist/nifi/1.12.1/nifi-1.12.1-bin.tar.gz --output nifi.tar.gz
  1. 다운받은 압축 파일을 풀어줍니다.
tar xvzf nifi.tar.gz
  1. 저장소에 패키지 리스트를 업데이트 해줍니다.
sudo apt update
  1. java11을 꼭 다운받아줍니다.
sudo apt install -y openjdk-11-jre-headless
  1. 환경변수를 설정해 줍니다.
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
  1. 환경변수를 적용해준다.
source .bashrc
  1. NiFi가 있는 경로로 이동후 실행해 줍니다.
# 1. 경로 이동
cd ~~~

# 2. NiFi실행
bin/nifi.sh start

아래와 같이 Java와 NiFi가 둘다 잘 잡힌다면 성공한것입니다.

  1. 포트연결하기

인스턴스로 돌아가서 [보안]을 눌러줍니다.

이후 보안그룹에 있는 주소로 들어간후 아래에 있는 인바운드 규칙편집을 들어가 줍니다.

규칙추가 후 nifi포트번호(8080)를 입력하시고 저장하시면 완성입니다.

이후, [자신의 인스턴스 퍼블릭 ip주소]:8080 으로 접속하면 빌드하실 수 있습니다

profile
문제를해결하는도구로서의"데이터"

2개의 댓글

comment-user-thumbnail
2023년 5월 12일

안녕하세요, 혹시 nifi.properties 에 ip와 port 셋팅은 별도로 안하신걸까요?

1개의 답글