external table, which is a table that Hive does not manage, to import data from a file on a file system, into Hive. In contrast to the Hive managed table, an external table keeps its data outside the Hive metastore. Hive metastore stores only the schema metadata of the external table. Hive does not manage, or restrict access, to the actual external data.
DROP TABLE
statement를 실행했을 때 차이가 남
데이터 위치도 당연히 차이(참고 : https://sequencedata.tistory.com/40)
load data into
를 쓰거나, temporary table이었으면 hive에서 알아서 관리해주며 데이터를 지워주었겠지만, external로 만들다보니 위의 설명처럼 Hive는 실제 데이터에는 관여를 안하기 때문에 이미 internal table에 데이터가 들어갔지만 계속해서 외부데이터 파일이 HDFS 용량을 차지하게 됨