한글 이외 문자 전부 제거
import re
def text_cleaning(text): hangul = re.compile('[^ㄱ-|가-힣]+') result=hangul.sub('',text) return result
df['ko'] = df['ko'].apply(lambda x: text_cleanint(x))
출처 : 이것이 데이터 분석이다