코드 실현하기 전에
생각을 해서
주석으로 뭐 부터 할지 순서를 먼저 쓰고 시작하기.
import re
from collections import counter
with open('파일명.txt') as file:
script = file.read()
script = script.lower()
script. re.sub(r"[^\w\s]", ' ', script)
words = script.split()
two_gram = zip(words, words[1:])
two_gram-cnt = counter(two_gram)
max2gram = two_gram_cnt.most_common(1)
#1을 넣으면 빈도수 가장 높은 것 찾아준다.
print(max2gram)
print(two_gram_cnt)