ย ย ย ย ์๋ฆฌ ์ฃผ๊ธฐ ์์ธก์ ๋ณด๋ฆ๋ฌ ์๋น์ค์ ํต์ฌ์ด๋ค. ์๋ฆฌ ์ฃผ๊ธฐ ํ์ ์ ์ฌ์ฑ ๊ฑด๊ฐ ๊ด๋ฆฌ์ ๊ฐ์ฅ ์ค์ํ ์์์ด๊ธฐ ๋๋ฌธ์ด๋ค. ์๋ฆฌ ์ฃผ๊ธฐ ๊ทธ ์์ฒด๋ก๋ ์ฌ์ฑ ๊ฑด๊ฐ์ ์งํ๊ฐ ๋๊ธฐ๋ ํ๊ณ , ์์ ์ค๋น, ๋๋น์ ์ฉ์ด์ฑ ๋ฑ ์์ ์ ์๋ฆฌ์ฃผ๊ธฐ๋ฅผ ์ ๋๋ก ์์์ผ ํ๋ ์ฌ๋ฌ ์ด์ ๊ฐ ์๋ค. ๊ทธ๋ฌ๋ ๋ฐ์ ํ๋์ธ๋ค์ด ์ค์ค๋ก ์ฃผ๊ธฐ๋ฅผ ํ์ ํ๋ ๊ฒ์ ์ฝ์ง ์๋ค.
ย ย ย ย ๋ณด๋ฆ๋ฌ ์๋น์ค๋ ์ฌ์ฉ์๊ฐ ์ ๋ ฅํ ์ต๊ทผ์ ์ฃผ๊ธฐ๋ค์ ํ์ฉํ์ฌ ์ธ๊ณต์ง๋ฅ์ด ์ฌ์ฉ์์ ์๋ฆฌ ์ฃผ๊ธฐ์ ๋ฐฐ๋์ผ ๋ฑ์ ์ ๋ณด๋ฅผ ์์ธกํ๋ค. ์ผ๋ฐ์ ์ธ ์์น๋ง์ด ์๋๋ผ ์ต๊ทผ ์ฃผ๊ธฐ์ ๋ณํ๋ ํน์ดํ ์ฃผ๊ธฐ ๋ฑ ๊ฐ์ธ ์ฌ์ฉ์๋ณ๋ก ๋๋๋ฌ์ง๋ ํน์ง๋ ์์ธกํ ์ ์๋๋ก ํ๋ ๊ฒ์ด ๋ชฉํ์ด๋ค. ์ฌ์ฉ์๊ฐ ์ ๋ ฅํ ์ ๋ณด, ๋ณด๋ฆ๋ฌ์ ์์ธก๋ค์ด ์์ฌ๊ฐ ์๋ก ์ฌ์ฉ์๋ ๋ ์ ํํ ์ฃผ๊ธฐ์ ๋ฐฐ๋์ผ ๋ฑ ์์ ์๊ฒ ๊ผญ ํ์ํ ์ ๋ณด๋ฅผ ์ป์ ์ ์๊ฒ ๋ ๊ฒ์ด๋ค.
ย ย ย Open Cycle: Forecasting Ovulation for Family Planning์ ์๋ณธ ๋ฐ์ดํฐ๊ฐ 1798๋ช
์ ์ฃผ๊ธฐ ์ ๋ณด๋ฅผ ์ฌ์ฉํ์๊ณ , ๋ง์ ์ฐ๊ตฌ์ ์ธ์ฉ๋์๊ธฐ์ ์๋ณธ ๋ฐ์ดํฐ๋ฅผ ์ฐพ์ผ๋ ค๊ณ ํ๋ค. ์ฌ๋ฌ ์ ์์๊ฒ ์ด๋ฉ์ผ์ ๋ณด๋์ผ๋, ์ ๊ทผ ๊ถํ์ด ์๋ค๋ ๋ต๋ณ์ด๋ ๋ต๋ณ์ ๋ฐ์ง ๋ชปํ๋ค. ๋์์ผ๋ก ๋ค๋ฅธ ๊ณต๊ฐ ๋ฐ์ดํฐ ์
์ ์ฐพ์๊ณ , ์ถฉ๋ถํ ์์ ์๋์์ง๋ง ์ต์ ์ด๋ผ ํ๋จํด ์ฌ์ฉํ๊ธฐ๋ก ํ์๋ค. ๋จ, ์ด ๋ฐ์ดํฐ ์
์๋ ๊ท์น์ ์ธ ์ฃผ๊ธฐ๋ฅผ ๊ฐ์ง ์ฌ๋๋ง์ด ์กด์ฌํ๋ค๋ ๋ฌธ์ ๊ฐ ์์๋ค. ํจํด์ ๊ฐ์ง ๋ถ๊ท์นํ ์ฃผ๊ธฐ, ์ต๊ทผ์ ๋ฐ๋ ์ฃผ๊ธฐ ๋ฑ์ ์ฌ๋ก๊ฐ ๋ถ์กฑํ๊ธฐ์ ์ธ์์ ์ธ ๋ฐ์ดํฐ ์
์ ๋ง๋ค์ด ํจ๊ป ์ฌ์ฉํ๊ธฐ๋ก ํ์๋ค.
ย ย ย ย ์๋ณธ ๋ฐ์ดํฐ ์ ์์ cleaned dateset์ ๋ง๋ค๊ธฐ ์ํด python Jupyter Notebook์ ์ฌ์ฉํ์๋ค. ์ฌ๋ฌ ๋ฒ ๋์ ๋ ์ ๋ณด๊ฐ ์๋๋ผ 1,2๋ฒ ์ผํ์ฑ์ ์ฃผ๊ธฐ์ ๋ณด๋ฅผ ๊ฐ์ง ์ฌ๋์ ๋ฐ์ดํฐ๋ ์ ์ธํ์๋ค. ๋ํ ๋น ๊ฐ์ ํฌํจํ ํ์ ์ ๊ฑฐํ๊ณ , ์ดํ๋ฆฌ์ผ์ด์ ์์ ์ฌ์ฉ์์๊ฒ ์ ๋ ฅ๋ฐ์ ํน์ฑ - ClientID, CycleNumber, LengthofCycle, MeanCycleLength, EstimatedDayofOvulation, LengthofMenses, MeanMensesLength, Age, NumberPregnancies, BMI - ๋ง์ ํฌํจํ cleaned dataset์ ๋ง๋ค์๋ค.
ย ย ย ย Feature Engineering์ด๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋์ด๊ธฐ ์ํด ๋ชจ๋ธ์ ์ ๋ ฅํ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค๊ธฐ ์ํด ์ฃผ์ด์ง ์ด๊ธฐ ๋ฐ์ดํฐ๋ก๋ถํฐ ํน์ง์ ๊ฐ๊ณตํ๊ณ ์์ฑํ๋ ์ ์ฒด ๊ณผ์ ์ด๋ค. ๋ฐ์ดํฐ ์ ์ ํน์ ์์ฑ์ ์์ฑํ๊ฑฐ๋ ์ ํํ๋ ์์ ์ ์๋ฏธํ๋ค. ์ด๋ฅผ ์ํด ๋ค์์ ๋ฐฉ๋ฒ๋ก ์ ์ฌ์ฉํ์๋ค.
NN(Nueral Network) ์ธ๊ณต์ ๊ฒฝ๋ง
์ธ๊ณต์ ๊ฒฝ๋ง์ ์๋ฌผํ์ ์ ๊ฒฝ๋ง์์ ์ํฅ์ ๋ฐ์ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ด๋ค. ์๋ ์ค์ ๊ฒฐํฉ์ผ๋ก ๋คํธ์ํฌ๋ฅผ ํ์ฑํ ์ธ๊ณต ๋ด๋ฐ์ด ์๋ ์ค์ ๊ฒฐํฉ ์ธ๊ธฐ๋ฅผ ๋ณํ์์ผ ๋ฌธ์ ํด๊ฒฐ๋ฅ๋ ฅ์ ๊ฐ์ง๋ ๋น์ ํ๋ชจ๋ธ์ด๋ค.
์ถ์ฒ: LG CNS ๋ธ๋ก๊ทธ
ย ย ย ย ์ฐ์ ์ด๋ค ์์ฑ์ด ์ฃผ๊ธฐ ์์ธก์ ์ด๋ป๊ฒ ์ํฅ์ ๋ฏธ์น๋์ง ์์ฑ ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ ํ๊ธฐ ์ํด, ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ด์ฉํด ์ฃผ๊ธฐ๋ฅผ ์์ธกํ๋ ๋จ์ํ ๋น์ ํ ํ๊ท ๋ชจ๋ธ์ ๋ง๋ค์๋ค. ํ๊ท ๋ชจ๋ธ์ ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ์ ๋ณด์ฌ์ฃผ๋ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ ค ์๊ฐ์ ์ผ๋ก ๋ํ๋ด์๋ค.
ย ย ย Cycle length๊ฐ ๊ธธ์ด์ง์๋ก estimated day of ovulation๋ ๊ธธ์ด์ง๋ค. ๋ฐฐ๋ ์์์ผ์ด ์ฃผ๊ธฐ์ ๊ธธ์ด์ ๊ด๋ จ์ด ์๋ค๋ ๊ฒ์ ์๊ฒ ๋์๋ค.
ย ย ย ์์ ๊ทธ๋ํ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค. Tensorflow์์ epoch๋ ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ํ์ตํ๋ ํ์, batch size๋ ํ ๋ฒ์ ํ์ตํ ๋ฐ์ดํฐ์ ์, iteration์ ํ epoch์์ batch๋ฅผ ํ์ตํ๋ ํ์์ด๋ค. ์ฐ๋ฆฌ๊ฐ ๊ฐ์ง๊ณ ์๋ ๋ฐ์ดํฐ ์
์ ์ ํ์ ์ด๊ธฐ์ 1 epoch๋ก๋ ์ถฉ๋ถํ์ง ์๋ค. ๊ทธ๋ฌ๋ epoch๊ฐ ๊ณผ๋ํ๋ฉด ๊ณผ์ ํฉ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์ด Epoch์ batch size ๋ณ loss value๋ฅผ ๋ณด์ฌ์ฃผ๋ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ ค๋ณด์๋ค. ์ด ๋ชจ๋ธ์ loss function์ ํธ๋ ์ด๋ ๊ณผ์ ์ ํตํด loss value๊ฐ ๊ฐ์ํ๊ณ , ์ต์ข
์ ์ผ๋ก ํธ๋ ์ด๋ loss ๊ฐ 0.0092์ ํ
์คํธ loss ๊ฐ 0.0096์ ๊ธฐ๋กํ์์ ๋ณด์ฌ์ค๋ค. ๋ฐ์ดํฐ ์
์ ๋ค๋ฅธ ์์ฑ๋ค์ ๋ํด์๋ ๊ฐ์ ์์
์ ์ํํ์ฌ ์์ฑ๋ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ฐพ์ผ๋ ค๊ณ ํ๋ค.
ย ย ย Length of menses์ ๋ฐ๋ฅธ estimated day of ovulation์ ๊ด๊ณ๋ฅผ ํ์
ํ์๋ค. ์์ ๊ทธ๋ํ์์ ๋ณผ ์ ์๋ ๊ฒ ์ฒ๋ผ, ์๋ฆฌ์ผ์ ๊ธธ์ด๊ฐ ์งง์์๋ก ๋ฐฐ๋์ผ์ด ์งง์ ๊ฒฝํฅ์ด ์๊ธฐ๋ ํ์ง๋ง ๋๋ ทํ ๊ฒฝํฅ์ฑ์ ์์๋ค. ๊ทธ๋ํ์์ ํ๋ ๊ฐ์ ๋ฒ์๊ฐ ์ธ๋ก๋ก ๊ธด ๊ฒ์ผ๋ก ์ง์ํด, ์๋ฆฌ์ผ์ ๊ธธ์ด์ ๋ฐ๋ฅธ ๋ฐฐ๋์ผ ๊ธธ์ด์ ๋ณํ ํญ์ ๋งค์ฐ ํฌ๊ธฐ ๋๋ฌธ์ด๋ค.
ย ย ย ๋ค์์ผ๋ก๋ cycle length์ ๋ฐ๋ฅธ estimated length of menses์ ๊ด๊ณ๋ฅผ ์ดํด๋ณด์์ง๋ง ๋ ์ฌ์ด์ ๋ช
ํํ ๊ด๊ณ๋ฅผ ์ฐพ์ ์ ์์๋ค.
ย ย ย ย ๋ง์ฐฌ๊ฐ์ง๋ก ๋ฐฐ๋์ผ์ ์์ธกํ๊ธฐ ์ํด BMI, ์ฐ๋ น, ์์ ํ์์์ ๊ด๊ณ๋ฅผ ํ
์คํธํ์ ๋๋ ๊ด๋ จ์ฑ์ ์ฐพ์ ์ ์์๋ค. ์ด๋ค์ ์ฃผ๊ธฐ ์์ธก์ ํฐ ์ํฅ์ ๋ผ์น์ง ์๋ ๊ฒ์ผ๋ก ๋ณด์๋ค.
ย ย ย ํธ๋ ์ด๋์ด ๋๋ ๋ 0.0093์ loss ๊ฐ์ ๊ธฐ๋กํ๊ณ test์์ 0.0093์ loss ๊ฐ์ ๊ธฐ๋กํ๋ค. ์ด๋ ์ฒ์์ ์ป์ 0.0092์ loss ๊ฐ์ ๋นํด ๊ฐ์ ๋ ๊ฒ์ฒ๋ผ ๋ณด์ด์ง ์๋๋ค. 5๊ฐ์ ์์ฑ๋ง์ ์ฌ์ฉํ์ ๋, ํ
์คํธ ์
์ loss ๊ฐ์ด ํธ๋ ์ด๋ ์
์ loss ๊ฐ๋ณด๋ค ๋ฏธ์ธํ๊ฒ ๋ฎ๊ณ ์ค์ ๋ฐ์ดํฐ์ ๊ทผ์ ํ์ด๊ธฐ ํ์ง๋ง, ์ฐจ์ด๊ฐ ๋งค์ฐ ์๊ธฐ์ ๊ฒฐ๊ณผ์ ๋ฏธ์น๋ ์ํฅ๋ ฅ์ ๋ฌด์ ๊ฐ๋ฅํ ์ ๋์ด๋ค.
ย ย ย ย ํธ๋ ์ด๋๊ณผ ๋น์ ํ ๋ชจ๋ธ์ ํตํ feature engineering์ผ๋ก ๋ฐ์ดํฐ ์ ์ ์ ๋ฆฌํ๊ณ ๋์, ์ฐ๋ฆฌ๋ ์ฌ๋ฌ๊ฐ์ง ์ด์ ๋ค๋ก ๋ค๋ฅธ AI ๋ชจ๋ธ๋ก ๋ฐ๊พธ์ด์ผ ํ๋ค.
ย ย ย ย ์ฐ๋ฆฌ์ ๋ชฉํ๋ ๋ฐฐ๋์ผ์ ์์ธกํ๋ ๊ฒ์ด๋ค. ๋ฐฐ๋์ผ์ '์๋ฆฌ ์ ๋ช์ผ'์ ํํ๋ก ํํ๋๋๋ฐ, ์ด๋ฅผ ์๊ธฐ ์ํด ์๋ฆฌ๊ฐ ๋๋ ๋ ๊น์ง ๊ธฐ๋ค๋ฆฌ๋ ๊ฒ์ ์๋ฏธ๊ฐ ์๋ค. ์๋ฆฌ๊ฐ ๋๋๊ณ ๋ฐฐ๋์ผ์ ์์ธกํ๋ค๋ฉด ์ด๋ ์ด๋ฏธ ์ง๋๊ฐ ๋ฐฐ๋์ผ์ผ ๊ฒ์ด๋ค. ์ฐ๋ฆฌ์ AI ๋ชจ๋ธ์ ์ด์ ์ฌ์ดํด์ ๋ํด ํ๋ํ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ๋ค์ ์ฌ์ดํด์ ๊ธธ์ด, ์๋ฆฌ์ผ์ ๊ธธ์ด, ๋ฐฐ๋ ์ถ์ ์ผ์ ์์ธกํ ํ์๊ฐ ์๋ค.
ย ย ย ย ์ ํ ์ฐ๊ตฌ์์๋ ๊ธฐ์ด ์ฒด์จ์ด ๋ฐฐ๋์ด ์ธ์ ์ผ์ด๋ฌ๋์ง ๋ถ๋ช ํ ์งํ์ธ ๊ฒ์ ํ์ธํ๊ณ , ์ด๋ฅผ ์ฃผ์ ์์ฑ์ผ๋ก ์ฌ์ฉํ๋ค. ๊ทธ๋ฌ๋, ์ด๊ฒ์ ๋ณด๋ฆ๋ฌ ์๋น์ค์๋ ์ป์ ์ ์๋ค. BBT(์ ์ฒด ๊ธฐ์ ์จ๋)๋ ํน๋ณํ ์ข ๋ฅ์ ์จ๋๊ณ๋ก, ๋งค์ผ ๊นจ์ด๋ ๋ ์ธก์ ํด์ผ ํ๋๋ฐ, ๋๋ถ๋ถ์ ์ฌ์ฉ์๋ ์ด๋ฐ ์จ๋๊ณ๋ฅผ ์ง๋๊ณ ์์ง๋ ๊ธฐ์ ์์ ์ฒด์จ ์ธก์ ์ ํ์ง๋ ์๊ธฐ ๋๋ฌธ์ด๋ค. ํด๋น ์ฐ๊ตฌ ๋ ผ๋ฌธ์์ ๋ฐฐ๋์ผ ์์ธก์ ์ํด CNN(Convolutional Neural Network) ๋ชจ๋ธ๊ณผ LSTM(Long Short Term Memory model) ๋ชจ๋ธ์ ์ด๋ป๊ฒ ์ฌ์ฉํ๋๊ฐ์ ๊ทธ ๋ชจ๋ธ์ด ์ผ๋ง๋ ํจ๊ณผ์ ์ธ๊ฐ๋ ์ด์ฉํ ์ ์์๋ค.
ย ย ย ย LSTM์ด๋ CNN ๋ชจ๋ธ๋ก ๋์ด๊ฐ๊ธฐ ์ ์, ์ฐ๋ฆฌ๋ ํ๊ท ์ฃผ๊ธฐ ๊ธธ์ด์ ํ์ฌ ์ฃผ๊ธฐ์ ์๋ฆฌ์ผ์ ๊ธธ์ด๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐฐ๋์ผ์ ์์ธกํ๋ ค๊ณ ๋ ธ๋ ฅํ๋ค. ๋ฐฐ๋์ผ์ ์๋ฆฌ ๋ฉฐ์น ์ ์ ๋ฐ์ํ๋ฏ๋ก, ์ด์ ์ฌ์ดํด์ ํ๊ท ๊ฐ๊ณผ ํ์ฌ ์ฌ์ดํด์ ๋ฉํธ ๊ธธ์ด๋ฅผ ์ด์ฉํ์ฌ ๋ฐฐ๋์ผ ์์ธก์ ์๋ํ์ผ๋ ์ด๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ์ง ๋ชปํ๋ค. ๊ฐ์ธ๋ง๋ค ์ฃผ๊ธฐ, ๋ฐฐ๋์ผ, ์๋ฆฌ์ ๊ธธ์ด๊ฐ ๋ชจ๋ ๋ค๋ฅด๋ค. ๊ทธ๋ฌ๋ ์ด ๊ณผ์ ์ ํตํด, ์ฐ๋ฆฌ๋ ๋ฐฐ๋์ผ์ด ์๋ฆฌ์ผ์ ๊ธธ์ด์ ๋ช ํํ ๊ด๊ณ๊ฐ ์๋ค๋ ๊ฒ์ ์ ์ ์์๋ค.
ย ย ย ํธ๋ ์ด๋ ์ธํธ์์ 0.187, ํ
์คํธ ์ธํธ์์ 0.2์ loss ๊ฐ์ ๊ทธ์ณค์ง๋ง, ์ด์ ๋ชจ๋ธ๊ณผ ๋น๊ตํด ์์ฒญ๋ ์์ epochs๋ฅผ ์ฌ์ฉํ๋ค. ๊ณผ์ ํฉ์ด ์ผ์ด๋ ์ ์๋ค.
์๊ณ์ด ๋ถ์(Time Series Analysis)
์๊ฐ์์ ์์ฐจ์ ์ผ๋ก ๊ด์ธกํ ๊ฐ๋ค์ ์งํฉ์ด๋ค. ํ๊ท๋ถ์์ด ๋ ๋ฆฝ๋ณ์๊ฐ ์๋ก ๋ ๋ฆฝ์ด๊ณ ๋ณ์ ๊ทธ ์์ฒด๋ ๋ ๋ฆฝ์ฑ์ ๊ฐ์ง๋ค๋ ๊ฒ์ ์ ์ ๋ก ํ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ, ์๊ณ์ด๋ถ์์ ๋ณ์๊ฐ ์๊ธฐ์๊ด์ฑ์ ๊ฐ์ง๋ ๊ฒ์ ์ ์ ๋ก ํ๋ฉฐ ๋ ๋ฆฝ๋ณ์๋ก๋ ์๊ฐ์ ์ฌ์ฉํ๋ค. ์์ ๋ฐ์ดํฐ๊ฐ ๋ค์ ๋ฐ์ดํฐ์ ์ํฅ์ ๋ฏธ์น๋ค๊ณ ๋ณด๊ณ ๋ถ์์ ์ํ๋ฏ๋ก ๊ทธ ์์๊ฐ ์ค์ํ๋ค.LSTM(Long Short-Term Memory models)
LSTM์ RNN(Recurrent Neural Networks)์ ํ ์ข ๋ฅ์ด๋ค. RNN์ ํ๋ ๋ ธ๋๊ฐ ๋ฐฉํฅ์ ๊ฐ์ง ์ฃ์ง๋ก ์ฐ๊ฒฐ๋ผ ์ํ๊ตฌ์กฐ๋ฅผ ์ด๋ฃจ๋(directed cycle) ์ธ๊ณต์ ๊ฒฝ๋ง์ ํ ์ข ๋ฅ๋ก ์์ฑ, ๋ฌธ์ ๋ฑ ์์ฐจ์ ์ผ๋ก ๋ฑ์ฅํ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ์ ํฉํ ๋ชจ๋ธ๋ก ์๋ ค์ ธ ์๋ค. ๊ทธ๋ฌ๋ RNN์ ๊ด๋ จ ์ ๋ณด์ ๊ทธ ์ ๋ณด๋ฅผ ์ฌ์ฉํ๋ ์ง์ ์ฌ์ด ๊ฑฐ๋ฆฌ๊ฐ ๋ฉ ๊ฒฝ์ฐ ์ญ์ ํ์ ๊ทธ๋๋์ธํธ๊ฐ ์ ์ฐจ ์ค์ด ํ์ต๋ฅ๋ ฅ์ด ํฌ๊ฒ ์ ํ๋๋ค. LSTM์ RNN์ ํ๋ state์ cell-state๋ฅผ ์ถ๊ฐํจ์ผ๋ก์จ ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๊ณ ์๋์๋ค.
CNN(Convolutional Neural Network)
CNN์ ํฉ์ฑ๊ณฑ์ฐ์ฐ์ ์ฌ์ฉํ๋ ANN(Artificial Neural Network, ์ธ๊ณต ์ ๊ฒฝ๋ง)์ ํ ์ข ๋ฅ๋ก, ๋ฐ์ดํฐ์์ ์ง์ ํ์ตํ๊ณ ํจํด์ ์ฌ์ฉํด ๋ถ๋ฅํ๋ค. ์ฆ, ํน์ง์ ์๋์ผ๋ก ์ถ์ถํ ํ์๊ฐ ์๋ค. ์ด๋ฏธ์ง์ฒ๋ผ ์ฌ๋ฌ ๊ฐ์ด ๊ฒฉ์ํํ๋ก ๊ตฌ์ฑ๋ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ์ด๋ค.
ย ย ย ย ์ ๋๊ฐ์ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํด ์๊ณ์ด ๋ถ์์ ํ๋ค.
ย ย ย ย LSTM ๋ชจ๋ธ์ ๋จผ์ ์๋ํ์ง๋ง, ํด๊ฒฐํ ์ ์๋ ์ค๋ฅ์ ๋ถ๋ชํ ์ฑ๊ณตํ์ง ๋ชปํ๋ค. tensorflow.js ์ปค๋ฎค๋ํฐ๋ python์์ tensorFlow๋งํผ ํฌ์ง ์์์ ๋ฐ์ํ ์ค๋ฅ์ ๋ํ ์ถฉ๋ถํ ์ฌ๋ก๋ฅผ ์ฐพ์ ์ ์์๋ค. ์ค๋ฅ๋ ์ ๋ ฅ์ ์ฐจ์์ ๊ดํ ๊ฒ์ด์๋๋ฐ, 2๊ฐ ์๋๋ผ 3์ด ๋์ด์๋ ์ ๋๋ค๋ ๊ฒ์ด์๋ค. ์ฐ๋ฆฌ๋ ์ด ํน์ ํ ์ค๋ฅ๋ฅผ ๊ณ ์น ์๋, ์ ๊ทธ๋ฐ ์ผ์ด ์ผ์ด๋ฌ๋์ง ์ดํดํ ์๋ ์์๋ค.
ย ย ย ย ๊ทธ๋์ CNN ๋ชจ๋ธ์ ์ฌ์ฉํด ์๊ณ์ด ๋ถ์์ ํ๊ธฐ๋ก ๊ฒฐ์ ํ๋ค. 1D CNN์์, convolutional layer์ kernel์ด ํ ๋ฐฉํฅ์ผ๋ก ์์ง์ธ๋ค. ๋ชจ๋ธ์ด ์๋ํ๊ธฐ ์ํด ์
๋ ฅ ํ
์๋ฅผ 3d ํ
์๋ก ๋ณํํด์ผ ํ๋ค๊ณ ํด๋ ๊ธฐ๋ณธ์ ์ผ๋ก๋ 1์ฐจ์ ๊ธฐ๋ฅ ๋ฐฐ์ด์ด๋ค.
ย ย ย ์๊ณ์ด ์์ธก์ผ๋ก ์์
ํ ๋, ์ฃผ๊ธฐ ์์ธก์ฒ๋ผ ์ด์ ๊ฐ์ ์
๋ ฅ์ผ๋ก ์ฌ์ฉํ์ฌ ๋ค์ ๊ฐ์ ์์ธกํ๋ ๊ฒ์ด ๋ชฉํ์ธ ๊ฒฝ์ฐ, ์ฌ์ฉ๋ ๋ผ๋ฒจ์ ๋ฐ์ดํฐ ์งํฉ์ ํ์๊ฐ ๋ค์ ๊ฐ์ด๋ค. ์๋ฅผ ๋ค์ด ์ด์ ์ฃผ๊ธฐ์ n=44 ๊ฐ์ ์ฌ์ฉํ๋ ์ฌ์ฑ์ ๋ค์ ์ฃผ๊ธฐ์ ๊ธธ์ด๋ฅผ ์์ธกํด์ผ ํ๋ ๊ฒฝ์ฐ, ํ์(4๋ฅผ ์๋ก ๋ค ์ ์์)์ผ๋ก ์ด์ ์ฃผ๊ธฐ์ ์๋ฅผ ์ ํํ๊ณ ๊ฐ ํ์ ๊ทธ๋ฃน ๋ค์ ๋ค์ ๊ฐ์ ๋ ์ด๋ธ๋ก ์ ํํ๋ค. CNN์ ์ด๋ฏธ์ง์ฒ๋ผ ์ฌ๋ฌ ๊ฐ์ด ๊ฒฉ์ํํ๋ก ๊ตฌ์ฑ๋ ์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ์ด๊ธฐ์, 8๊ฐ์ ์ฃผ๊ธฐ ๋ฐ์ดํฐ๋ฅผ 2๋ฒ ์ฌ์ฉํด cycle1~4์ feature์ NextCycle์ label์ผ๋ก ๋ณํํ์ฌ ํ์ตํ์๋ค.
ย ย ย ์ฃผ๊ธฐ ๊ธธ์ด ์์ธก ํธ๋ ์ด๋ ์ข
๋ฃ ํ loss ๊ฐ์์ ํ๊ท 0.0018์ด๋ค. ๊ฐ ์์ธก์ ์์ด ๋ง์กฑํ ๋งํ ์์น์ด๋ค.
ย ย ย ย ํจํด์ด ์๋ ๋ถ๊ท์นํ ์ฃผ๊ธฐ๋ฅผ ๊ฐ์ง ์ฌ์ฉ์์ ์๋ฅผ ๋ค์ด, ์์ธก ์ [28,40,27,40]์ ์
๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ฉด ์ถ๋ ฅ์ 27์ด๋ฉฐ, ์ด๋ ์๋ณธ ๋ฐ์ดํฐ ์งํฉ์์์ ๊ฐ๊ณผ ๋งค์ฐ ์ ์ฌํ๋ค. [40,27,40,27]์ ์ฌ์ฉํ ๋์๋, ์ด ํน์ ์ฌ์ฉ์์ ๋ํด ๋ฐ๊ฒฌ๋ ํจํด์ ๋ฐ๋ผ 40์ด ๋๋ค.
ย ย ย ๊ฐ์ ์ ๊ทผ๋ฐฉ์๊ณผ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์๋ฆฌ์ผ์ ๊ธธ์ด๋ฅผ ์์ธกํ์ ๋๋ ์ฝ๊ฐ ๋ค๋ฅธ ๊ฒฐ๊ณผ๊ฐ ์์๋ค. ์๋ฆฌ์ผ์ ๊ธธ์ด ์์ธก ์ ํ๋๋ ์ฝ๊ฐ ๋ ๋ฎ์๋ค.
ย ย ย ๊ทธ๋ฌ๋ ๋ฐฐ๋์ผ ์์ธก์ loss ๊ฐ์ ํ๋ฅญํ ์ฑ๋ฅ์ ๋ณด์๋ค. ์ด๊ฒ์ ๋ฐฐ๋์ผ๊ณผ ์ฃผ๊ธฐ์ ๊ธธ์ด ์ฌ์ด์ ๊ด๊ณ๋ก ์ค๋ช
ํ ์ ์๋ค. Feature engineering ๊ณผ์ ์์ ์ดํด๋ณธ ๊ฒ ์ฒ๋ผ estimated day of ovulation์ cycle length๊ฐ ๊ธธ์๋ก ๊ธธ์ด์ง๋ค. ๋๋ฌธ์ ์ฃผ๊ธฐ ๊ธธ์ด ์์ธก์ ์ ํ ์ ์๋ค๋ฉด ๋ฐฐ๋์ผ ์์ธก๋ ์ ํ ์ ์๋ ๊ฒ์ด๋ค.
ย ย ย Loss ๊ฐ์ 0.04์ด๋ค.
ย ย ย ย ๋จธ์ ๋ฌ๋์ ํตํด์ ์ฐ๋ฆฌ๊ฐ ๋ชฉํํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์๋ค. ๋ณด๋ฆ๋ฌ ์๋น์ค๋ ์ฌ์ฉ์๊ฐ ์ ๋ ฅํ ์ ๋ณด๋ฅผ ์ด์ฉํ์ฌ ์ฌ์ฉ์์ ๋ค์ ์๋ฆฌ ์ฃผ๊ธฐ, ๋ฐฐ๋์ผ์ ์์ธกํ์ฌ ์๋ ค์ค๋ค. ์ด๋ ์ฌ์ฑ ๊ฑด๊ฐ ์ดํ์์ ๊ฐ์ฅ ํต์ฌ์ด ๋๋ ๊ธฐ๋ฅ์ด๊ณ , ๋ณด๋ฆ๋ฌ ์๋น์ค์์๋ ์ฃผ์ถ์ด ๋ ๊ฒ์ด๋ค.
ย ย ย ย ๋ฐ์ดํฐ ์ ์ ์ฐพ๋ ๊ณผ์ ์์ ํ๋ณธ์ ์๊ฐ ์ถฉ๋ถํ ๋ฐ์ดํฐ์ ์ ์ฐพ์ง ๋ชปํด ์ ์ ๋ฐ์ดํฐ์ ์์๋ก ๊ฐ์ ํ ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํ์ฌ ๋ชจ๋ธ์ ๊ตฌ์ถํ์๊ธฐ ๋๋ฌธ์ ์ค์ ์ํฉ๊ณผ ์์ดํ ์ ์๋ค๋ ํ๊ณ๊ฐ ์๋ค. ๊ทธ๋ฌ๋ ์๋น์ค๋ฅผ ์ด์ํ๋ฉด์ ์ฌ์ฉ์๋ค์ ์ ๋ณด๊ฐ ๊ณ์ ์์ฌ ๋ณด๋ฆ๋ฌ ์๋น์ค๋ง์ ๋ฐ์ดํฐ์ ์ด ๋ง๋ค์ด์ง๊ฒ ๋๋ค๋ฉด, ์ ํํ ๋ชจ๋ธ์ ๊ตฌ์ถํ ์ ์์ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.