CS231n Lec3(2) Optimization & Image Features๐Ÿ™‹

willowkim8ยท2021๋…„ 1์›” 15์ผ
2

CS231n

๋ชฉ๋ก ๋ณด๊ธฐ
3/3

๊ธฐ๋ก์„ ํ•ด์•ผ ํ•˜๋Š” ๊ฒƒ์„ ์•Œ๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ ‡๊ฒŒ ๋˜ ์ ์–ด๋ด…๋‹ˆ๋‹ค.


๐Ÿ‘Optimization์ด๋ž€

Loss๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” W๋ฅผ ์ฐพ์•„๊ฐ€๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ๋ฐฉ๋ฒ•๊ณผ ๋ชฉ์ ์„ ์žŠ์ง€๋ง์•„์•ผํ•ฉ๋‹ˆ๋‹ค. loss ์ตœ์†Œํ™”๋ฅผ ์œ„ํ•ด ๊ทธ์— ๋งž๋Š” W๋ฅผ ์–ด๋–ป๊ฒŒ ์ฐพ์„ ๊ฑด์ง€์— ๋Œ€ํ•œ ๊ณต๋ถ€์ž…๋‹ˆ๋‹ค.

  1. Random Search
    ์ž„์˜๋กœ ๊ฐ€์ค‘์น˜(W)๋ฅผ ์„ ํƒํ•ด์„œ ํ•ด๋‹น ๊ฐ€์ค‘์น˜์˜ loss๋ฅผ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. ๋‹น์—ฐํžˆ ์‹ค์ œ๋กœ ์“ฐ์ด์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค. ์ •ํ™•๋„๊ฐ€ ์•„์ฃผ ๋‚ฎ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

  2. Follow the slope
    ์‚ฐ ์ •์ƒ์—์„œ ๋ˆˆ์„ ๊ฐ€๋ฆฐ ์ฑ„ ๋‚ด๋ ค๊ฐ„๋‹ค๊ณ ํ•  ๋•Œ, step๋งˆ๋‹ค ๊ธฐ์šธ๊ธฐ๊ฐ€ ๋‚ด๋ ค๊ฐ€๋Š” ์ชฝ์œผ๋กœ ํ•œ ๊ฑธ์Œ์”ฉ ๊ฑธ์–ด์•ผ ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.
    2-1. Numeric gradient (์ˆ˜์น˜์ ์œผ๋กœ ๊ณ„์‚ฐ)


    ์ฝ”๋“œ์— h = 0.00001 ์„ ๋„ฃ์–ด์„œ ๋Œ๋ฆฐ๋‹ค๋Š” ๊ฒƒ์€ ๋ฏธ๋ถ„์ด ์•„๋‹ˆ๋ผ ๊ทธ์ € ๊ธฐ์šธ๊ธฐ๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

W ์˜ ๋ชจ๋“  ์ฐจ์›์—์„œ h๋ฅผ ๋”ํ•˜๊ณ  ๊ธฐ์šธ๊ธฐ ๊ฐ’์„ ๊ตฌํ•ด์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์‹œ๊ฐ„์ด ๋งŽ์ด ๊ฑธ๋ฆฐ๋‹ค. ๊ทธ๋ž˜์„œ ๋˜ ์‹ค์ œ๋กœ๋Š” ์“ฐ์ด์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

2-2. Analytically gradient (ํ•ด์„์ ์œผ๋กœ ์ ‘๊ทผ)
๋‰ดํ„ด๊ณผ ๋ผ์ดํ”„๋‹ˆ์ธ ๊ฐ€ ๋ฏธ๋ถ„์„ ์•Œ์•„๋ƒˆ๊ณ  ์‹ค์ œ๋กœ๋Š” ์ด ๋ฐฉ๋ฒ•์œผ๋กœ evaluteํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์—๋Ÿฌ์˜ ๊ฐ€๋Šฅ์„ฑ๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ Analytically gradient๋ฅผ ํ™•์ธํ•˜๋Š” ์šฉ๋„๋กœ Numeric gradient๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์ด๋ฅผ Gradient check์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

3.Gradient Descent ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•
์ตœ์ €์ ์„ ์ฐพ์„ ์ˆ˜ ์žˆ๊ฒŒ gradient๊ฐ€ ์ฆ๊ฐ€ํ•˜๋Š” ๋ฐ˜๋Œ€ ๋ฐฉํ–ฅ์œผ๋กœ ์›€์ง์ธ๋‹ค.
3-1. mini batch
์ „์ฒด ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ ์•„๋‹Œ ์ผ๋ถ€๋ถ„๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ ๋ฏธ๋‹ˆ ๋ฐฐ์น˜ ์‚ฌ์ด์ฆˆ๋Š” 32/64/128๊ฐœ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. GPU ๋ฉ”๋ชจ๋ฆฌ์— ๋งž๊ฒŒ ์„ค์ •ํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค.


๐Ÿ‘Image Features

raw image์—์„œ RGB๋ฅผ ๊ฐ๊ฐ ๋ถ„๋ฅ˜ํ•ด์„œ ์ถ”์ถœํ•ด๋‚ด๊ณ  ์ด๊ฒƒ์„ ๋‹ค์‹œ ์ด์–ด๋ถ™์ด๋ฉด ํฐ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.
Color Histogram์œผ๋กœ๋„ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํžˆ์Šคํ† ๊ทธ๋žจ์€ ์ด๋ฏธ์ง€๊ฐ€ ์–ผ๋งˆ๋‚˜ ๊ฐ™์€ ์ƒ‰์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€ ํ†ต๊ณ„์  ์ˆ˜์น˜์ฒ˜๋Ÿผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

  1. HOG/SIFT Features
    8x8 ํ”ฝ์…€์—์„œ ์ด๋ฏธ์ง€ edge์˜ ์ •๋ณด๋ฅผ ์š”์•ฝํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

  2. Bag of Words
    ํ…์ŠคํŠธ ๋งˆ์ด๋‹๊ณผ ์œ ์‚ฌํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค.
    1โƒฃ raw image๋ฅผ visual word vectors๋กœ ํ‘œํ˜„ํ•˜๊ธฐ ์œ„ํ•ด ์ˆซ์ž๋กœ ์ด๋ค„์ง„ ๋ฒกํ„ฐ ํ˜•ํƒœ๋กœ embeding ํ•œ๋‹ค.
    2โƒฃ k-means ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ 1000๊ฐœ์˜ ์ค‘์‹ฌ ์ ์„ ๊ฐ–๋„๋ก ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค.
    3โƒฃ ๊ฐ ์ด๋ฏธ์ง€์˜ visual word๋“ค์„ 1000-d ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2012 ์ด์ „
์ด๋ฏธ์ง€๋ฅผ ๊ฐ€์žฅ ์ž˜ ๋‚˜ํƒ€๋‚ด๋Š” feature๋ฅผ ์ถ”์ถœํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ–ˆ์Šต๋‹ˆ๋‹ค.

2012 ์ดํ›„
AlexNet์ด ๋“ฑ์žฅํ•˜๋ฉด์„œ cnn ๊ตฌ์กฐ๋กœ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์‹œ์ž‘ํ•˜๋ฉด์„œ ํ›Œ๋ฅญํ•œ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ๋Š” ๊ตฌ์กฐ๋ฅผ ๊ณ ๋ฏผํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

profile
๋ง๊ณ ๋†์žฅ์ฃผ์ธ

0๊ฐœ์˜ ๋Œ“๊ธ€