[๐Ÿ“šCS ์Šคํ„ฐ๋””] ํ…์ŠคํŠธ ํ‘œํ˜„_์•„์Šคํ‚ค์ฝ”๋“œ / ์œ ๋‹ˆ์ฝ”๋“œ / UTF-8

Yun'sยท2022๋…„ 1์›” 21์ผ
0

๐Ÿ“š CS ์Šคํ„ฐ๋””

๋ชฉ๋ก ๋ณด๊ธฐ
1/2
post-thumbnail

๐Ÿ“– ํ…์ŠคํŠธํ‘œํ˜„

๐Ÿค” ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด ๋ฌธ์ž๋‚˜ ํ‚ค๋ณด๋“œ์— ์žˆ๋Š” ๋‹ค๋ฅธ ๊ธฐํ˜ธ ๋“ฑ์„ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•โ“



๐Ÿ“• ์•„์Šคํ‚ค์ฝ”๋“œ (ASCII)

  • American Standard Code for Information Interchange

  • 1963๋…„ ๋ฏธ๊ตญ ANSI์—์„œ ํ‘œ์ค€ํ™”ํ•œ ์ •๋ณด ๊ตํ™˜์„ ์œ„ํ•œ ๋ฏธ๊ตญ ํ‘œ์ค€ ์ฝ”๋“œ

  • ํ‚ค๋ณด๋“œ์— ์žˆ๋Š” ๋ชจ๋“  ๊ธฐํ˜ธ์— ๋Œ€ํ•ด 7๋น„ํŠธ ์ˆ˜ ๊ฐ’์„ ํ• ๋‹น



๐Ÿ“ ์•„์Šคํ‚ค์ฝ”๋“œ ํ‘œ





๐Ÿ“ ์•„์Šคํ‚ค์ฝ”๋“œ ์ œ์–ด๋ฌธ์ž

  • ๊ธ€์ž๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ๋ฐ ์“ฐ์ด์ง€ ์•Š๊ณ  ์žฅ์น˜๋ฅผ ์ œ์–ดํ•˜๊ธฐ ์œ„ํ•ด ์“ฐ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ œ์–ด๋ฌธ์ž๋ผ๊ณ  ๋ถˆ๋ฆผ



๐Ÿ“™ ์•„์Šคํ‚ค์™€ ๊ฒฝ์Ÿํ–ˆ๋˜ ์—ก์‹œ๋”• (EBCDIC)

  • Extended Binary Coded Decimal Interchange Code

  • IBM์˜ ํ™•์žฅ BCD๊ตํ™˜ ์ฝ”๋“œ๊ฐ€ ์žˆ์Œ (=ํ™•์žฅ ์ด์ง„ํ™” ์‹ญ์ง„๋ฒ• ๊ตํ™˜ ๋ถ€ํ˜ธ).
    ๐Ÿ‘‰ 'BCD'๋Š” ์•ž์—์„œ ์‚ดํŽด๋ณธ 2์ง„ ์ฝ”๋“œํ™”ํ•œ 10์ง„์ˆ˜๋ฅผ ๋œปํ•จ



๐Ÿ˜ฃ ์—ก์‹œ๋”•์ด ์•„์Šคํ‚ค์™€์˜ ๊ฒฝ์Ÿ์—์„œ ๋ฐ€๋ฆฐ ์ด์œ 

  • EBCDIC์€ ISO-8859 ๊ณ„์—ด์ด๋‚˜ ์œ ๋‹ˆ์ฝ”๋“œ ๊ฐ™์€ ASCII ๊ธฐ๋ฐ˜ ์ฝ”๋“œ ํŽ˜์ด์ง€์— ๋น„ํ•ด ์ตœ๊ทผ ๊ธฐ์ˆ ์ ์ธ ๊ด€์ ์—์„œ๋Š” ์žฅ์ ์ด ์—†์Œ

    • EBCDIC์€ ํŠน์ • 1๋น„ํŠธ๋งŒ ๋ณด๋ฉด ๋Œ€๋ฌธ์ž์ธ์ง€ ์†Œ๋ฌธ์ž์ธ์ง€ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์–ด ์žˆ์ง€๋งŒ, EBCDIC์€ ์•ŒํŒŒ๋ฒณ์ด ์—ฐ์†์ ์ด์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ASCII์— ๋น„ํ•ด ์‚ฌ์šฉํ•˜๊ธฐ ์–ด๋ ค์šด ์ธก๋ฉด์ด ์žˆ์Œ

    • ๋Œ€๋ถ€๋ถ„์˜ EBCDIC ์ฝ”๋“œ ํŽ˜์ด์ง€๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ ํ•˜๋‚˜์˜ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋‚˜ ํ…์ŠคํŠธ ํŒŒ์ผ ๋‚ด์—์„œ ์ตœ๋Œ€ ์–ธ์–ด 2๊ฐœ๊นŒ์ง€๋งŒ(= ์˜์–ด์™€ ๋˜ ๋‹ค๋ฅธ ํ•œ ์–ธ์–ด) ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Œ



๐Ÿ˜‚ ์—ก์‹œ๋”•์— ๋Œ€ํ•œ ๋น„ํŒ ๋ฐ ์œ ๋จธ

  • ์˜คํ”ˆ ์†Œ์Šค ์†Œํ”„ํŠธ์›จ์–ด ์˜นํ˜ธ์ž์ด์ž ํ•ด์ปค์ธ ์—๋ฆญ ๋ ˆ์ด๋จผ๋“œ๋Š”

    ์ž์‹ ์˜ "์ž๊ณค ํŒŒ์ผ(Jargon File)"์—์„œ ์„œ๋กœ ๋‹ฎ์ง€๋„ ์•Š์€ ๋‹ค์–‘ํ•œ EBCDIC์˜ ๋‹ค๋ฅธ ๋ฒ„์ „๋“ค ๋•Œ๋ฌธ์—

    ์ดˆ๊ธฐ ํ•ด์ปค์™€ ํ”„๋กœ๊ทธ๋ž˜๋จธ๋Š” ๊ฑฐ์˜ ์˜ˆ์™ธ ์—†์ดEBCDIC์„ ์‹ซ์–ดํ–ˆ๊ณ ,

    IBM์€ ์ด๋ฏธ ์ž๋ฆฌ ์žก๊ณ  ์žˆ๋˜ ASCII๊ฐ€ ์žˆ์Œ์—๋„ ๊ฐ™์€ ๋ชฉ์ ์œผ๋กœ EBCDIC๋ฅผ ๋งŒ๋“ค์—ˆ๋‹ค๊ณ  ์–ธ๊ธ‰ํ–ˆ๋‹ค.
  • EBCDIC์˜ ์•ŒํŒŒ๋ฒณ ๋ฌธ์ž๊ฐ€ ASCII์ฒ˜๋Ÿผ ์ˆœ์ฐจ์ ์ด์ง€ ์•Š๊ณ  ํƒœ๊ณ ์  ์ฒœ๊ณต ์นด๋“œ์˜
    ์ธ์ฝ”๋”ฉ์„ ๋”ฐ๋ฅด๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

    ์ผ๋ก€๋กœ "I"์— ํ•ด๋‹นํ•˜๋Š” ๋ฌธ์ž ์ฝ”๋“œ๋ฅผ 1๋งŒํผ ์ฆ๊ฐ€์‹œํ‚ค๋ฉด "J"์— ํ•ด๋‹นํ•˜๋Š” ์ฝ”๋“œ๊ฐ€ ๋‚˜์˜ค์ง€ ์•Š๋Š”๋‹ค.

    ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ "R"๊ณผ "S" ์‚ฌ์ด์—๋„ ํ‹ˆ์ด ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ์•ŒํŒŒ๋ฒณ ๋ฌธ์ž๋งŒ ํ›‘๋Š” ๊ฐ„๋‹จํ•œ ๋ฃจํ”„๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๊ฒƒ์กฐ์ฐจ ์‰ฝ์ง€ ์•Š๋‹ค.
  • ์ธํฌ์ฝค(Infocom)์—์„œ ๋งŒ๋“  ๊ณ ์ „ ๋ชจํ—˜ ๊ฒŒ์ž„์ธ "Zork II"์—๋„ EBCDIC ๋ฌธ์ž ์ง‘ํ•ฉ์ด ๋‚˜์˜จ๋‹ค.

    "๊ธฐ๊ณ„์‹ค"์— ๊ณ ๋Œ€ ์ปดํ“จํ„ฐ๋“ค๊ณผ ๋ฌด์Šจ ์šฉ๋„์ธ์ง€ ์•Œ ์ˆ˜ ์—†๋Š” ๋‹ค๋ฅธ ๊ธฐ๊ณ„๋“ค์ด ์žˆ๋‹ค. ๋‹ค์Œ์€ ๊ทธ ๋ฐฉ์— ๋Œ€ํ•œ ์„ค๋ช…์ธ๋ฐ ์ดํ•ดํ•  ์ˆ˜ ์—†๋Š” ์–ธ์–ด๋ผ๋Š” ๊ฒƒ์„ ์„ค๋ช…ํ•˜๊ธฐ ์œ„ํ•ด EBCDIC์ด ์‚ฌ์šฉ๋˜์—ˆ๋‹ค.

    "์—ฌ๊ธฐ๋Š” ์‹œ๋„๋Ÿฝ๊ฒŒ ์œ™์œ™ ๊ฑฐ๋ฆฌ๋Š” ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ๋ฌด๊ฑฐ์šด ๊ธฐ๊ณ„๋กœ ๊ฐ€๋“์ฐฌ ๋ฐฉ์ด๋‹ค.

    ํƒ„ ์ €ํ•ญ ๋ถ€ํ’ˆ ๋ƒ„์ƒˆ๊ฐ€ ๋‚œ๋‹ค. ํ•œ ์ชฝ ๋ฒฝ๋ฉด์„ ๋”ฐ๋ผ ์„ธ ๋‹จ์ถ”๊ฐ€ ์žˆ๋Š”๋ฐ ํ•˜๋‚˜๋Š” ๋‘ฅ๊ธ€๊ณ , ๋˜ ํ•˜๋‚˜๋Š” ์‚ผ๊ฐํ˜•, ๋‚จ์€ ํ•˜๋‚˜๋Š” ์‚ฌ๊ฐํ˜• ๋ชจ์–‘์ด๋‹ค.

    ๋‹น์—ฐํ•˜์ง€๋งŒ ๊ฐ ๋‹จ์ถ” ์œ„์—๋Š” EBCDIC๋กœ ์“ฐ์—ฌ์ง„ ์„ค๋ช…์ด ๋ถ™์–ด ์žˆ๋‹ค..."


๐Ÿ“— ๋‹ค๋ฅธ ํ‘œ์ค€์˜ ์ง„ํ™”

  • ์•„์Šคํ‚ค๋Š” ์˜์–ด๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ๋ชจ๋“  ๋ฌธ์ž๋ฅผ ํฌํ•จํ•˜๊ณ  ์žˆ์–ด ์ƒ๋‹น ๊ธฐ๊ฐ„ ํ‘œ์ค€ ์—ญํ• ์„ ํ•จ

  • ์ดˆ๊ธฐ ์ปดํ“จํ„ฐ๋Š” ๋Œ€๋ถ€๋ถ„ ๋ฏธ๊ตญ์‚ฐ, ๋ฏธ๊ตญ์‚ฐ์ด ์•„๋‹Œ ์ปดํ“จํ„ฐ๋Š” ์˜๊ตญ์‚ฐ.
    ํ•˜์ง€๋งŒ ์ปดํ“จํ„ฐ๊ฐ€ ๋„๋ฆฌ ์“ฐ์ด๊ฒŒ ๋จ์— ๋”ฐ๋ผ ๊ทธ ๋ฐ–์˜ ์–ธ์–ด๋ฅผ ์ง€์›ํ•ด์•ผ ํ•  ํ•„์š” ์ ์ฐจ ๋Š˜์–ด๋‚จ.

  • ๊ตญ์ œ ํ‘œ์ค€ํ™” ๊ธฐ๊ตฌ (ISO, International Standards Organization )๋Š” ISO-646๊ณผ ISO-8859๋ฅผ ๋„์ž…
    (๊ธฐ๋ณธ์ ์œผ๋กœ ์•„์Šคํ‚ค๋ฅผ ํ™•์žฅํ•ด ์œ ๋Ÿฝ ์–ธ์–ด์— ํ•„์š”ํ•œ ์•ก์„ผํŠธ ๊ธฐํ˜ธ๋‚˜ ๊ทธ ๋ฐ–์˜ ๋ฐœ์Œ ๊ตฌ๋ณ„ ๊ธฐํ˜ธ๋ฅผ ์ถ”๊ฐ€ํ•œ ๊ฒƒ)

  • ์ผ๋ณธ์‚ฐ์—… ํ‘œ์ค€ (JIS, Japanese Industrial Standards) ์œ„์›ํšŒ๋Š” ์ผ๋ณธ ๋ฌธ์ž๋ฅผ ํ‘œํ˜„ํ•˜๊ธฐ ์œ„ํ•ด JISX 0201์„ ๋งŒ๋“ค์—ˆ๋‹ค.

  • ์ค‘๊ตญ์–ด, ์•„๋ž์–ด, ํ•œ๊ตญ์–ด(KS C 5601) ๋“ฑ์˜ ํ‘œ์ค€๋„ ์ƒ๊ฒผ๋‹ค.

    ๐Ÿ‘‰ ๊ฐ๊ธฐ ๋‹ค๋ฅธ ํ‘œ์ค€์ด ์กด์žฌํ•œ ์ด์œ ๋Š” ๋น„ํŠธ๊ฐ€ ์ง€๊ธˆ๋ณด๋‹ค ๋” ๋น„์‹ผ ์‹œ์ ˆ์—
    ย ย ย ย ย ํ‘œ์ค€์ด ๋งŒ๋“ค์–ด์กŒ๊ธฐ ๋•Œ๋ฌธ. ๊ทธ๋ž˜์„œ ๋ฌธ์ž๋ฅผ 7๋น„ํŠธ๋‚˜ 8๋น„ํŠธ์— ์šฑ์—ฌ๋„ฃ์Œ.

๐Ÿ“˜ ์œ ๋‹ˆ์ฝ”๋“œ ๋ณ€ํ™˜ ํ˜•์‹ 8๋น„ํŠธ(UTF-8)

  • Unicode Transformation Format-8 bit

  • 16๋น„ํŠธ๋กœ ๋œ ์œ ๋‹ˆ์ฝ”๋“œ ๋ณ€ํ™˜ ํ˜•์‹์ธ UTF-16์ด๋‚˜ 32๋น„ํŠธ๋กœ ๋œ ๋ณ€ํ™˜ ํ˜•์‹์ธ UTF-32๋„ ์žˆ์Œ

  • ํŠนํžˆ ๋ฏธ๊ตญ ์ปดํ“จํ„ฐ๊ณผํ•™์ž ์ผ„ ํ†ฐ์Šจ๊ณผ ์บ๋‚˜๋‹ค ํ”„๋กœ๊ทธ๋ž˜๋จธ ๋กญ ํŒŒ์ดํฌ๊ฐ€ ๋งŒ๋“  ์œ ๋‹ˆ์ฝ”๋“œ ๋ณ€ํ™˜ ํ˜•์‹ 8๋น„ํŠธ๋ผ๋Š” ์ธ์ฝ”๋”ฉ ๋ฐฉ๋ฒ•์ด ํ•˜์œ„ ํ˜ธํ™˜์„ฑ๊ณผ ํšจ์œจ์„ฑ ๋•Œ๋ฌธ์— ๊ฐ€์žฅ ๋„๋ฆฌ ์“ฐ์ด๊ณ  ์žˆ์Œ

  • ์ปดํ“จํ„ฐ๋Š” 7๋น„ํŠธ๊ฐ’์„ ์ฒ˜๋ฆฌํ•˜๋„๋ก ์„ค๊ณ„๋˜์ง€ ์•Š์•˜๊ธฐ ๋•Œ๋ฌธ์— 8๋น„ํŠธ๋ฅผ ์‚ฌ์šฉํ•ด ์•„์Šคํ‚ค ๋ฌธ์ž๋ฅผ ์ €์žฅ

  • ๐Ÿค”: ๊ทธ๋Ÿฌ๋ฉด 16๋น„ํŠธ์— ๋„ฃ์–ด๋„ ๋˜์ง€ ์•Š๋‚˜์š”? ์™œ ๊ตณ์ด 8๋น„ํŠธ์— ์ €์žฅํ–ˆ๋‚˜์š”?

    ๐Ÿง: ๊ณผ๊ฑฐ์— ๋น„ํ•ด ๋น„ํŠธ๊ฐ€ ํ›จ์”ฌ ๋” ์ €๋ ดํ•ด์กŒ์ง€๋งŒ,,,,
    ย ย ย ย "8๋น„ํŠธ๋งŒ ์‚ฌ์šฉํ•˜๋ฉด ๋ชจ๋“  ๋ฌธ์ž๋ฅผ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ
    ย ย ย ย ๊ตณ์ด 16๋น„ํŠธ๋ฅผ ์‚ฌ์šฉํ•ด ๋‚ญ๋น„ํ•œ๋‹ค..? ๊ทธ๋งŒํผ ์‹ธ์ง„ ๊ฒƒ์€ ์•„๋‹ˆ์•ผ!"

    ๐Ÿ‘‰ ๊ฒฐ๋ก : ํ•œ ๋ฌธ์ž๋ฅผ 8๋น„ํŠธ๋กœ ํ‘œํ˜„.



๐Ÿ˜„ ์œ ๋‹ˆ์ฝ”๋“œ ๋ณ€ํ™˜ ํ˜•์‹ 8๋น„ํŠธ(UTF-8) ์žฅ์ 

  • UTF-8์€ ๋ชจ๋“  ์•„์Šคํ‚ค ๋ฌธ์ž๋ฅผ 8๋น„ํŠธ๋กœ ํ‘œํ˜„ํ•˜๊ธฐ ๋•Œ๋ฌธ์—
    ์•„์Šคํ‚ค ๋ฐ์ดํ„ฐ๋ฅผ ์ธ์ฝ”๋”ฉ ํ•  ๋•Œ๋Š” ์ถ”๊ฐ€ ๊ณต๊ฐ„์ด ํ•„์š”ํ•˜์ง€ ์•Š์Œ

  • ์•„์Šคํ‚ค๊ฐ€ ์•„๋‹Œ ๋ฌธ์ž์˜ ๊ฒฝ์šฐ ์•„์Šคํ‚ค๋ฅผ ๋ฐ›์•„์„œ ์ฒ˜๋ฆฌํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ์ด ๊นจ์ง€์ง€ ์•Š๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๋ฌธ์ž๋ฅผ ์ธ์ฝ”๋”ฉ ํ•จ

  • ๋ฌธ์ž๋ฅผ 8๋น„ํŠธ ๋ฉ์–ด๋ฆฌ (=octet, ์˜ฅํ…Ÿ)์˜ ์‹œํ€€์Šค๋กœ ์ธ์ฝ”๋”ฉ ํ•จ
    • UTF-8์—์„œ ๊ต๋ชจํ•œ ๋ถ€๋ถ„์€ ์ฒซ ๋ฒˆ์งธ ๋ฉ์–ด๋ฆฌ(8๋น„ํŠธ)์˜ MSB์ชฝ์— ์žˆ๋Š”
      ๋น„ํŠธ๋“ค์ด 8๋น„ํŠธ ๋ฉ์–ด๋ฆฌ(์˜ฅํ…Ÿ)์‹œํ€€์Šค์˜ ๊ธธ์ด๋ฅผ ํ‘œํ˜„ํ•˜๊ณ ,
      ๋ฉ์–ด๋ฆฌ์˜ ๋งจ ์•ž์„ ์‹๋ณ„ํ•˜๊ธฐ ์‰ฌ์›€
      (MSB ์ชฝ์˜ ๋น„ํŠธ ํŒจํ„ด์ด ๊ฒน์น˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ)

      ๐Ÿ‘‰ ํ”„๋กœ๊ทธ๋žจ์ด ๋ฌธ์ž ๊ฒฝ๊ณ„๋ฅผ ์ฐพ์•„์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ ์ด๋Ÿฐ ํŠน์„ฑ์ด ์•„์ฃผ ์œ ์šฉํ•จ

  • ๋ชจ๋“  ์•„์Šคํ‚ค ๋ฌธ์ž๋Š” 7๋น„ํŠธ์— ๋“ค์–ด๊ฐ€๊ธฐ ๋•Œ๋ฌธ์— ๋ฉ์–ด๋ฆฌ๋ฅผ ํ•˜๋‚˜๋งŒ ์‚ฌ์šฉํ•ด ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Œ

  • ์˜์–ด์˜ ๊ฒฝ์šฐ ๋น„ ์•„์Šคํ‚ค ๊ธฐํ˜ธ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์–ธ์–ด๋ณด๋‹ค ๋” ์ ์€ ์šฉ๋Ÿ‰์œผ๋กœ ๋ฌธ์ž๋ฅผ ์ธ์ฝ”๋”ฉํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์˜์–ด ์‚ฌ์šฉ์ž์—๊ฒŒ๋Š” ์ด๋Ÿฐ ํŠน์„ฑ์ด ์•„์ฃผ ํŽธ๋ฆฌํ•จ



๐Ÿค” MSB๋ž€โ“

  • ์ตœ์ƒ์œ„ ๋น„ํŠธ(most significant bit, msb)๋Š” ์ตœ๊ณ ๊ฐ’์„ ๊ฐ–๋Š” ๋น„ํŠธ ์œ„์น˜

  • ๊ฐ€์žฅ ํฐ ์ˆซ์ž๋ฅผ ์™ผ์ชฝ์— ๊ธฐ๋กํ•˜๋Š” ์ž๋ฆฌ ํ‘œ๊ธฐ๋ฒ•์˜ ๊ทœ์ • ๋•Œ๋ฌธ์—
    ๊ฐ€๋” "left-most bit"๋ฅผ ๋œปํ•˜๊ธฐ๋„ ํ•จ

  • ์ด์ง„์ˆ˜ ๋‚ด์— ์˜๋ฏธํ•˜๋Š” ํŠน์ • ๋น„ํŠธ์—์„œ, ๊ทธ ์ˆซ์ž์—์„œ ๋น„ํŠธ์ˆ˜๋ณด๋‹ค ํ•˜๋‚˜ ์ ์€ ๋ฐฉํ–ฅ์œผ๋กœ 0์—์„œ ๊ฐ ๋น„ํŠธ๋ฅผ ๋น„ํŠธ์ˆ˜๋กœ ํ• ๋‹นํ•˜๋Š”๊ฒŒ ์ผ๋ฐ˜์ 

  • ๊ทธ๋Ÿฌ๋‚˜ ์ด ํ• ๋‹น์„ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ์‹์€ ์–ด๋–ค ๋ฐฉํ–ฅ์— ์žˆ์„์ง€๋„ ๋ชจ๋ฅด๊ณ , ๋ชจ๋“  ๋ฐฉ์‹์€ ์‚ฌ์šฉ๋จ

    ๐Ÿ‘‰ "msb"๊ฐ€ ๋น„ํŠธ์ˆ˜ ๋Œ€์‹ ์— "high-order bit"๋ฅผ ๊ฐ€๋ฆฌํ‚ค๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š”
    ์ด์œ  ์ค‘ ํ•˜๋‚˜ (๋•Œ๋ฌธ์— ์ปค๋‹ค๋ž€ ํ˜ผ๋ž€์˜ ๊ฐ€๋Šฅ์„ฑ์„ ๊ฐ€์ง)



๐Ÿ“ UTF-8 ์ธ์ฝ”๋”ฉ ์˜ˆ์ œ


  • ๊ทธ๋ฆผ์—์„œ A๋ผ๋Š” ๋ฌธ์ž์˜ ์ˆซ์ž ์ฝ”๋“œ๊ฐ€ ์•„์Šคํ‚ค์™€ ์œ ๋‹ˆ์ฝ”๋“œ์—์„œ ๊ฐ™๋‹ค๋Š” ์‚ฌ์‹ค์„ ์•Œ ์ˆ˜ ์žˆ์Œ

  • A๋ฅผ UTF-8๋กœ ์ธ์ฝ”๋”ฉํ•  ๋•Œ, 7๋น„ํŠธ ์•ˆ์— ๋ฌธ์ž์˜ ์ฝ”๋“œ๊ฐ€ ๋“ค์–ด๊ฐ€๋ฉด
    (16๋น„ํŠธ๋กœ ํ‘œํ˜„ํ•  ๋•Œ 0x0000~0x007f๊ฐ€ ์ด ๋ฒ”์œ„์— ์†ํ•œ๋‹ค)
    UTF-8 ์ธ์ฝ”๋”ฉ์—์„œ๋Š” ๋ฉ์–ด๋ฆฌ๋ฅผ ํ•˜๋‚˜๋งŒ ์‚ฌ์šฉํ•˜๋ฉฐ MSB๋ฅผ 0์œผ๋กœ ์„ค์ •

๐Ÿ”” ์—ฌ๊ธฐ์„œ ์ž ๊น โ—

  • MSB๋Š” ์ตœ์ƒ์œ„ ๋น„ํŠธ(most significant bit, msb)๋Š” ์ตœ๊ณ ๊ฐ’์„ ๊ฐ–๋Š” ๋น„ํŠธ ์œ„์น˜์ด๋‹ค?

    ๐Ÿ‘‰ ๋งž์œผ๋ฉด ์นด๋ฉ”๋ผ๋ฅผ ๋ณด๊ณ  โญ• ํ‘œ์‹œ๋ฅผ, ํ‹€๋ฆฌ๋‹ค๋ฉด โŒ ํ‘œ์‹œ๋ฅผ ํ•ด์ฃผ์„ธ์š”!

    ย ย ย ย ย ๐Ÿ‘€๋‹ต๋ณ€ํ•ด์ฃผ์‹œ๋Š” ๋ชจ์Šต์„ ์ œ๊ฐ€ ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค๐Ÿ‘€

  • ๊ทธ๋ž˜์„œ A๋ผ๋Š” ๋ฌธ์ž๋ฅผ UTF-8๋กœ ํ‘œํ˜„ํ•œ ๊ทธ๋ฆผ์˜ ๋งจ ์•ž์— 0์ด ํ•˜๋‚˜ ์ถ”๊ฐ€๋จ

  • ๋‹ค์Œ์œผ๋กœ๋Š” ฯ€(๊ทธ๋ฆฌ์Šค ๋ฌธ์ž ํŒŒ์ด) ๊ธฐํ˜ธ์˜ ์œ ๋‹ˆ์ฝ”๋“œ๊ฐ€ ์žˆ์Œ
    ์ด ๊ฐ’์€ 7๋น„ํŠธ์— ๋“ค์–ด๊ฐ€์ง€ ์•Š์ง€๋งŒ 11๋น„ํŠธ๋กœ๋Š” ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Œ
    (16๋น„ํŠธ๋กœ ํ‘œํ˜„ํ•  ๋•Œ 0x0080~0x07ff๊ฐ€ ์ด ๋ฒ”์œ„์— ์†ํ•œ๋‹ค.)

  • ฯ€๋ฅผ UTF-8๋กœ ํ‘œํ˜„ํ•˜๋ ค๋ฉด 2๊ฐœ์˜ 8๋น„ํŠธ ๋ฉ์–ด๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜๋˜ ์ฒซ ๋ฒˆ์งธ ๋ฉ์–ด๋ฆฌ์˜ MSB 3๋น„ํŠธ๋ฅผ 110์œผ๋กœ ์‹œ์ž‘ํ•˜๊ณ  ๋‘ ๋ฒˆ์งธ ๋ฉ์–ด๋ฆฌ์˜ MSB 2๋น„ํŠธ๋Š” 10์œผ๋กœ ์‹œ์ž‘ํ•จ

  • ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์ฒซ ๋ฒˆ์งธ ๋ฉ์–ด๋ฆฌ์—๋Š” 5๋น„ํŠธ๊ฐ€ ๋‚จ๊ณ , ๋‘ ๋ฒˆ์งธ ๋ฉ์–ด๋ฆฌ์—๋Š” 6๋น„ํŠธ๊ฐ€ ๋‚จ์•„์„œ 11๋น„ํŠธ ์ฝ”๋“œ๋ฅผ ๋ชจ๋‘ ๋‹ด์„ ์ˆ˜ ์žˆ์Œ

  • ๋งˆ์ง€๋ง‰์œผ๋กœ 'ํ•œ'์ด๋ผ๋Š” ๋ฌธ์ž์ฝ”๋“œ๋Š” 16๋น„ํŠธ์— ๋“ค์–ด๊ฐ€๊ธฐ ๋•Œ๋ฌธ์— UTF-8 ๋ฉ์–ด๋ฆฌ๋ฅผ 3๊ฐœ ์‚ฌ์šฉํ•ด ํ‘œํ˜„ํ•จ
    (์ฑ…์—์„œ๋Š” ๊ฒ€์€ํด๋กœ๋ฒ„๊ฐ€ ์˜ˆ์‹œ๋กœ ์žˆ์–ด์š”!)

๐Ÿ’ ์ฐธ๊ณ ํ•˜๋ฉด ์ข‹์„ ์ž๋ฃŒ ๐Ÿ’

๐Ÿ“˜ ์œ„ํ‚ค๋ฐฑ๊ณผ ์•„์Šคํ‚ค์ฝ”๋“œ ์„ค๋ช… (ํด๋ฆญ)
๐Ÿ“˜ ์œ„ํ‚ค๋ฐฑ๊ณผ EBCDIC ์„ค๋ช… (ํด๋ฆญ)
๐Ÿ“˜ ์œ„ํ‚ค๋ฐฑ๊ณผ ISO ์„ค๋ช… (ํด๋ฆญ)
๐Ÿ“˜ ์œ„ํ‚ค๋ฐฑ๊ณผ JIS ์„ค๋ช… (ํด๋ฆญ)
๐Ÿ“˜ ์œ„ํ‚ค๋ฐฑ๊ณผ UTF-8 ์„ค๋ช… (ํด๋ฆญ)
๐Ÿ“˜ Unicode์™€ UTF-8 ๊ฐ„๋‹จํžˆ ์ดํ•ดํ•˜๊ธฐ ์„ค๋ช… (ํด๋ฆญ)
๐Ÿ“˜ ์•„์Šคํ‚ค์ฝ”๋“œ์™€ ํ™•์žฅ ์•„์Šคํ‚ค์ฝ”๋“œ (ํด๋ฆญ)
๐Ÿ“˜ ์œ ๋‹ˆ์ฝ”๋“œ๋ฅผ ์ œ๋Œ€๋กœ ์ดํ•ดํ•˜๋Š” ๋ฐฉ๋ฒ• ์„ค๋ช… (ํด๋ฆญ)
๐Ÿ“˜ ์•„์Šคํ‚ค์ฝ”๋“œ, ์œ ๋‹ˆ์ฝ”๋“œ, UTF-8 ์„ค๋ช… (ํด๋ฆญ)

๐Ÿ“ข CS ์Šคํ„ฐ๋””์˜ ๋‚ด์šฉ์€ <ํ•œ ๊ถŒ์œผ๋กœ ์ฝ๋Š” ์ปดํ“จํ„ฐ ๊ตฌ์กฐ์™€ ํ”„๋กœ๊ทธ๋ž˜๋ฐ> ์ฑ…์„
ย ย ย ย  ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ์˜ค๋Š˜์˜ ๋‚ด์šฉ์€ ๐Ÿ‘‰ p.78~83 ๐Ÿ‘ˆ์— ์žˆ์Šต๋‹ˆ๋‹ค!


profile
์šฐ๋‹นํƒ•ํƒ• ์•Œ๋‹ค๊ฐ€๋„ ๋ชจ๋ฅผ ์ฝ”๋”ฉ Life

0๊ฐœ์˜ ๋Œ“๊ธ€

๊ด€๋ จ ์ฑ„์šฉ ์ •๋ณด