목차
가. 한글 코드
컴퓨터는 내부적으로 정보를 처리하기 위해서 2진수 형태로 처리되기 때문에 문자를 직접적으로 처리할 수 없다. 이 때문에 컴퓨터가 문자를 처리할 수 있도록 2진수와의 대응 관계를 정의하였는데, 이것을 문자 코드라 한다. 따라서 한글 및 한국어(한자, 특수문자 등을 포함)를 컴퓨터 내부에서 2진수로 처리할 수 있도록 정의해 놓은 것이 한글 코드이다.
나. 한글 코드 개발의 필요성
널리 사용되는 ASCII 는 8bit로서 28(=256)개를 표현할 수 있다. 이는 28字의 영문자를 풀어쓰는 영․미 문화권에서는 불편함이 없지만, 자수(字數)가 많은 우리나라의 경우에는, 이를 사용하여 문자를 표현하는 것이 매우 곤란하다. 이 때문에 한글을 표현할 수 있는 한글 코드 체계의 개발이 절실히 필요하였다.
다. 국제 규격에 의한 제약
ISO는 ASCII(ISO-646)를 확장하여 2byte 이상 코드 체계를 사용할 때 지켜야 할 규격을 ISO-2022로 정의하고 있다. 이 규격에 따르면, 각 byte의 0~31(0x00~0x1F), 128~159(0x80~0x9F)는 제어 영역으로 문자를 할당할 수 없다. 또한 32(0x20)와 160(0xA0)은 공백(space)문자로, 127(0x7F)과 255(0xFF)는 삭제(delete)문자로 지정하고 있다. 아울러, 2byte 이상의 코드 체계인 경우 각 바이트의 MSB가 모두 동일할 것을 요구하고 있다. 기존 ASCII의 MSB가 0인 것을 감안한다면, MSB가 모두 1인 영역만을 사용할 수 있고, 즉 161~254(0xA1~0xFE)만을 한글 코드에 사용할 수 있는 셈이다.
1) 초성: 자음(14) + 쌍자음(5) = 19개
2) 중성: 자음(10) + 쌍자음(11) = 21개
3) 종성: 자음(14) + 쌍자음(11) + 쌍자음(2) = 27개
4) 받침 없는 글자: 초성(19) × 중성(21) = 399字
컴퓨터는 내부적으로 정보를 처리하기 위해서 2진수 형태로 처리되기 때문에 문자를 직접적으로 처리할 수 없다. 이 때문에 컴퓨터가 문자를 처리할 수 있도록 2진수와의 대응 관계를 정의하였는데, 이것을 문자 코드라 한다. 따라서 한글 및 한국어(한자, 특수문자 등을 포함)를 컴퓨터 내부에서 2진수로 처리할 수 있도록 정의해 놓은 것이 한글 코드이다.
나. 한글 코드 개발의 필요성
널리 사용되는 ASCII 는 8bit로서 28(=256)개를 표현할 수 있다. 이는 28字의 영문자를 풀어쓰는 영․미 문화권에서는 불편함이 없지만, 자수(字數)가 많은 우리나라의 경우에는, 이를 사용하여 문자를 표현하는 것이 매우 곤란하다. 이 때문에 한글을 표현할 수 있는 한글 코드 체계의 개발이 절실히 필요하였다.
다. 국제 규격에 의한 제약
ISO는 ASCII(ISO-646)를 확장하여 2byte 이상 코드 체계를 사용할 때 지켜야 할 규격을 ISO-2022로 정의하고 있다. 이 규격에 따르면, 각 byte의 0~31(0x00~0x1F), 128~159(0x80~0x9F)는 제어 영역으로 문자를 할당할 수 없다. 또한 32(0x20)와 160(0xA0)은 공백(space)문자로, 127(0x7F)과 255(0xFF)는 삭제(delete)문자로 지정하고 있다. 아울러, 2byte 이상의 코드 체계인 경우 각 바이트의 MSB가 모두 동일할 것을 요구하고 있다. 기존 ASCII의 MSB가 0인 것을 감안한다면, MSB가 모두 1인 영역만을 사용할 수 있고, 즉 161~254(0xA1~0xFE)만을 한글 코드에 사용할 수 있는 셈이다.
1) 초성: 자음(14) + 쌍자음(5) = 19개
2) 중성: 자음(10) + 쌍자음(11) = 21개
3) 종성: 자음(14) + 쌍자음(11) + 쌍자음(2) = 27개
4) 받침 없는 글자: 초성(19) × 중성(21) = 399字
본문내용
0∼0xFFFF)字를 할당할 수 있는 코드 영역이 있다. 이 중 38,885字는 주요 국가 언어 구현용으로 이미 할당되었고, 6,400字는 사용자 정의 영역(Private Use Area)으로, 20,249자는 향후 새로 추가될 언어영역(Future Use Area)으로 각각 비워두고 있다. 현재 할당된 주요 언어는 ASCII(美 표준 정보 교환 코드), 그리스語, 라틴語, 시릴 문자, 히브리語, 타이語, 기호 문자(Symbols), 함수 문자(Punctuation), 아랍語, 가나語, 한글 완성형(Hangul Syllables), 한글 자모(Hangul Jamo), CJK(中·日·韓 공통 한자), 표의 문자[漢字]. 대용 문자(Surrogates) 등이다.
코드 할당 비율을 보면, 한자가 39.89%(20,902字), 한글 17.04%(11,172자), 아스키 및 기호문자 10.39%(6,811字)의 순이다.
(이상 Unicode 3.x 기준)
다. 한글의 할당
1) Korean Syllable - 음절(音節)단위의 완성형.
영역: 0xAC00∼0xD7AF (실배정 11,172字)
AC00
AC01
AC02
…
AD50
…
C131
…
D559
…
가
각
간
교
성
학
2) Hangul Jamo - 조합형 자모 (옛 자모 포함).
영역: 0x1100∼0x11FF (실배정 240字)
1100
1101
1102
…
116C
…
11D2
…
11E2
…
ㄱ
ㄲ
ㄴ
ㅚ
ㅱ
3) Compatibility Jamo - 한국 표준(KSC5601 조합형) 한글 자모.
영역: 0x3130∼0x318F (실배정 94字)
3131
…
3135
…
3178
…
327F
…
ㄱ
힝
가
■ㅡ가
4) Circled Korean Hangul Elements - 원문자, 괄호문자, 상용기호 등.
영역: 0x3200-0x32FF
3200
…
321C
…
326E
…
327F
…
㈀
㈜
㉿
(이상 Unicode 4.x 기준)
라. 특징
16bit(2byte)코드를 기본으로, 모든 언어의 완전 코드화와 코드체계 단일화, 코드의 등가성, 코드간 호환성을 설계 원리로 하였다. 즉 전 세계의 모든 스크립트를 지원하도록 설계된 표준으로, 플랫폼이나 프로그램 또는 언어에 관계없이 모든 문자에 대하여 고유한 코드를 제공한다. 따라서 Unicode를 지원하는 프로그램은 어떤 언어를 사용하는 데이터라도 정상적으로 처리할 수 있다.
.참고자료
http://stone.backrush.com (內 완성형·조합형 관련 FAQ)
http://sqls.csc.ac.kr/cyber-book/cyber-edu (창신大, 실업高 연계 자료)
http://www.gony.pe.kr (內 한글 코드 관련 문서)
http://cein21.org/%40ict2/kaist/award/1/middle/html/johab.html (조합형 코드 테이블)
http://www.unicode.org (Unicode 지원 사이트)
外 관련 사이트, hwp/pdf/ppt문서, 개인blog, MS紙 기사 등 다수.
코드 할당 비율을 보면, 한자가 39.89%(20,902字), 한글 17.04%(11,172자), 아스키 및 기호문자 10.39%(6,811字)의 순이다.
(이상 Unicode 3.x 기준)
다. 한글의 할당
1) Korean Syllable - 음절(音節)단위의 완성형.
영역: 0xAC00∼0xD7AF (실배정 11,172字)
AC00
AC01
AC02
…
AD50
…
C131
…
D559
…
가
각
간
교
성
학
2) Hangul Jamo - 조합형 자모 (옛 자모 포함).
영역: 0x1100∼0x11FF (실배정 240字)
1100
1101
1102
…
116C
…
11D2
…
11E2
…
ㄱ
ㄲ
ㄴ
ㅚ
ㅱ
3) Compatibility Jamo - 한국 표준(KSC5601 조합형) 한글 자모.
영역: 0x3130∼0x318F (실배정 94字)
3131
…
3135
…
3178
…
327F
…
ㄱ
힝
가
■ㅡ가
4) Circled Korean Hangul Elements - 원문자, 괄호문자, 상용기호 등.
영역: 0x3200-0x32FF
3200
…
321C
…
326E
…
327F
…
㈀
㈜
㉿
(이상 Unicode 4.x 기준)
라. 특징
16bit(2byte)코드를 기본으로, 모든 언어의 완전 코드화와 코드체계 단일화, 코드의 등가성, 코드간 호환성을 설계 원리로 하였다. 즉 전 세계의 모든 스크립트를 지원하도록 설계된 표준으로, 플랫폼이나 프로그램 또는 언어에 관계없이 모든 문자에 대하여 고유한 코드를 제공한다. 따라서 Unicode를 지원하는 프로그램은 어떤 언어를 사용하는 데이터라도 정상적으로 처리할 수 있다.
.참고자료
http://stone.backrush.com (內 완성형·조합형 관련 FAQ)
http://sqls.csc.ac.kr/cyber-book/cyber-edu (창신大, 실업高 연계 자료)
http://www.gony.pe.kr (內 한글 코드 관련 문서)
http://cein21.org/%40ict2/kaist/award/1/middle/html/johab.html (조합형 코드 테이블)
http://www.unicode.org (Unicode 지원 사이트)
外 관련 사이트, hwp/pdf/ppt문서, 개인blog, MS紙 기사 등 다수.
추천자료
[컴퓨터의 이해/1학년 공통]마이크로프로세서의 발전과정과 컴퓨터산업에 기여한점과 최신동...
[컴퓨터의이해공통] 마이크로프로세서의 발전과정과 컴퓨터산업에 기여한 점 및 마이크로프로...
[컴퓨터의 이해 교양] 1.마이크로프로세서의 발전 과정과 컴퓨터 산업에 기여한 점, 최신동향...
[컴퓨터의이해] 1.스마트폰의 최신동향을 A4 용지 2페이지 내외로 서술하라_스마트폰최신동향...
[컴퓨터이해 1학년 공통] 1. 스마트 폰의 최신동향 2. QR코드에 대하여
방통대 1학년 1학기 중간과제물 스마트폰 최신동향, QR코드(Quick Response Code)의 유용성 ...
[컴퓨터의이해] 마이크로프로세서의 발전과정과 컴퓨터산업에 기여한 점 그리고 최신동향/매...
[컴퓨터의이해] 스마트 폰의 최신동향, QR코드란 - QR코드의 유용성과 역기능 QR코드첨부
[영어영문학과 공통] 1. 본인이 사용 중이거나 또는 최신 스마트폰을 1개 선정하고 아래의 사...
[컴퓨터의이해] 컴퓨터의 입력장치 출력장치 중앙처리장치 기억장치 설명 2종류 이상의 2차원...
1 마이크로프로세서의 발전 과정과 컴퓨터 산업에 기여한 점 그리고 최신동향을 A4 용지 2페...
소개글