달력

42025  이전 다음

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
한글 처리관련 내용을 업데이트 하며... 
      오랫동안 한글 처리에 관련해서 관심이 많았는데, 우연한 기회에 한글처리 관련해서 정리할 기회가 되서.. 
      열심히 구글링 및 테스트한 결과를 정리하게 되어 기쁘게 생각한다.. 많은사람들에께.. 부디 도움 되길... ^^; 

q문자셋 ( Character Set)
¤하나의 언어권에서 사용하는 언어를 표현하기 위한 모든 문자(활자)의 모임을 문자셋이라고 한다. 영어라면 'A', 'B', 'C'에서 'Z'까지(소문자 a에서 z), 한글이라면 ''에서 ''까지다. 물론 숫자나 특수 문자뿐만 아니라 인쇄와 통신을 제어하기 위한 제어 문자도 문자셋에 포함되어야 한다. 중국어,일본어, 힌두어, 아랍어등 각각 문자셋은 고유 언어의 특징을 반영하는 문자들이 포함된다.
q인코딩 ( Encoding )
¤문자 집합을 코드 형태(일반적으로 행렬)로 표기한 것을 코드화된 문자 집합(CCS, coded character set)이라고 한다. 예를 들어 ''에는 10001, ''에는 10002와 같이 코드를 할당하는 방식 말이다. 그리고 문자 집합을 컴퓨터에 저장하기 위해서 옥텟(octet, 8비트 단위) 형태로 표현한 것을 인코딩 방식(CES, character encoding scheme)이라고 한다.
q문자셋과 인코딩은 동일하지 않지만, 실제적으로는 많 혼용해서 사용하고 있다.
¤한글 : KSC5601, EUC-KR, MS949
¤일본어 : Shift-JIS, EUC-JP
¤영문 서구권 : US-ASCII, ISO-8859-1
¤유니코드 : ISO-10646

'그외 주제들 > 한글처리' 카테고리의 다른 글

Response 구간 정리  (0) 2013.09.30
Request 구간 정리  (0) 2013.09.30
JSP,Servlet에서 한글 문제를 피하려면..  (0) 2013.09.30
Unicode ( 유니코드 )  (0) 2013.09.30
문자셋과 인코딩  (0) 2013.09.30
Posted by 행복한삶~!!
|