'분류 전체보기' 카테고리의 글 목록 (7 Page)

강아지와 병아리

그외 주제들/알고리즘 연습 2013. 10. 14. 16:22

문제 출처

http://www.jungol.co.kr/prog/Hanal/hanalView.php?qs_code=1001&sk=&sv=&menu=&sst=qs_code&sod=asc&page=10&fv=1

강아지와 병아리
Time Limit : 1000MS

강아지와 병아리의 합과 다리의 수를 입력받아 강아지와 병아리가 각각 몇 마리씩인지 구하는 프로그램을 작성하시오.

입력형식
강아지와 병아리의 합 1000 이하, 다리의 합 4000 이하의 정수를 공백으로 구분하여 입력받는다.
하나의 결과가 나온 후에도 계속 새로운 입력을 받다가, 0 이 입력되면 프로그램을 종료한다.

출력형식
강아지와 병아리가 각각 몇 마리씩인지 공백으로 구분하여 출력한다.
주어진 데이터로 마리수를 정할 수 없을 때는 "0" 을 출력한다.
데이터의 크기가 주어진 범위를 벗어날 경우는 "INPUT ERROR!"를 출력한다.

입력 예
25 80
15 10
1500 2000
0 0

출력 예
15 10
0
INPUT ERROR!

풀이..

package com.syjung;

import java.util.Scanner;

public class problem1 {
	
	boolean calc_value(String input )
	{
		int ani_sum, count_regs, max_count; 
		int x,y;
		boolean find_answer=false;
	
       // 문자열을 공백을 기준으로 숫자로 분리하기  
		String [] values = input.split(" ", 2);

		// Parameter counter 체크
		if( values.length != 2 )
		{
			System.out.println("Error!! Parameter counters are not 2.");
			return false;
		}
		
		// 문자열을 숫자로 변환, 동물숫자 합과 다리갯수
		ani_sum = max_count = Integer.parseInt(values[0]);
		count_regs = Integer.parseInt(values[1]);
		
		if( ani_sum > 1000 ) 
		{
			System.out.println("Error!! 동물의 합은 1000을 초과 할수 없습니다.");
			return true;
		}
		
		if( count_regs > 4000 ) 
		{
			System.out.println("Error!! 동물의 합은 4000을 초과 할수 없습니다.");
			return true;
		}
		
		if( ani_sum == 0 && count_regs== 0 ) 
		{
			System.out.println("종료!! 감사합니다~");
			return false;
		}
		
		// 동물숫자 합과, 다리갯수의 합과 일치하는 x,y를 찾는다. 
		for( x =0; x < max_count; x++ )
		{
			for(y=0; y < max_count; y++ )
			{
				if( x + y == ani_sum )
				{
					if( 4*x + 2 * y == count_regs )
					{
						System.out.println( String.format( "정답, 강아지 :%d, 병아리:%d ", x, y ) );
						find_answer = true;
						break; 
					}
				}
			}
		}
		
		if ( find_answer == false ) 
		{
			System.out.println( "정답이 없습니다.");
		}
				
		
		return true; 
	}

	/**
	 * @param args
	 */
	// Create a single shared Scanner for keyboard input
    private static Scanner scanner = new Scanner( System.in );

    // Program execution starts here
    public static void main ( String [] args )
    {    	
    	problem1 prb1 = new problem1();
    	String input;
    	
    	do
    	{
        // Prompt the user
        System.out.print( "Type some data for the program: " );

        // Read a line of text from the user.
        input = scanner.nextLine();

        // Display the input back to the user.
        System.out.println( "input = " + input );
    	
    	} while( prb1.calc_value(input) );

    	System.out.println( "프로그램이 정상 종료되었습니다." );
    } // end main method
}

Posted by 행복한삶~!!

|

contacts.create() json 형태로 생성하기.. (0)	2014.01.02
PhoneGap과 Cordova의 차이점은? (0)	2013.12.30

JSP 기초 1 - Session/Cookie/URL 재작성/ 페이지 forward,include

BackEnd/JSP&Servlet 2013. 10. 11. 16:25

현재 페이지의 상태와 데이터를 그대로 유지시켜 주며 다른 페이지로 이동하기
request.getReeustDispatcher("이동할페이지").forward( request, response );
pageContext.forward( "이동할페이지") ;

<jsp:forward page="target page">
상태 유지 없이 다른 페이지로 이동하기
response.sendRedirect( "이동할페이지" );
response.encodeRedirectURL( "이동할페이지" );

우선브라우저에게 http response를 하고, 브라우저가 다시 이동할페이지를 호출하는 형식임.
이동할 페이지로 파라미터 정보를 넘기려면... target.jsp?name=value&name2=value2 형태로 값을 넘길수 있다.
파라미터에 한글이 포함된다면 URLEncoder.encode() 를 사용해야 한다.

String param = URLEncoder.encode ( "이름=값", "EUC-KR");
param을 target 주소뒤에 붙이면 됨..

encodeRedirectURL() 함수는 cookie사용이 제한된경우 URL 재작성을 해야 하는 경우에 사용하는 함수이다.
주어진페이지 주소에 JSESSIONID=B2KKKEK2U2U2I8JODE8KEKD 형태의 SESSION ID를 붙여서 Target URL을 재작성한다.
동적페이지 Include
pageContext.include("삽입할페이지"); // 페이지의 결과가 삽입되는 것임...
<jsp:include page="">

그에 비해서 <%include file="삽입대상페이지" %>는 include될 대상의 코드를 복사하여 그대로 include되는 정적인 include 이다.
Cookie 에 대해서..

Cookie는 HTTP Header에 저장되어 브라우저와 web server간에 전송된다.
브라우저에서는 javascript로 cookie 정보를 조회,변경,삭제 가능하다.
JSP/Servlet에서는 Cookie 객체를 통해서 조회,변경,삭제 가능하다.

조회 : Cookie cookies[] = request.getCookie();
변경 및 추가 : response.addCookie( new Cookie("NAME", "VALUE"); // NAME이 기존에 있다면 수정, 없다면 추가된다.
삭제 : 삭제기능은 좀 특이하다. 별도의 삭제함수가 있는것이 아니라, Cookie.setMaxAge()를 통해서 수명을 조절하는 방식으로 삭제한다.

cookie.setMaxAge(3600); // 한시간으로 남은 수명 지정..
cookie.setMaxAge(0); // 쿠키를 바로 삭제 하도록 만든다.
cookie.setMaxAge(-1); // 웹 브라우저가 끝날때 끝날때 삭제되도록 만든다. default 임.

setPath()를 통해서 특정경로에만 Cookie가 전송되도록 조절할 수 있다.
setDomain()를 통해서 여러 웹서버로 전송되도록 할수 있다.
웹 서버가 여러개인 경우, setDomain() 을 통해서 여러 웹서버로 전송되도록 할 수 있다. 이렇게 하지 않으면.. A Page를 읽을때 A web server, B 페이지를 읽을때 B Web Server가 호출되었다면 서로 host name정보가 다르기 때문에 Cookie 정보는 공유되지 않는다. 그래서 cookie 정보를 공유하려면 꼭 setDomain()을 사용해야 한다.

Session에 대해서

Servlet 과 JSP에서 사용법이 약간 다르다.
Servlet 에서는 HTTPSession session = request.getSession(); 으로 session 정보를 얻어서 사용해야 한다.
JSP 에서는 그냥 예약된 session 인스턴스를 사용하면 된다.
주요 메소드
session.setAttribute( "ID", value ); value 는 object 형태
Object obj = session.getAttribute("ID"); // 필요시 적절하게 cast해서 target object로 할당한다.
session.removeAttribute("ID);
session.invalidate(); // 세션을 끝내는 메소드

URL 재작성

Session 기술에서도 사실 cookie가 사용된다. seesion을 구별하기 위해서 Session id를 cookie 형태로 만들기 때문이다. JSESSIONID=JDKDKK3ID93KD9E9GKD9D 와 같은 형태임..
그래서 cookie를 사용하지 않도록 브라우저 설정이 되어있다면 session이 잘동작하지 않기 때문에 그럴경우..
URL 재작성이라는 기법을 사용해야 한다.
URL 재작성이란 URL로 SESSION ID를 주고 받으며 session을 구분하도록 하여 session 객체를 사용하는 방법이다.
브라우저와 web server가 주고받는 모든 주소 정보뒤에는 항상 JSESSIONID=DKKDK3K93939DD9D 를 붙이도록 한다.
SESSION ID를 URL에 붙이는 자작업이 상당히 귀찮은 작업이 될수도 있는데.. response.encodeURL()를 통해서 쉽게 할수 있는 방법을 제공한다. 예를 들어 .....
<A href=<%= response.encodeURL( "xxxxx.jsp ") %>
와 같이 하면 자동으로 xxxxx.jsp 뒤에 session id정보가 붙는다.

또 다른 함수가 하나 더 있는데.. . response.encodeRedirectURL() 이다...
다른페이지로 redirect 할때 사용하는 함수이다.
참고로 redirect는 다음과 같이 동작한다.
[ (웹서버)브라우저로 응답 -> (브라우저)주어진 주소로 http request -> (웹서버)주어진 주소에 대한 응답 ]

'BackEnd > JSP&Servlet' 카테고리의 다른 글

표준 액션 및 JSTL (Java Standard Template Library) (0)	2014.03.17
서블릿 라이프사이클 (0)	2014.03.12
Expression Language (0)	2014.03.11

Posted by 행복한삶~!!

|

다양한 환경에서의 언어 설정

그외 주제들/한글처리 2013. 9. 30. 14:59

q시스템 기본 인코딩

¤Windows 시스템의 경우.

¤제어판의 국가 및 언어 옵션에서 선택할 수 있음 ( 영어:CP1252, 한국어:MS949 )

¤Unix 시스템의 경우
LANG 환경 변수에서 플랫폼이 지원하는 locale 을 지정 합니다.
현재 설정된 locale 값은 “locale”을 통해서 확인가능.
사용 가능한 locale은 “locale –a”를 통해 확인가능.
¤참고자료
¡http://develop.sunshiny.co.kr/398
¡http://blog.naver.com/PostView.nhn?blogId=paro01&logNo=100050474751&widgetTypeCall=true

qJVM 설정

¤file.encoding

java의 기본 encoding type을 지정해준다. String.getBytes( ) 함수호출시 파라미터가 없을때 file.encoding으로 동작한다. file.encoding 을 특별히 지정하지 않았을 경우, shell 환경변수인 LANG 및 LC_ALL값에의해 결정됩니다.

¤client.encoding.override

Request객체에 저장되는 Form 데이타의 인코딩 type이 결정된다. Form데이타는 request.getParameter를 통해서 얻어오는데, client.encoding.override에 따라서 인코딩된 값이 리턴된다. Request 과정분석에서 상세내용을 정리하였다.

q web.xml

¤JSP 파일 Encoding Type 한꺼번에 지정 및 locale과 Encoding Type을 지정

각 개별 JSP 파일 및 Response 객체의 설정값이 web.xml 값보다 우선한다.

	
		
			*.jsp
			EUC-KR
		
	

	
		
			ja
			Shift_JIS

q 브라우저

¤1. "도구 -> 인터넷 옵션 -> 언어" 메뉴를 선택한다.

¤2. 영어[en]와 한국어[ko]를 추가하고 원하는 언어를 가장 상단에 위치한다.

qHTML 설정

¤<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

qXML 설정

¤<?xml version="1.0" encoding="UTF-8" ?>

qJSP 설정

¤<%@ page pageEncoding="UTF-8" %>

¤<%@ page contentType="text/html;charset=UTF-8" %>

¤charset=euc-kr 일때 확장 한글이 제대로 표현되지 않는다.

¤charset=ms949 일때는 확장 한글이 정상적으로 표현된다.

qServlet 설정

¤HTTP 요청의 인코딩 지정

¤request.setCharacterEncoding("UTF-8");

¤HTTP 응답의 인코딩 지정

¤response.setContentType("text/html; charset=UTF-8");

¤response.setCharacterEncoding("utf-8");

qOcacle 설정

¤설정된 Encoding 모드 조회방법

¤select * from nls_database_parameters where parameter like '%CHARACTERSET%';

¤Oracle Database 문자 셋 변경 방법

¤ 환경 변수 또는 %ORACLE_HOME%/dbs/init[SID].ora 을 설정
NLS_LANG='American_America.Ko16ksc5601‘
ORA_NLS33='$ORACLE_HOME/ocommon/nls/admin/data‘
NLS_DATE_FORMAT='YYYY-MM-DD‘

DriverManager에서 문자셋 설정 방법
  java.util.Properties props = new java.util.Properties();
  props.put("charSet", "KSC5601" );
  DriverManager.getConnection(dbUrl, props);

¤지원하는 Encoding mode

¤ http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html

'그외 주제들 > 한글처리' 카테고리의 다른 글

참고 자료.. (0)	2013.09.30
자바에서 String 처리 (0)	2013.09.30
Response 구간 정리 (0)	2013.09.30
Request 구간 정리 (0)	2013.09.30
JSP,Servlet에서 한글 문제를 피하려면.. (0)	2013.09.30

Posted by 행복한삶~!!

|

자바에서 String 처리

그외 주제들/한글처리 2013. 9. 30. 14:57

getBytes 이해하기

JAVA에서는 전세계 모든 언어를 지원하기 위해서 문자열을 Unicode로 저장한다.

하지만 아직 다양한 환경에서 UNICODE가 아니 전통적인 인코딩 방식이 사용되고 있는데,
String.getBytes() 함수를 통해서 간편하게 다른 Encoding Type으로 변환을 지원한다.

예를 들어 TCP/IP 통신 및 File I/O 등을 통해서 ISO-8859-1으로 인코딩된 문자열을 수신했을 때 적절하게 변환하여야 정상적으로 한글 출력이 된다.

사용방법 참조 http://docs.oracle.com/javase/7/docs/api/java/lang/String.html#getBytes()

1 String chkStr2 = “한 똠 펲 1”;

2 byte [] bytes = chkStr2.getBytes( “ksc5601” );

3

4 for ( byte b : bytes )

5 {

6 out.print(String.format("0x%02X ", b));

7 }

세부 진행 순서는 다음과 같다..
1번 라인에서 “한 똠 펲 1”은 UTF-16BE 형식으로 아래와 같이 저장된다.
0xD55C 0x0020 0xB620 0x0020 0xD3B2 0x0031

2번 라인에서는 UTF-16BE를 KSC5601 코드값으로 변환한다.
‘한’ 0xD55C è 0xC7D1

‘ ‘ (공백) 0x0020 è 0x20

‘똠’ 0xB620 è 0x3F (‘?’), KSC5601에 포함되지 않는 확장 한글이라 ? 로 대체된다. 펲도 동일함

‘1’ 0x0031 è 0x31

따라서 출력결과는 다음과 같다. 0xC7 0xD1 0x20 0x3F 0x20 0x3F 0x20 0x31

2번라인 getBytes()에서 파라미터를 변경해서 다양한 인코딩 결과를 출력해보면 아래와 같다.

Default : 0xC7 0xD1 0x20 0x8C 0x63 0x20 0xBC 0x84 0x20 0x31   è file.encoding = ms949일때 예임. 파라미터 없이 getBytes() 호출하면 file.encoding값에 따라서 동작함
ISO-8859-1 : 0x3F 0x20 0x3F 0x20 0x3F 0x20 0x31   è 한글 코드인 0xD55C 0xB620 0xD3B2 모두 ? 변환된다. 모르는 코드들이니깐..
EUC-KR : 0xC7 0xD1 0x20 0x3F 0x20 0x3F 0x20 0x31    è KSC5601와 결과가 동일하다.
UTF-8 : 0xED 0x95 0x9C 0x20 0xEB 0x98 0xA0 0x20 0xED 0x8E 0xB2 0x20 0x31 è UTF-16에서 UTF-8로 변환된값..
ms949 : 0xC7 0xD1 0x20 0x8C 0x63 0x20 0xBC 0x84 0x20 0x31 è 똠,펲도 정상적으로 변환된다.

한글<->8859변환

아래 코드는 유명한 한글과 8859_1간의 상호 변환 코드이다.

1 strTemp = “한 똠 펲 1”;

2 // Unicode 한글을 (ms949를 거쳐서) 8859-1로 변환..

3 strTemp = new String(strTemp.getBytes(“ms949"),"8859_1");

4 // 8859-1 String을 (ms949를 거쳐서) unicode로변환

5 strTemp = new String(strTemp.getBytes("8859_1")," ms949 ");

예를 들어 외부 시스템과 I/O시에 해당 시스템이 ISO_8859_1 방식만을 지원한다면 한글 문자열은 변환과정을 거쳐서 저장하고 읽어와야 한다.

그 이유는 JAVA String이 UTF-16을 지원하고, 외부 시스템은 ISO-8859-1만을 지원하므로 적절한 변환이 필요하다.

인터넷에 검색을 해보면 예제들은 99% “ms949” 대신 “ksc5601”를 사용하고 있다. 대부분 그 차이를 모르기 때문인 것 같다.

앞 페이지의 예제를 보듯이 KSC5601는 확장한글( ‘똠’,’펲’등 8800여자)를 지원하지 못하기 때문에 ms949를 사용해야 한글 손실이 없다.

•8859_1로 변환 ( 3번라인 )
strTemp = new String(strTemp.getBytes(“ms949"),"8859_1");

UTF-16 è ms949 è 8859-1 로 변환해야 한다.

ms949로 중간변환 없이 바로 strTemp.getBytes(8859_1”)로 한글을 바로 읽어오면.. 앞장에서와 같이 한글은 모두 ? 로 변경되어 버린다.

strTemp.getBytes(“ms949")를 수행하면.. 0xC7 0xD1 0x20 0x8C 0x63 0x20 0xBC 0x84 0x20 0x31 형태로 byte 배열형태로 읽어오고..

이를 8859_1로 변환해도..완전 동일한 0xC7 0xD1 0x20 0x8C 0x63 0x20 0xBC 0x84 0x20 0x31 값이 된다. ( 8859_1은 0~0xFF까지 범위임)

최종적으로 strTemp에는 0x00C7 0x00D1 0x0020 0x008C 0x0063 0x0020 0x00BC 0x0084 0x0020 0x0031 형태 값이 된다.

•ms949로 재변환 (5번 라인)
strTemp = new String(strTemp.getBytes("8859_1")," ms949 ");

8859-1 è ms949 è UTF-16 순서로 변환해야 한다.

외부 I/O를 통해서 받아온 데이터가 ISO-8859-1로 Encoding되어 String 변수에 0x00C7 0x00D1 0x0020 0x008C 0x0063 0x0020 0x00BC 0x0084 0x0020 0x0031 와 같은 형태로 저장되어 있을때..

이를 getBytes(“8859-1 “) 를 하면.. 0xC7 0xD1 0x20 0x8C 0x63 0x20 0xBC 0x84 0x20 0x31 값을 그대로 얻어오고..

“ms949” 파라미터에 의해.. 0xC7D1 0x20 0x8C63 0x20 0xBC84 0x20 0x31 같은 형태로 ms949 code값으로 묶어지고..
다시 해당 글씨들의 UNICODE값 치환된 UTF-16 형태인 0xD55C 0x0020 0xB620 0x0020 0xD3B2 0x0031 로 변환되어 strTemp로 최종적으로 저장된다.

인터넷에서 자료를 찾다보면 대부분 ms949 대신 euc-kr을 사용하고 있다. 하지만 java에서 ms949를 공식적으로 지원하고 있으므로 ms949를 사용하는게 바람직하다. 드믄경우지만 이름에 확장한글인 '믜'자을 사용하는 사람도 있으니..당연히 현대한글 11,172자를 표현가능한 ms949를 사용하는게 맞다.

'그외 주제들 > 한글처리' 카테고리의 다른 글

참고 자료.. (0)	2013.09.30
다양한 환경에서의 언어 설정 (0)	2013.09.30
Response 구간 정리 (0)	2013.09.30
Request 구간 정리 (0)	2013.09.30
JSP,Servlet에서 한글 문제를 피하려면.. (0)	2013.09.30

Posted by 행복한삶~!!

|

Response 구간 정리

그외 주제들/한글처리 2013. 9. 30. 14:44

Response객체는 브라우저에 전달되는 HTML 결과 생성할 때 사용된다. Response객체의 Encoding CharterSet에 따라서 브라우저에서 출력되는 한글이 깨져보일수 있으므로 주위를 해야 한다. 하지만 걱정할 필요는 없다.
아래 제시되는 3가지 방법중 한 가지만 제대로 해도 한글 출력에 문제가 없다.

qResponse Charset에 따라서 출력되는 HTML Body의 charset에 영향을 미치게 된다.

qCharter set을 명시적으로 지정하라.

¤대략 3가지 방법으로 설정 가능하며 같은 효과가 있다.

1.Page 설정 통해서 설정

¡<%@ page pageEncoding="UTF-8" contentType="text/html;charset=UTF-8" %>

¡pageEncoding 생략시 charset에 따라서 Page Encoding 됨

2.함수 호출 1
Response.setCharacterEncoding(“UTF-8”);
Response.setContentType("text/html");

3.함수 호출 2
Response.setContentType("text/html;charset=UTF-8");

¤방법 1,2,3 중복해서 호출될 경우, 마지막 호출된 값이 유효하다.

¤하지만 PrintWriter pw = response.getWriter(); 함수 호출 이후에는 setCharacterEncoding(), setContentType() 함수가 호출되어도 무시된다.

q명시적으로 Charset을 설정하지 않았다면 아래 단계로 디폴트 값 설정 됨

1.HTTP Request의 Content-Language 참조

2.<locale-encoding-mapping-list> 정보를 web.xml에서 찾는다.

3.ISO-8859-1 을 사용한다.

qSRV.5.4 Response data Encoding ( servlet-2_5-mrel2-spec.pdf 에서 발췌 )

Servlets should set the locale and the character encoding of a response. The locale is set using the ServletResponse.setLocale method. The method can be called repeatedly; but calls made after the response is committed have no effect. If the servlet does not set the locale before the page is committed, the container’s default locale is used to determine the response’s locale, but no specification is made for the communication with a client, such as Content-Language header in the case of HTTP.

<locale-encoding-mapping-list>

<locale-encoding-mapping>

<encoding>Shift_JIS</encoding>

</locale-encoding-mapping>

</locale-encoding-mapping-list>

If the element does not exist or does not provide a mapping, setLocale uses a container dependent mapping. The setCharacterEncoding, setContentType, and setLocale methods can be called repeatedly to change the character encoding.

Calls made after the servlet response’s getWriter method has been called or after the response is committed have no effect on the character encoding. Calls to setContentType set the character encoding only if the given content type string

provides a value for the charset attribute. Calls to setLocale set the character encoding only if neither setCharacterEncoding nor setContentType has set the character encoding before.

If the servlet does not specify a character encoding before the getWriter method of the ServletResponse interface is called or the response is committed, the default ISO-8859-1 is used.

Containers must communicate the locale and the character encoding used for the servlet response’s writer to the client if the protocol in use provides a way for doing so. In the case of HTTP, the locale is communicated via the Content-Language header, the character encoding as part of the Content-Type header for text media types. Note that the character encoding cannot be communicated via

HTTP headers if the servlet does not specify a content type; however, it is still

used to encode text written via the servlet response’s writer.

'그외 주제들 > 한글처리' 카테고리의 다른 글

다양한 환경에서의 언어 설정 (0)	2013.09.30
자바에서 String 처리 (0)	2013.09.30
Request 구간 정리 (0)	2013.09.30
JSP,Servlet에서 한글 문제를 피하려면.. (0)	2013.09.30
Unicode ( 유니코드 ) (0)	2013.09.30

Posted by 행복한삶~!!

|

Request 구간 정리

그외 주제들/한글처리 2013. 9. 30. 14:34

브라우저에서 Form Post/Get할때 è WAS è JSP/Servlet Source 코드- Request.getParameter(“ID”) 까지 과정에서 영향을 미치는 환경설정값과 동작을 설명하고자 한다.

q브라우저에서 Static Page 호출

¤<a Href=“targetpage.jsp”..> link </a> 형태로 jsp / Servlet / html 호출시에는 http get 으로 link를 호출하게 된다. 이 경우 브라우저에서 WAS로 전달되는 데이터가 없으므로 Request 과정에는 별다르게 고려할 사항이 없다.

q브라우저에서 Form Post/Get할때 è WAS è Source 코드- Request.getParameter(“ID”) 까지 과정

1.브라우저에서 Form 데이터 Encoding (Form Data) 하는 단계

1.기본적으로 뒤에 따로 정리된 “Form 인코딩 방법”에 따라서 Form Encoding을 수행하지만, 브라우저 특성에 따라서 약간씩 다르게 Encoding 한다.

2.WAS에서 Form 데이터를 Request 객체에 반영하는 단계

1.WAS에서는 client.encoding.override에 따라서 인코딩하여 값을 Request에 반영한다.

2.client.encoding.override 값이 없다면 ISO-8859-1로 인코딩 하어 Request 객체에 Form 데이터를 반영한다.

3.소스코드에서 Request Encoding Type 재 변경하는 단계

1.doGet(),doPost() or JSP에서 Request 객체의 Encoding type을 강제로 변경하고 싶다면 Request.setCharacterEncoding( “EncodingType“)을 호출하면 된다. client.encoding.override 가 적절하게 설정되어 있다면 굳이 호출할 필요가 없다.

1. 브라우저에서 Form 데이터 Encoding

¤Chrome 및 IE Form Encoding 비교

¤IE8 Encoding Data ( CustomerID=한글똠펲123 )

¡http://localhost:9080/HelloJSP/FirstServlet?CustomerID=%C7%D1%B1%DB%26%2346624%3B%26%2354194%3B123

¡확장한글 변환 방식

¡확장한글은 Numeric character reference 방식의 유니코드로 변환된다.
http://en.wikipedia.org/wiki/Numeric_character_reference

¡똠=0xB620=46624 è %26%2346624%3B = 똠

¡유니코드 표기 형태로 변환되기 때문에 서버에서 어떻게 Encoding과정을 거치더라도IE에서는 확장한글이 정상적으로 표기된다.

¤Chrome Encoding Data ( CustomerID=한글똠펲123 )

¡http://localhost:9080/HelloJSP/getform.jsp?CustomerID=%C7%D1%B1%DB%8Cc%BC%84123

¡한글은 MS949코드값으로 Encoding된다.

¤EUC-KR에 포함되지 않는 확장 한글이 서로 다르게 Encoding 처리한다.

¡Chrome은 W3의 가이드대로 Encoding 하지만, IE는 고유의 방식으로 인코딩한다.

¤Form Encoding 데이터가 다르기 때문에 JSP/Servlet에서 어떻게 처리해주는지에 따라서 브라우저마다 확장한글의 출력 결과가 다르게 나타날 수 있다.

                 (2013-10-22 추가) Form이 있는 JSP 파일의 Page encoding-type에 따라서 Form data encoding이 달라진다.. -_-;
           위의 예는 <%@ page contentType="text/html; charset=euc-kr"%>형태로 euc-kr로 저장된 경우이고,
           charset=ISO-8859-1이거나 따로 지정하지 않아서 default로 ISO-8859-1된는 경우의 파라미터 인코딩은 아래와 같다.
           동일하게 CustomerID=한글똠펲123을 form encoding한 결과는
         CustomerID=%26%2354620%3B%26%2344544%3B%26%2346624%3B%26%2354194%3B123+
         와 같다 모든 한글이 Numeric character reference 로 표현된다. IE 및 Chrome모두 동일한 결과이다.
           참 이해가 안가는 동작이다.. -_-; form jsp파일 page encoding이 왜 영향을 미치는 것일까?
           WAS에서 생성된 html파일은 결국 같고 브라우저 단에서 form encoding이 발생되는데..
           왜 html을 생성하는 jsp 파일의 page encoding이 form encoding에까지 영향을 미치는지 신기하기만 하다.. -_-;
           html 파일 자체 및 header viewer로 header를 비교해봐도 차이점이 없는데..어떤값에 영향을 받는지..
           좀 더 탐구가 필요하다..

                 모든 한글은 numeric character reference로 표현되므로, action jsp 나 servlet에서 request.getParameter("ID")를
           하면 한글깨지는 현상없이 그냥 잘 얻어온다. 심지어 request.setCharacterEncoding("euc-kr") 를 호출할 필요도
           없고, 어떤 encoding type에서도 한글은 정상적으로 얻어올 수 있다.

2. WAS단에서는 Form 데이터를 Request 객체에 반영

¤client.encoding.override 값에 따라서 Encoding된 결과가 Request객체에 반영됨.

¤Form Test 문자열 “한글똠펲123”

client.encoding.overide 설정 값	Request.getParameter(“ID”) 결과
client.encoding.overide 설정 값	IE	비고	Chrome	비고
EUC-KR	한글똠펲123		한글??123	확장한글은 깨짐
ms949	한글똠펲123		한글똠펲123	모두 정상 출력됨
ISO-8859-1 or 미설정	??똠펲123	Encoding변환으로 정상출력 가능함.	????123	Encoding변환으로 정상출력 가능함.
UTF-8	한글똠펲123	JSP파일은 1. <%@ page pageEncoding="UTF-8" contentType="text/html;charset=UTF-8" %> 로 지정 2. ISO-8859-1로 지정 3. pageEncoding 및 Charset을 지정하지 않아 Default로 ISO-8859-1로 지정 되도록.	한글똠펲123	1.의 경우 form jsp 및 action jsp파일모두 utf-8로 일치해야 함 2,3의 경우 form jsp에서 form data encoding시에 Numeric character reference으로 한글이 encoding된다.

¤client.encoding.overide 값이 없으면 ISO-8859-1 값이 Default 이다.

¤"ISO-8859-1 or 미설정"의 경우 아래와 같은 인코딩 변환으로 정상 출력이 가능하다.

¤Request.setCharacterEncoding(“ms949”) 호출 또는 String Encoding 변환.
String parameter = new String( Resquest.getParameter(“ID”).getBytes(ISO-8859-1), “ms949”);

3. 소스코드에서 Request Encoding Type 재 변경

¤client.encoding.override 값이 잘 설정되어 있다면 JSP 및 Servlet에서 굳이 Request.setCharacterEncoding을 호출할 필요가 없다.

¤예를 들어 client.encoding.override=ms949 이고 Request.setCharacterEncoding(“euc-kr”)을 호출한다면. 똠펲등의 확장한글은 모두 ?으로 변환된다. 그래서 Request.setCharacterEncoding를 호출할 때는 동작을 명확히 이해하고 호출해야 한다.

¤client.encoding.override 값이 미설정 상태라면 default로 ISO-8859-1이 된다.
정상적으로 한글을 출력하기 위해서는 Request.setCharacterEncoding(“ms949”)을 getParameter하기전에 호출해야 한다. 또는 String parameter = new String( Resquest.getParameter(“ID”).getBytes(ISO-8859-1), “ms949”); 코드로 변환하여도 정상적으로 한글 출력을 할수 있다. 하지만 개별 문자열을 변환하기 보다는 Request.setCharacterEncoding(“ms949”)를 호출하는것이 더 적절한 문자열 처리 방식이다.

¤당연히 client.encoding.override=ms949로 설정 했을때도 동일하다.

qForm 인코딩 방법, application/x-www-form-urlencoded

¤This is the default content type. Forms submitted with this content type must be encoded as follows:

¤Control names and values are escaped. Space characters are replaced by `+', and then reserved characters are escaped as described in [RFC1738], section 2.2: Non-alphanumeric characters are replaced by `%HH', a percent sign and two hexadecimal digits representing the ASCII code of the character. Line breaks are represented as "CR LF" pairs (i.e., `%0D%0A').

¤The control names/values are listed in the order they appear in the document. The name is separated from the value by `=' and name/value pairs are separated from each other by `&'.

¤http://www.w3.org/TR/html4/interact/forms.html#h-17.13.4.1

q Request data encoding ( servlet-2_5-mrel2-spec.pdf 에서 발췌)

Currently, many browsers do not send a char encoding qualifier with the Content-

Type header, leaving open the determination of the character encoding for reading

HTTP requests. The default encoding of a request the container uses to create the

request reader and parse POST data must be “ISO-8859-1” if none has been

specified by the client request. However, in order to indicate to the developer in this

case the failure of the client to send a character encoding, the container returns null

from the getCharacterEncoding method.

If the client hasn’t set character encoding and the request data is encoded with

a different encoding than the default as described above, breakage can occur. To

remedy this situation, a new method setCharacterEncoding(String enc) has

been added to the ServletRequest interface. Developers can override the

character encoding supplied by the container by calling this method. It must be

called prior to parsing any post data or reading any input from the request. Calling

this method once data has been read will not affect the encoding.

'그외 주제들 > 한글처리' 카테고리의 다른 글

자바에서 String 처리 (0)	2013.09.30
Response 구간 정리 (0)	2013.09.30
JSP,Servlet에서 한글 문제를 피하려면.. (0)	2013.09.30
Unicode ( 유니코드 ) (0)	2013.09.30
문자셋과 인코딩 (0)	2013.09.30

Posted by 행복한삶~!!

|

JSP,Servlet에서 한글 문제를 피하려면..

그외 주제들/한글처리 2013. 9. 30. 14:23

한글 처리에 영향을 주는 곳

10여군대 이상의 곳에서 Encoding 관련 정보들이 있고, 한글 처리에 영향을 미칠수 있다.
client 부터 WAS까지, WAS에서 DB 및 외부 I/O처리, 다시 WAS에서 Client까지 전 구간을 완벽하게 이해하는것은 어려운 일일수 있지만 몇가지만 정확하게 알고 있으면 한글 깨지는 문제는 피 할수 있다.
특별히 빨간색으로 표기된 부분의 환경설정이 중요하다.

한글 문제를 피하려면?

q몇 가지 환경설정만 잘하면된다.

¤전체 브라우징 과정을 살펴보면 많은 과정을 거치면서 10여군대 이상의 encoding관련 설정에 영향을 받는다. 모든 과정을 완벽히 이해하는것은 힘들지만 몇 가지 환경설정 및 핵심 구간의 동작을 이해하면 한글 문제를 피할 수 있다.

¤필수 환경 설정

¤WAS JVM 설정

¤HTML Meta Tag

¤JSP 페이지 설정

¤Servlet Response/Request 설정

¤DB 언어 설정

¤3가지 구간의 세부 동작을 이해하자!

¤브라우저부터 Request 객체까지

¡Static Page 호출 및 Form 데이터 수신 과정 이해

¤Java 언어에서의 Encoding 이해 및 외부 I/O시 Encoding 이해

¤Response 객체에서 Encoding 이해

q언어 처리는 크게 2가지 상황이 있다.

¤한글과 영어만 제대로 나오면 되는 경우 ( 다국어 처리를 고려하지 않음 )

¤한국어,중국어,일본어, 힌두어 등 다국어를 동시에 처리해야 하는 경우.

한글과 영어만 고려한 환경설정 ( 다국어 처리를 고려하지 않음 )

qWAS JVM 설정

¤file.encoding=ms949, client.encoding.override=ms949

qHTML Meta Tag설정

¤<meta http-equiv="Content-Type" content="text/html; charset=euc-kr">

qJSP 페이지 설정

¤<%@ page pageEncoding=“ms949" contentType="text/html;charset=ms949" %>
( pageEncoding 생략시 charset 값으로 pageEncoding 됨)

qServlet Response/Request 설정

¤HTTP 요청의 인코딩 지정 ( client.encoding.override가 정의되어 있다면 생략해도 됨 )

¤request.setCharacterEncoding(“ms949”);

¤HTTP 응답의 인코딩 지정

¤response.setContentType("text/html; charset=ms949"); or
response.setCharacterEncoding(“ms949");

q빨간색으로 표기된 ms949대신 euc-kr을 사용하면 euc-kr의 문제인 현대한글 중 2350자만 표현 가능한 문제가 발생한다. (똠,펲등의 한글이 깨짐) 그래서 euc-kr 대신 ms949를 사용하는것이 바람직하다.
ms949가 비록 ms에서 만든 환영받지못한 Charter Set이지만, 오라클 DB, JAVA, 많은 WAS에서 대부분 지원하고 있는 표준의 역할을 하고 있다. ( 물론 unicode를 사용하지 않는 경우에 한해겠지만.. )

¤오라클도 ms949를 지원하므로 ms949 로 설정해야 현대한글이 모두 표현된다.

¤Html의 경우 charset=euc-kr로 을 줘도 브라우저에서 현대한글이 정상적으로 출력된다.

다국어를 지원해야 하는 경우의 환경설정

q하나의 페이지에서 다국어를 입력,출력해야 한다면 모든 설정을 UTF-8로 통일시켜야 한다.

qWAS JVM 설정

¤file.encoding=UTF-8, client.encoding.override=UTF-8

qHTML 설정

¤<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

qJSP 페이지

¤<%@ page pageEncoding=“UTF-8" %> ( 생략가능, 생략시 charset 값으로 pageEncoding 됨)

¤<%@ page contentType="text/html;charset=UTF-8" %>

qServlet 설정

¤HTTP 요청의 인코딩 지정

¤request.setCharacterEncoding(“UTF-8”);

¤HTTP 응답의 인코딩 지정

¤response.setContentType("text/html; charset=UTF-8"); or
response.setCharacterEncoding(“UTF-8");

qDBMS

¤DBMS 설정값도 UTF-8로 설정해야 한다.

'그외 주제들 > 한글처리' 카테고리의 다른 글

Response 구간 정리 (0)	2013.09.30
Request 구간 정리 (0)	2013.09.30
Unicode ( 유니코드 ) (0)	2013.09.30
문자셋과 인코딩 (0)	2013.09.30
Character-Set & Encoding이란? (0)	2013.09.30

Posted by 행복한삶~!!

|

Unicode ( 유니코드 )

그외 주제들/한글처리 2013. 9. 30. 13:56

q유니코드는 전 세계의 모든 글자를 하나로 표현하려는 체계이다.

qISO 10646로 정의됨

¤유니코드 1.0.0은 1991년 8월 최초제정

¤유니코드 2.0.0에 한글 11,172자가 모두 포함됨

¤최신 버전은 2012년 9월 27일 제정된 6.2

q개별적으로 정의되던 문자셋을 통합한 궁극의 문자셋

¤한글뿐 아니라 일본어와 중국어에도 컴퓨터에서 해당 언어를 표현할 수 있는 독자적인 문자 집합이 있다(KPS-9566, EUC-CN, EUC-TW, EUC-JP, Shift JIS, Big5, GB, HZ 등). 문제는 '어떻게 동시에 한국어, 중국어, 일본어를 표현하느냐'이다. 하나의 문자 집합을 사용하는 문서에서는 이를 동시에 표현할 수 없다(escape sequence를 이용하여 여러 문자 집합을 표현할 수 있으나 이는 널리 쓰이지 않았다).
이런 문제는 유럽어의 문자 집합에도 있었다. 유로화를 나타내는 '€' 기호에는 ISO 8859-15(Latin 9)의 코드 값 중 0xA4이 할당되었으나 ISO 8859-1(Latin 1)의 0xA4 코드에 할당된 문자는 '¤'다. 이 문제를 해결하기 위해 전 세계적으로 사용되는 모든 문자 집합을 하나로 모아 탄생시킨 것이 유니코드이다.

q한글지원

¤현대 한글 11,172자 모두 지원함

¤옛 한글을 조합형 방식으로 모두 지원함

Unicode 인코딩 방식

qUnicode 인코딩 방식은 UCS-2, UCS-4, UTF-7, UTF-8, UTF-16, UTF-32등 다양하지만 가장 대표적으로 UTF-8 및 UTF-16이 많이 사용된다.

코드 범위	UTF-16BE 표현	UTF-8 표현
000000-00007F	00000000 0xxxxxxx	0xxxxxxx
000080-0007FF	00000xxx xxxxxxxx	110xxxxx 10xxxxxx
000800-00FFFF	xxxxxxxx xxxxxxxx	1110xxxx 10xxxxxx 10xxxxxx
010000-10FFFF	110110yy yyxxxxxx 110111xx xxxxxxxx	11110zzz 10zzxxxx 10xxxxxx 10xxxxxx

qUTF-8

¤ASCII 영역 ( ~127)은 1byte로 표현되고, 한글은 모두 3 byte로 표현된다.

¤예를 들어 ‘한’의 Unicode 값은 0xD55C, 11010101 01011100 이다

¤변환룰을 적용하면..
11101101 10010101 10011100 이 되고 이를 hex로 변환하면 0xED 95 9C 가 된다.

qUTF-16

¤BMP영역 ( ~ 0xFFFF)을 모두 2 Byte로 표현하고, 그 이상의 영역은 4 Byte로 표현된다.

¤한글 및 Ascii영역등은 Unicode 값 그대로 저장되어 2 Byte 씩으로 표현된다.

기타 용어

qBMP ( Basic multilingual plane, 기본 다국어 평면 )

¤유니코드의 첫째(0번) 평면으로, U+0000부터 U+FFFF까지의 영역을 차지한다. BMP에는 거의 모든 근대 문자와 특수 문자가 포함되어 있으며, 그 중 대부분은 한글과 한중일 통합 한자들로 이루어져 있다.

qBOM ( Byte Order Mark )

¤Encoding 된 Unicode값이 Big Endian 인지 Little Endian인지 구분하는 파일 서두에 표기되는 문자열.

¤윈도우의 메모장이나 울트라에디터에서 텍스트 편집 후 저장할 때 인코딩 Type에 따라 BOM이 붙는것을 확인 할 수 있다. 하지만 OS에 따라서는 BOM을 사용하지 않는 경우도 있다. 그래서 BOM때문에 오히려 호환성 문제가 발생하기도 한다.

Encoding	Representation
UTF-8	EF BB BF
UTF-16 빅 엔디안	FE FF
UTF-16 리틀 엔디안	FF FE
UTF-32 빅 엔디안	00 00 FE FF
UTF-32 리틀 엔디안	FF FE 00 00
SCSU	0E FE FF
UTF-EBCDIC	DD 73 66 73
BOCU-1	FB EE 28

'그외 주제들 > 한글처리' 카테고리의 다른 글

Response 구간 정리 (0)	2013.09.30
Request 구간 정리 (0)	2013.09.30
JSP,Servlet에서 한글 문제를 피하려면.. (0)	2013.09.30
문자셋과 인코딩 (0)	2013.09.30
Character-Set & Encoding이란? (0)	2013.09.30

Posted by 행복한삶~!!

|

Work&Life Balance!!

카테고리

태그목록

공지사항

최근에 올라온 글

최근에 달린 댓글

링크

글 보관함

달력

42025 이전 다음

'분류 전체보기'에 해당되는 글 73건

강아지와 병아리

강아지와 병아리
Time Limit : 1000MS

PhoneGap으로 HelloWorld 하기..

'FrontEnd > PhoneGap' 카테고리의 다른 글

JSP 기초 1 - Session/Cookie/URL 재작성/ 페이지 forward,include

'BackEnd > JSP&Servlet' 카테고리의 다른 글

참고 자료..

'그외 주제들 > 한글처리' 카테고리의 다른 글

다양한 환경에서의 언어 설정

'그외 주제들 > 한글처리' 카테고리의 다른 글

자바에서 String 처리

'그외 주제들 > 한글처리' 카테고리의 다른 글

Response 구간 정리

'그외 주제들 > 한글처리' 카테고리의 다른 글

Request 구간 정리

'그외 주제들 > 한글처리' 카테고리의 다른 글

JSP,Servlet에서 한글 문제를 피하려면..

'그외 주제들 > 한글처리' 카테고리의 다른 글

Unicode ( 유니코드 )

'그외 주제들 > 한글처리' 카테고리의 다른 글

티스토리툴바

카테고리

태그목록

공지사항

최근에 올라온 글

최근에 달린 댓글

링크

글 보관함

달력

'분류 전체보기'에 해당되는 글 73건

강아지와 병아리Time Limit : 1000MS

'FrontEnd > PhoneGap' 카테고리의 다른 글

'BackEnd > JSP&Servlet' 카테고리의 다른 글

'그외 주제들 > 한글처리' 카테고리의 다른 글

'그외 주제들 > 한글처리' 카테고리의 다른 글

'그외 주제들 > 한글처리' 카테고리의 다른 글

'그외 주제들 > 한글처리' 카테고리의 다른 글

'그외 주제들 > 한글처리' 카테고리의 다른 글

'그외 주제들 > 한글처리' 카테고리의 다른 글

'그외 주제들 > 한글처리' 카테고리의 다른 글

티스토리툴바

강아지와 병아리
Time Limit : 1000MS