분류 전체보기
훗~
DSLR
Mac
Reference
private
Reference에 해당되는 글
2008.06.27

[참고자료] Unicode 범위 & 목록

유니코드(Unicode)
전세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 유니코드 협회(Unicode Consortium)가 제정하며, 최신판은 2008년 4월에 공개된 유니코드 5.1이다. 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자들을 다루기 위한 알고리즘 등을 포함하고 있다.

유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것이다. 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다. 유니코드가 다양한 문자 집합들을 통합하는 데 성공하면서 유니코드는 컴퓨터 소프트웨어의 국제화와 지역화에 널리 사용되게 되었으며, 비교적 최근의 기술인 XML, 자바, 그리고 최신 운영 체제 등에서도 지원하고 있다.

유니코드에서 한국어 발음을 나타날 때는 예일 로마자 표기법의 변형인 ISO/TR 11941을 사용하고 있다.
(from wiki)

plus : Unicode 범위 & 목록


락군

Locale 표시에 대한 궁금증..

Locale을 표시하는 영문을 보다가..

각각이 가리키는 나라가 어디인가가 궁금해서 이것저것 찾아 본 결과..

DE : 독일
ES : 스페인
FR : 프랑스
IT : 이탈리아
JP : 일본

여기까지는 알았던 것들.. 흔하달까..

ZH : 중국어
PT : 포르투갈

이건 몰랐던..ㅋㅋ;


Locale표기로 사용되는 영문표기도
역시 국제 표준으로 되어 있다..

대략..
Java의 Locale class에 정의된 constant도 이 표준을 따르고 있는듯..


필요할때 참고하자..


락군

[JavaScript] event.cancelBubble

오늘 간만에 JavaScript를 사용하다..
다시한번 빠져든 이야기..


다음과 같은 태그로 구성된 document가 있다고 하자..

<table onclick="go(1);">
<tr>
<td><span onclick="go(2);">메롱메롱</span></td>
</tr>
</table>

여기서,
내가 기대한 동작은..
span태그가 감싸고 있는 부분(메롱메롱)을 누르게 되면
go함수에 2를 전달하게 되고,
기타 테이블의 다른 영역을 클릭하게 되면, go함수에 1을 전달하는 시나리오였다..

그런데..
span태그가 감싸고 있는 부분을 아무리 누질러도.. go함수에 죽어라 1만 전달됐다..
(하여튼 JavaScript로 무언가 하고자 하면.. 한번에 안된다..ㅡ,.ㅡ;;)





이제부터 해결과정 :
 
DOM 이벤트 모델의 특징중..
Capture Step, Bubbling Step이란 말이 있는데..

쉽게 말해서, 하나의 이벤트가 이벤트 소스를 기준으로 parent로 전달되는 것을 말한다.
capture step는 child에서 parent로 전달..
bubbling step는 parent에서 child로 전달..

표준을 따르자면..
capture step, bubbling step이 순서대로 진행되어야 하지만..
우리 IE군은 capture step따위는 무시해주신다..

따라서,
이 문제는 bubbling step에 따라서 Table에 걸린 onclick 이벤트가 실행된건데..
이 과정을 없애기 위한 명령이..
event.cancelBubblue = true 이다.

말그대로.. bubble를 취소해준다..ㅋ;


PS. 이래서 낵아 자바 스크립트를 매우 좋아(?)한다..ㅡ,.ㅡ;;
락군

괄호의 영어 표기

자꾸 까먹어서 결국 포스팅..;;

()
사용자 삽입 이미지

{}
사용자 삽입 이미지
[]
사용자 삽입 이미지
<>
사용자 삽입 이미지


락군

Eclipse 3.4 release

나의 밥줄 도우미(?)
이클립스 3.4 등장..

사용자 삽입 이미지

코드명 가니메데는 목성의 위성이라나..
Callisto -> Europa(6th) -> Ganymede(3rd) 목성 주변 열심히 배회중..

차기버전은 딱봐도.. 예상 가능..
갈릴레오가 발견한 목성의 위성중 유일하게 빠진
Io가 유력후보..

그런데,
목성의 토탈 위성수는 지금까지 발견된 것만 63개..
3.64 버전까지 우려먹기 가능..ㅋㅋ;


PS. MacOS X 10.5 leopard에서
     자잘한 버그랑 성능 개선이나 좀 됐으면 하는 소망이..
락군

[Java] JConsole 문제 해결

현재 실행중인 Java App의
메모리 상태, 쓰레드 상태등을 간단히 알고 싶을때..
JConsole은 상당히 유용한 Util인데..

JConsole을 실행하다 보면,
다음과 같은 메시지가 출력되면서 실행이 안될때가 있다..

사용자 삽입 이미지





왤까 싶어서..
구글링을 좀 해봤더만..

이래서 그렇단다..

사용자 삽입 이미지

간단히 말해서..

JDK 5.0을 사용하면,
vm arguments에 -Dcom.sun.management.jmxremote 를 추가해 주어야 한다..
물론, 6.0을 사용한다면 이런거 할 필요 읍단다..

어쩐지..
이상하게 Mac에서만 안되더라..ㅡ,.ㅡ;;
락군

[Java] 비트 연산

초 간단 비트 연산 Example..

입력받은 수의 각 비트가 1이면 true, 0이면 false출력..

int value = 0x57;
String binaryString = Integer.toBinaryString(value);
while(binaryString.length() % 4 != 0) {
                    binaryString = "0" + binaryString;
          }
        
          System.out.println("Source : " + binaryString);

          for(int i = 0; i < binaryString.length(); i++) {
                    System.out.println("\tbit " + i + " : " + ((value >> i & 1) == 1));
          }

결과 :
          Source : 01010111        
              bit 0 : true
              bit 1 : true
              bit 2 : true
              bit 3 : false
              bit 4 : true
              bit 5 : false
              bit 6 : true
              bit 7 : false

락군

[Java} StringTokenizer와 String.split()

문자열을
특정 Token을 이용해서 분리할 때,
대번에 생각나는 API는 역시 StringTokenizer가 아닐까??


Class StringTokenizer
The string tokenizer class allows an application to break a string into tokens. The tokenization method is much simpler than the one used by the StreamTokenizer class. The StringTokenizer methods do not distinguish among identifiers, numbers, and quoted strings, nor do they recognize and skip comments.

The following is one example of the use of the tokenizer. The code:
     StringTokenizer st = new StringTokenizer("this is a test");
     while (st.hasMoreTokens()) {
         System.out.println(st.nextToken());
     }
 
prints the following output:
     this
     is
     a
     test
(from JDK 5.0 document)

StringTokenizer는
손쉽게 문자열을 특정 Token으로 분리하는 것이 가능하다.

하지만, StringTokenizer를 사용하다 보면, 다음과 같은 문제가 발생할 때가 있다.
아래와 같은 문자열을 분리한다고 하자

박찬호/35/LA다저스//한국

이 문자열을 '/'를 이용해서 분리하게 되면 다음과 같은 결과를 얻을 수 있다.

박찬호
35
LA다저스
한국

Token사이에 값이 없으면 결과에서 생략되는 것을 볼 수 있다.

다음과 같은 문자열을 분리하는 경우르 보자.

source :
영어,한글,중국어,일어
boy,소년,,ボ―イ

output :
영어 -> boy
한글 -> 소년
중국어 -> ボ―イ
일어 -> null

Token을 기준으로 특정 위치에 값이 반드시 들어가야 하는 경우,
StringTokenizer를 사용하면 상당히 귀찮은 노가다성 작업이 필요하게 된다..;;

위와 같은 경우 생략된 값을 처리할 좋은 방법이 없을까?

String class의 split() method를 사용해 보자..

String str = "boy,소년,,ボ―イ";
String[] output = str.split(",");

output :
boy
소년

ボ―イ

생략된 값까지 포함된 배열을 얻을 수 있으므로,
일단, 귀찮은 작업을 해주지 않아도 될꺼 같다..ㅋㅋ;

그럼 필드의 마지막이 생략된 경우는 어떨까??

source :
영어,한글,중국어,일어,독어
boy,소년,,ボ―イ,

output :
영어 -> boy
한글 -> 소년
중국어 -> ""
일어 -> ボ―イ
독어 -> null

output1.length = 5
output2.length = 4

안타깝게도 마지막 값이 생략된 경우는,
결과에 포함되지 않는 것을 알 수 있다..

JDK Document에서 String.split() method를 보면,
다음 두가지가 있음을 알 수 있다.

public String[] split(String regex)
public String[] split(String regex, int limit)

limit 값을 넘겨줄 수 있는 method를 사용해 보자.

String str = "boy,소년,,ボ―イ,";
String[] output = str.split(",", 5);

output :
영어 -> boy
한글 -> 소년
중국어 -> ""
일어 -> ボ―イ
독어 -> ""l

output.length = 5

정확히 필드의 값들이 매치되는 것을 볼 수 있다.

limit값은  split()의 결과로 받게 되는
String[]의 크기를 나타내는 값이다.


결론 :

다수의 정형화된 문자열을 분리하는데는 StringTokenizer가 편리하지만
정형화 되지 않은 문자열을 분리하는 경우는 String.split()가 더 편리할 수 있다.
(노가다로 해줘야 하는 작업이 줄어든다..ㅋ;)

물론,
필드의 갯수가 엉망인 문자열을 분리하는데는 String.split()로도 부족하다..
락군

Java5의 Enum 사용하기

Java5에서 Enum은 기존의

public interface XYZConstants {
  public static final int A = 1;
  public static final int B = 2;
  public static final int C = 3;
}

가 갖는 문제점을 해결합니다. 위와같은 integer를 사용한 constants는 결국
int c = XYZConstatnts.B;
와 같은 형태로 값을 저장해야하고 따라서 아무 값이나 c안에 저장할 수 있다는 문제가 있습니다. 이를 해결학위한 Typesafe Enumeration 패턴이 있지만 이는 구현하기 어렵고, switch-case문을 사용하지 못하는 한계가 있죠. 이를 해결한 것이 Java5의 Enum입니다.

Enum은 보통 다음과 같이 선언합니다.

public enum SimpleEnum {
  A, B, C;

  public static void main(String[] args) {
    System.out.println(A);

    SimpleEnum s = B;
    switch(B) {
      case A: System.out.println(“A”); break;
      case B: System.out.println(“B”); break;
      case C: System.out.println(“C”);
    }
  }
}

출력은 다음과 같습니다.
A
B

인자를 저장시켜 활용할 수도 있습니다.

public enum EnumWithArgument {
  A(0,1), B(1, 2), C(2, 3);

  private int first;
  private int second;

  // No modifier is allowed here.
  EnumWithArgument(int a, int b) {
    first = a;
    second = b;
  }

  public String toString() {
    StringBuilder sb = new StringBuilder();
    sb.append(first);
    sb.append(“, “);
    sb.append(second);

    return sb.toString();
  }

  public static void main(String[] args) {
    System.out.println(A);
  }
}

출력은 다음과 같습니다.
0, 1

흥미로운 것은 Enum의 hierarchy입니다.
만약 단순히 Enum을 선언하면 hierarchy는 다음과 같이 됩니다.

public enum EnumSuper {
  A;

  public static void main(String[] args) {
    System.out.println(A.getClass());
    System.out.println(A.getClass().getSuperclass());
  }
}

출력은 다음과 같습니다.
class EnumSuper
class java.lang.Enum

하지만 다음과 같이 Enum을 추상클래스로 만들고 각각의 item이 override하게 할 수도 있습니다.

public enum EnumSuper2 {
  A() { @Override public void foo() { } };

  abstract void foo();

  public static void main(String[] args) {
    System.out.println(A.getClass());
    System.out.println(A.getClass().getSuperclass());
  }
}

출력은 다음과 같습니다.
class EnumSuper2$1
class EnumSuper2

따라서 각 Enum 안의 value에 polymorphism 적용이 가능하게 됩니다.

public enum EnumSuper3 {
  A { @Override public void foo() { System.out.println(“I am A”); } },
  B { @Override public void foo() { System.out.println(“I am B”); } };

  abstract public void foo();

  public static void main(String[] args) {
    EnumSuper3 e = A;
    e.foo();

    e = B;
    e.foo();
  }
}

출력은 다음과 같습니다.
I am A
I am B

switch-case를 써서 다음과 같이 한 곳에서 처리하게 할 수도 있습니다.

public enum EnumSuper3 {
  A, B;

  public void foo() {
    switch(this) {
      case A: System.out.println(“I am A”); break;
      case B: System.out.println(“I am B”); break;
    }
  }

  public static void main(String[] args) {
    EnumSuper3 e = A;
    e.foo();

    e = B;
    e.foo();
  }
}

출력은 마찬가지입니다.
I am A
I am B

이렇게까지 보고 “기능은 참 많구나…” 하고 끝내면 좋은데 문제는 Enum의 정의된 모양이 무척 이해하기 어렵다는 것입니다.

JDK API에 Enum은 다음과 같이 정의되어 있습니다.

Class Enum<E extends Enum<E>> implements Serializable, Comparable<E> { … }

먼저 Enum은 상수이므로 Serializable 해야한다는 것은 명확합니다.
또 Enum의 각 value간 비교가 가능해야할 것이므로 Comparable<E> 을 구현한 것도 이해할 수 있습니다.
문제는 Enum<E extends Enum<E>>입니다.

앞서 이야기 드렸던 바와 같이 enum으로 선언한 클래스는 Enum을 상속받습니다.
그리고 이 동작은 내부적으로 자동으로 이루어집니다.
따라서 public enum Foo는 Enum<Foo extends Enum> 을 만족합니다. 문제는 Foo extends Enum<Foo> 부분에서 부모 클래스에 넘기는 Foo 입니다. 이것은 generics에서 상속을 강제할 경우 어떤일이 생기는가를 따져보면 이해할 수 있습니다.

1) 여기에서 보다시피 자식 클래스는 부모의 클래스를 물려받으며, 의무적으로 부모의 abstract 메소드를 구현해야 합니다.
2) 또한 covarint 를 가능하게 합니다. 예를들어 Enum 클래스안에 public <E> E method() 가 있었다면 이 E 는 자동으로 enum 으로 선언된 클래스 (지금의 예에서는 Foo)로 치환됩니다.

이처럼 java generics 의 특징은 C++에서 코드가 직접 생성되는 경우와 매우 다른 특징을 가지며 Enum은 그것을 잘 활용한 예입니다.

락군
*1  *2