driven to madness ~'string' 태그의 글 목록~

« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Java SE 5.0에 추가된 유용한 문법이 여러가지 있다..
개인적으로 유용하게 사용하는 Enum이라든가.. Genric이라든가..
String.format() (이건 5.0에 feature가 아니던가??)이라든가.. 등등

그런데,
도대체 왜 이딴걸 추가했는지 의문이 가는게 하나 있다..

이러한 문법을 머라고 부르는지도 모르겠는데..
method의 parameter의 갯수를 가변하게 줄 수 있는 방법이다.

위에 예처럼 사용하면 strings가 사실상 String[]의 형태로 들어가게 되어서,
parameter를 몇개고 넣어줄 수 있다..
대략 이런식으로..

setMember(1, "a", "b", "c", "d", "e");

이런식이라면..
아래와 같은 예와 다를게 무엇일까?? (-- )( --);;

Array든 List건 instancing을 해서 거기에 각 value를 셋팅하고
parameter로 넘겨야 하는 수고를 덜어주는게 목적일까??

모르겠다..;;
구글링 잠깐 하다가 귀찮아서 포기..ㅡ,.ㅡ;;

웹서핑하다 발견한 '바디에 인공미 넘치는' 처자..
근데 이름을 모르겠다는..

저작자표시 비영리 변경금지 (새창열림)

문자열을
특정 Token을 이용해서 분리할 때,
대번에 생각나는 API는 역시 StringTokenizer가 아닐까??

Class StringTokenizer

The string tokenizer class allows an application to break a string into tokens. The tokenization method is much simpler than the one used by the StreamTokenizer class. The StringTokenizer methods do not distinguish among identifiers, numbers, and quoted strings, nor do they recognize and skip comments.

The following is one example of the use of the tokenizer. The code:
   StringTokenizer st = new StringTokenizer("this is a test");
   while (st.hasMoreTokens()) {
   System.out.println(st.nextToken());
   }

prints the following output:
   this
   is
   a
   test

(from JDK 5.0 document)

StringTokenizer는
손쉽게 문자열을 특정 Token으로 분리하는 것이 가능하다.

하지만, StringTokenizer를 사용하다 보면, 다음과 같은 문제가 발생할 때가 있다.
아래와 같은 문자열을 분리한다고 하자

박찬호/35/LA다저스//한국

이 문자열을 '/'를 이용해서 분리하게 되면 다음과 같은 결과를 얻을 수 있다.

박찬호
35
LA다저스
한국

Token사이에 값이 없으면 결과에서 생략되는 것을 볼 수 있다.

다음과 같은 문자열을 분리하는 경우르 보자.

source :
영어,한글,중국어,일어
boy,소년,,ボ―イ

output :
영어 -> boy
한글 -> 소년
중국어 -> ボ―イ
일어 -> null

Token을 기준으로 특정 위치에 값이 반드시 들어가야 하는 경우,
StringTokenizer를 사용하면 상당히 귀찮은 노가다성 작업이 필요하게 된다..;;

위와 같은 경우 생략된 값을 처리할 좋은 방법이 없을까?

String class의 split() method를 사용해 보자..

String str = "boy,소년,,ボ―イ";
String[] output = str.split(",");

output :
boy
소년

ボ―イ

생략된 값까지 포함된 배열을 얻을 수 있으므로,
일단, 귀찮은 작업을 해주지 않아도 될꺼 같다..ㅋㅋ;

그럼 필드의 마지막이 생략된 경우는 어떨까??

source :
영어,한글,중국어,일어,독어
boy,소년,,ボ―イ,

output :
영어 -> boy
한글 -> 소년
중국어 -> ""
일어 -> ボ―イ
독어 -> null

output1.length = 5
output2.length = 4

안타깝게도 마지막 값이 생략된 경우는,
결과에 포함되지 않는 것을 알 수 있다..

JDK Document에서 String.split() method를 보면,
다음 두가지가 있음을 알 수 있다.

public String[] split(String regex)
public String[] split(String regex, int limit)

limit 값을 넘겨줄 수 있는 method를 사용해 보자.

String str = "boy,소년,,ボ―イ,";
String[] output = str.split(",", 5);

output :
영어 -> boy
한글 -> 소년
중국어 -> ""
일어 -> ボ―イ
독어 -> ""l

output.length = 5

정확히 필드의 값들이 매치되는 것을 볼 수 있다.

limit값은 split()의 결과로 받게 되는
String[]의 크기를 나타내는 값이다.

결론 :

다수의 정형화된 문자열을 분리하는데는 StringTokenizer가 편리하지만
정형화 되지 않은 문자열을 분리하는 경우는 String.split()가 더 편리할 수 있다.
(노가다로 해줘야 하는 작업이 줄어든다..ㅋ;)

물론,
필드의 갯수가 엉망인 문자열을 분리하는데는 String.split()로도 부족하다..

티스토리툴바