정규표현식 한글, 한자, 일어 검색

반드시 utf-8로 인코딩 되어있어야 한다.
아니라면 iconv()를 이용해서 utf-8로 변환후 하자..
유니코드 이용시 마지막에 u옵션을 넣어줘야 한다..
// 한글
preg_match_all('/[\x{1100}-\x{11FF}\x{3130}-\x{318F}\x{AC00}-\x{D7AF}]+/u', $text, $match);
print_r($match);

// 한자
preg_match_all('/[\x{2E80}-\x{2EFF}\x{31C0}-\x{31EF}\x{3200}-\x{32FF}\x{3400}-\x{4DBF}\x{4E00}-\x{9FBF}\x{F900}-\x{FAFF}\x{20000}-\x{2A6DF}\x{2F800}-\x{2FA1F}]+/u', $text, $match);
print_r($match);

//  일어
preg_match_all('/[\x{3040}-\x{309F}\x{30A0}-\x{30FF}\x{31F0}-\x{31FF}]+/u', $text, $match);
print_r($match);

'WebDevelop > 정규표현식' 카테고리의 다른 글

정규 표현식 - 룩어라운드(lookaround)  (0) 2010.09.09
정규표현식 한글 표현 방법  (0) 2008.08.19
정규식 예제 [jsscript]  (0) 2007.12.17
Return top