2010-01-23から1日間の記事一覧

日本語にマッチする正規表現って

簡体字やハングルにマッチしない正規表現ってどう書くんだろう。 $ echo -n e38392 e69db1 e4b89c 0a | xxd -p -r | perl -MEncode -pe '$_=decode_utf8($_);s/(\p{Han})/<$1>/g;$_=encode_utf8($_)' ヒ<東><&#19996;> 簡体字も Han script に含まれるよなあ…