正则表达式(不包含标点符号):
[\x{4e00}-\x{9fa5}]
正则表达式(包含中文标点符号):
[\x{FF10}-\x{FF19}]|[\x{3000}-\x{303F}]|[\x{fe10}-\x{fe1f}]|[\x{ff00}-\x{ffef}]
PHP 代码:
$content="今天!我起了个大早。为什么?因为:我饿了!sdjaflkfdjksla.....!!";
$a=preg_match_all("/[\x{4e00}-\x{9fa5}]|[\x{FF10}-\x{FF19}]|[\x{3000}-\x{303F}]|[\x{fe10}-\x{fe1f}]|[\x{ff00}-\x{ffef}]/u",$content,$rs);
var_dump($a);
var_dump($rs);
结果:
int(23)
array(1) { [0]=> array(23) { [0]=> string(3) "今" [1]=> string(3) "天" [2]=> string(3) "!" [3]=> string(3) "我" [4]=> string(3) "起" [5]=> string(3) "了" [6]=> string(3) "个" [7]=> string(3) "大" [8]=> string(3) "早" [9]=> string(3) "。" [10]=> string(3) "为" [11]=> string(3) "什" [12]=> string(3) "么" [13]=> string(3) "?" [14]=> string(3) "因" [15]=> string(3) "为" [16]=> string(3) ":" [17]=> string(3) "我" [18]=> string(3) "饿" [19]=> string(3) "了" [20]=> string(3) "!" [21]=> string(3) "!" [22]=> string(3) "!" } }