preg_match("/<\/label>[\s]*(?:<span.*?>)?(.+?)(?:<\/span>)?[\s]*<li>/is", $test, $getcontent);五二电子网管理员组文章数量:1493
echo $getcontent[1];
//你试试看
正则表达式只能输入中文和字母
编码的字符串后面一定要加模式修饰符U。
正则表达式:[\\u4e00-\\u9fa5]*|\\w*|\\d*|_*
代码如下:
@Testpublicvoidtest1(){//匹配正则表达式Stringstr="[\\u4e00-\\u9fa5]*|\\||\\d*w*_*";Patternpattern=Pattern.comfromrunning(STR);//
字符串StringmStr="howfar_344fjdk";system.out。println("stringtesting:"+mStr);Matcherm=模式。匹配器(mStr);//
如果(m。ind())是匹配的,{system.out。println("matchcontent:"+m.group());}}
程序运行结果:
扩展资料:
注意事项:
匹配包含下划线的任何单词字符。相似但不公平”(咱——z0-9_)”,“这个词”字符的Unicode字符集,充分利用中国的是:
\u4e00——\\u9fa5],说英文字母\w,代表数字\d说_,_*是零个或多个,|或表达,所以每个匹配|拼接可以说与正则表达式相匹配。
正则表达式判断是否存在中文和全角字符和判断包含中文字符串长度
判断是否存在中文和全角字符str.match(/[^\x00-\xff]/ig)
判断包含中文字符串长度
aMatch=str.match(/[^\x00-\x80]/g);
str.length+(!aMatch?0:aMatch.length)
javascript
判断中文字符长度
一种:
复制代码
代码如下:
function
_length(str){
var
len=0;
for(var
i=0;i<str.length;i++){
if(str.charAt(i)>'~'){len+=2;}else{len++;}
}
return
len;
}
二种:
复制代码
代码如下:
String.prototype.gblen
=
function()
{
var
len
=
0;
for
(var
i=0;
i<this.length;
i++)
{
if
(this.charCodeAt(i)>127
||
this.charCodeAt(i)==94)
{
len
+=
2;
}
else
{
len
++;
}
}
return
len;
}
String.prototype.gbtrim
=
function(len,
s)
{
var
str
=
'';
var
sp
=
s
||
'';
var
len2
=
0;
for
(var
i=0;
i<this.length;
i++)
{
if
(this.charCodeAt(i)>127
||
this.charCodeAt(i)==94)
{
len2
+=
2;
}
else
{
len2
++;
}
}
if
(len2
<=
len)
{
return
this;
}
len2
=
0;
len
=
(len
>
sp.length)
?
len-sp.length:
len;
for
(var
i=0;
i<this.length;
i++)
{
if
(this.charCodeAt(i)>127
||
this.charCodeAt(i)==94)
{
len2
+=
2;
}
else
{
len2
++;
}
if
(len2
>
len)
{
str
+=
sp;
break;
}
str
+=
this.charAt(i);
}
return
str;
}
var
str1
=
'世上最牛的@#%&们
世上最牛的@#%&们';
document.write('str1
=
'+
str1
+'
');
document.write('length
=
'+
str1.gblen()
+'
');
document.write('gbtrim(10)
=
'+
str1.gbtrim(10)
+'
');
document.write('gbtrim(10,
\'…\')
=
'+
str1.gbtrim(10,
'…')
+'
');
document.write('gbtrim(12,
\'-\'
)
=
'+
str1.gbtrim(12,
'-')
+'
');
//
gbtrim(len
截取长度,按英文字节长度计算,
s截取后的省略字符,如"…"
)
//
备注:
这里中文字符都是当作两个长度来计算的,所以gbtrim中的len为10时,是显示最多5个汉字的。
//
当汉字数大于5时,由于截取后加上“…”,所以只显示4个汉字。
版权声明:本文标题:正则表达式 筛选中文 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/web/1686494543a1977.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论