v48pv4

http://keair.bhha.com.cn/comv48pv4/

元字符-选择匹配符

在匹配某个字符串的时候是选择性的，即：既可以匹配这个，又可以匹配那个，这时需要用到选择匹配符号

结果：

元字符-限定符

用于指定其前面的字符和组合项连续出现多少次

注意：Java 匹配默认贪婪匹配，即尽可能匹配多的

元字符-定位符

定位符，规定要匹配的字符串出现的位置，比如在字符串的开始还是在结束的位置，这个也是相当有用的，必须掌握。

应用实例

手机号码

要求: 必须以 13,14,15,18 开头的 11 位数 , 比如 13588889999

url 地址

思路:

先确定 url 的开始部分 https:// | http:
.然后通过 ([\w-]+.)+[\w-] 匹配

头的 11 位数 , 比如 13588889999

url 地址

思路:

先确定 url 的开始部分 https:// | http:
.然后通过 ([\w-]+.)+[\w-] 匹配

符号	含义	实例	解释
相关列表苹果手机大降价！记者线下实探苹果手机降价「苹果手机大降价！记者线下实探」正则表达式手机号定位「正则表达式」文章列表暂无文章推荐文章探索健康体重管理新路径助力健康中国山阳县人民法院：“法院+综治中心”激发多元解纷新动能 Securitize：贝莱德BUIDL基金迄今已支付超过6250万美元股息北京市人民政府关于公布无人驾驶航空器管制空域范围的通告暑假没给孩子玩手机，怎么也近视了？一加高调亮相 2025 ChinaJoy，四大游戏体验区燃炸全场从“蹲下去找茬”到“站上去领奖”——记2025年中国石化油田企业基层安全竞赛金奖王瑞雪重点防范境外恶意网址和恶意IP！涉及美国、英国、荷兰等滨州全面启动夏季蚊蝇集中消杀行动织密市民健康“防护网” 年入4000万！AI还能这样赚钱固安龙源仓储：站好危化企业的每一班“安全岗” 原创“警告无效时可以开火”中方正式宣布，看谁还敢越线挑衅！日照旅游地图手绘，三天景点打卡四川云尚智达圆满完成《2025安逸生活巨星演唱会-达州站》安保任务原创三件大事发生，震惊全球，普京莫迪特朗普谁是胜者，看诸王恶斗！联系方式联系人：汪女士电话：15066621024		首页 > 文章中心正则表达式手机号定位「正则表达式」发布时间：2025-02-02 浏览次数：31 返回列表提取文章中所有的英文单词提取文章中所有的数字提取文章中所有的英文单词和数字给你一个字符串(或文章)，请你找出所有四个数字连在一起的字串请验证输入的邮件，是否符合电子邮件格式请验证输入的手机号，是否符合手机号格式结论：正则表达式是处理文本的利器一个正则表达式，就是用某种模式去匹配字符串的一个公式。很多人因为正则表达式看上去比较古怪而且复杂所以不敢去使用。但是当你看完这篇文章并去加以练习后就会觉得这些复杂的表达式写起来还是相当简单的，而且，一旦你弄懂它们，你就能把数小时辛苦而且易错的文本处理工作缩短在几分钟（甚至几秒钟）内完成。正则表达式：regular expression => RegExp 简单的说：正则表达式是对字符串执行模式匹配的技术。 1.提取文章中所有的英文单词运行结果：代码解读：先创建一个 Pattern 对象，模式对象, 可以理解成就是一个正则表达式对象创建一个匹配器对象就是 matcher 匹配器按照 pattern (模式/样式), 到 content 文本中去匹配，找到就返回 true, 否则就返回 false 可以开始循环匹配关于 matcher.find() 和 matcher.group() 涉及到源码，此处的源码挺简单，建议阅读会了这一个例子之后，掌握了正则表达式的三个步骤，做其它的匹配都是大同小异的，下面再举几个例子来巩固一下。 2.提取文章中所有的数字注意，其它的代码都和上面的代码完全一样，只是正则表达式变了而已运行结果： 3.提取文章中所有的英文单词和数字运行结果： 4.提取 IP 地址 \d 表示一个任意的数字运行结果：主要就是研究 matcher.find() 和 matcher.group() 通过一个例子来说明，即找到字符串里的连续4个数字强烈建议：自己进行 debug，在第 16 行的位置加一个断点。用文字来叙述的话是不太好描述的，建议大家看完之后，自己进行 debug 代码是如何找到 1998 的？ matcher.find() 完成的任务: 根据指定的规则 ,定位满足规则的子字符串(比如 1998 ) 找到后，将子字符串的开始的索引记录到 matcher 对象的属性 int[] groups 中，即记录 groups[0] = 0(因为 1998 中 1 的索引为 0)，把该子字符串的结束的索引 + 1 的值记录到 groups[1] = 4。(为什么要记录索引 + 1呢？因为下面 matcher.group() 要调用 getSubSequence 进行截取字符串) 同时记录 oldLast 的值为子字符串的结束的索引 + 1 的值即 4, 即下次执行 find 时，就从 4 开始匹配 matcher.group(0) 分析: 首先看一下源码这里我们只需要看第 8 行代码即可，注意我们传的参数的值是 0(因为 matcher.group(0))，再看第 8 行代码，很容易计算出 groups[group * 2] = groups[0] = 0，groups[group * 2 + 1] = groups[1] = 4 根据 groups[0] = 0 和 groups[1] = 4 的记录的位置，从 content 开始截取子字符串返回，就是 [0,4) 包含 0 但是不包含索引为 4 的位置(getSubSequence 的作用)，再通过 toString() 返回，即 1998。执行下一次循环，即先执行 matcher.find()，再执行 matcher.find() 。由于设定的字符串匹配规则，此时会定位到 1999 的位置。再次按照上面的规则来执行根据指定的规则 ,定位满足规则的子字符串(比如 1999 ) 找到后，将子字符串的开始的索引记录到 matcher 对象的属性 int[] groups; groups[0] = 31，把该子字符串的结束的索引 + 1 的值记录到 groups[1] = 35。同时记录 oldLast 的值为子字符串的结束的索引+1的值即 35, 即下次执行 find 时，就从 35 开始匹配再次执行 matcher.group(0) 由于传的参还是 0，故由可知：groups[group * 2] = groups[0] = 31，groups[group * 2 + 1] = groups[1] = 35，故截取 [31,35)的字符串返回，即 1999 如果你有感觉到如果，不调用 matcher.group(0)，而是调用 matcher.group(1)，或者 matcher.group(2) 呢，那么说明你对正则表达式的理解更上一层了什么是分组，比如 (dd)(dd) ,正则表达式中有() 表示分组,第1个()表示第1组,第2个()表示第2组… matcher.find() 完成的任务（考虑分组）根据指定的规则 ,定位满足规则的子字符串(比如(19)(98)) 找到后，将子字符串的开始的索引记录到 matcher 对象的属性 int[] groups 中， 2.1 groups[0] = 0 , 把该子字符串的结束的索引+1的值记录到 groups[1] = 4 2.2 记录1组()匹配到的字符串 groups[2] = 0 groups[3] = 2 2.3 记录2组()匹配到的字符串 groups[4] = 2 groups[5] = 4 2.4.如果有更多的分组… 同时记录 oldLast 的值为子字符串的结束的索引+1的值即 4, 即下次执行 find 时，就从 4 开始匹配 matcher.group()：调用 matcher.group(0) 时：由上面对 matcher.find() 的分析可知：groups[group * 2] = 0，groups[group * 2 + 1] = 4，由 getSubSequence 进行截取,，即返回 1998 调用 matcher.group(1) 时：由上面对 matcher.find() 的分析可知：groups[group * 2] = 0，groups[group * 2 + 1] = 2，由 getSubSequence 进行截取,，即返回 19 调用 matcher.group(2) 时：由上面对 matcher.find() 的分析可知：groups[group * 2] = 2，groups[group * 2 + 1] = 4，由 getSubSequence 进行截取,，即返回 98 运行结果：小结：如果正则表达式有 () 即分组，取出匹配的字符串规则如下： group(0) 表示匹配到的子字符串 group(1) 表示匹配到的子字符串的第一组字串 group(2) 表示匹配到的子字符串的第2组字串 … 但是分组的数不能越界，比如只有两个分组，但是却调用 matcher.group(3) 元字符如果想要灵活的运用正则表达式，必须了解其中各种元字符的功能，元字符从功能上大致分为：限定符 ---- 限定字符的个数选择匹配符 ---- 分组组合和反向引用符特殊字符字符匹配符定位符元字符-转义号 \ \ 符号说明：在我们使用正则表达式去检索某些特殊字符的时候，需要用到转义符号，否则检索不到结果，甚至会报错。需要用到转移字符的有：*.+()$/?[]^{}** 元字符-字符匹配符表中出现的 ?，*，+ 等在元字符-限定符中有解释
[ ]	可接收的字符列表	[efgh]	e、f、g、h 中的任意 1 个字符
[ ^ ]	不接收的字符列表	[^abc]	除 a、b、c 之外的任意 1 个字符，包括数字和特殊符号
-	连字符	A-Z	任意单个大写字母
符号	含义	示例	说明	匹配输入
.	匹配除以外的任何字符	a…b	以 a 开头，b 结尾，中间包括 2 个任意字符的长度为 4 的字符串	aaab、aefb、a35b、a#*b
\d	匹配单个数字字符，相当于 [0-9]	\d{3}(\d)?	包含 3 个或 4 个数字的字符串	123、9876
\D	匹配单个非数字字符，相当于 [^0-9]	\D(\d)*	以单个非数字字符开头，后接任意个数字字符串	a、A342
\w	匹配单个数字、大小写字母字符，相当于 [0-9a-zA-Z]	\d{3}\w{4}	以 3 个数字字符开头的长度为7的数字字母字符串	234abcd、12345Pe
\W	匹配单个非数字、大小写字母字符，相当于 [^0-9a-zA-Z]	\W+\d{2}	以至少 1 个非数字字母字符开头，2 个数字字符结尾的字符串	#29，#?@10
符号	含义	示例	解释
\|	匹配"\|"之前或之后的表达式	ab\|cd	ab 或者 cd
符号	含义	示例	说明	匹配输入
*	指定字符重复 0 次或 n 次(无要求)零到多	(abc)*	仅包含任意个 abc 的字符串，等效于w*	abc、abcabcabc
+	指定字符重复 1次或 n 次(至少一次)1到多	m+(abc)*	以至少1个 m 开头，后接任意个 abc 的字符串	m、mabc、mabcabc
?	指定字符重复 0 次或 1 次(最多一次)0到1	m+abc?	以至少1个m开头，后接ab或abc的字符串	mab、mabc、mmmab、mmabc
{n}	只能输入 n 个字符	[abcd]{3}	由 abcd 中字母组成的任意长度为 3 的字符串	abc、dbc、adc
{n,}	指定至少 n 个匹配	[abcd]{3,}	由 abcd 中字母组成的任意长度不小于 3 的字符串	aab、dbc、aaabdc
{n,m}	指定至少 n 个但不多于 m 个匹配	[abcd]{3,5}	由 abcd 中字母组成的任意长度不小于 3 ，不大于 5 的字符串	abc、abcd、aaaaa、bcdab
符号	含义	示例	说明	匹配输入
^	指定起始字符	+[a-z]*	以至少 1 个数字开头，后接任意个小写字母的字符串	123、6aa、555edf
$	指定结束字符	\-[a-z]+$	以 1 个数字开头后接连字符"-"，并以至少1 个小写字母结尾的字符串	1-a
\b	匹配目标字符串的边界	zhu\b	这里说的字符串的边界指的是子串间有空格，或者是目标字符串的结束位置	zhuyierzuihaodezhu zzzhu
\B	匹配目标字符串的非边界	zhu\B	和\b 的含义刚刚相反	zhuyierzuihaodezhu zzzhu

管理入口| 返回顶部

声明：康宝晨特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

v48pv4

http://keair.bhha.com.cn/comv48pv4/

1.提取文章中所有的英文单词

2.提取文章中所有的数字

3.提取文章中所有的英文单词和数字

4.提取 IP 地址

元字符

元字符-转义号 \

元字符-字符匹配符

元字符-选择匹配符

元字符-限定符

元字符-定位符

应用实例

手机号码

url 地址

url 地址