.hd-box .hd-fr

如何在表格中用正则函数巧妙处理字符串

2024-06-14 20:00秋叶Excel(小爽)4评

原文标题:《这个免费的 WPS 新函数太绝了,真后悔没早点遇到!》

大家好,我是啥都会一点点的小爽~

说到处理字符串的判断函数,大家会想到哪些?

FIND 函数 + ISNUMBER 函数

SEARCH 函数 + ISNUMBER 函数

....

说到处理字符串的提取函数,大家会想到哪些?

LEFT 函数 / MID 函数 / RIGHT 函数

LOOKUP 函数 / MATCH 函数

.....

说到处理字符串的替换函数,大家会想到哪些?

SUBSTITUDE 函数 / REPLACE 函数

.....

关于判断,提取,替换,其实只要一个正则函数就都可以搞定!

最近 WPS 新出了正则函数 REGEX。

它使用的是正则表达式

正则表达式是一种用于匹配和操作文本的强大工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。

正则表达式可以在文本中查找、替换、提取和验证特定的模式。

下面大家跟着小爽的步伐,来了解一下这个强大的函数吧~

1、正则函数语法

REGEXP 函数的作用:是利用正则表达式,去匹配原始字符串,得到匹配结果,进行提取 / 判断 / 替换操作。

=REGEXP(原始字符串,正则表示式,[匹配模式],[替换内容])

第一参数:原始字符串

第二参数:正则表达式

关于正则表达式,不用怕,后面的案例会带领大家进一步的了解正则语法。

第三参数:匹配模式

第四参数:替换内容

当第三参数为替换时,输入替换的内容,默认替换的值为 0。

从下图中我们可以看到,第三参数,正则的匹配模式有三种:

0-提取(默认方式)

1-判断

2-替换

这三个正则匹配模式,其实也可以看出正则函数主要的功能用在判断字符,提取字符,替换字符上。

2、判断字符串

在 Excel 中,当我们需要判断字符串中是否某个字符时,一般使用的是 FIND+ISNUMBER 函数。

如下图:判断下述字符是否存在 Excel。

=ISNUMBER(FIND("Excel"A2))

但是,Excel 还可能存在小写的 Excel,这时我们可以增加查找条件 Excel,然后用 OR 函数判断。

使用正则函数,也很快!

=REGEXP(A2"(E|e)xcel"1)

那要是数据存在 ExCel,exCel…… 等等,只有 l 是小写,其余字母都可能是大写和小写字母,那不是要一一写出所有可能结果再查找?

不管多麻烦的判断,一个正则函数,通通可以搞定!

=REGEXP(A2,"(E|e)(X|x)(C|c)(E|e)l",1)

我们来看看这个公式:

原始字符串:A2 单元格

正则表达式:"(E|e)(X|x)(C|c)(E|e) l"

在正则语法中,|  表示或,所以 (E|e) 表示 E 或者 e

(E|e):第一个字符是:E 或者 e

(X|x):第二个字符是:X 或者 x

(C|c):第三个字符是:C 或者 c

(E|e):第四个字符是:E 或者 e

l:第五个字符是:l

这也就是对应查找 Excel 的规则,除了最后的 l 字母,其余的可以是大写也可以是小写。

匹配模式:1 ,对应的是判断,最终返回逻辑值,TRUE / FALSE。

敲黑板:

到这里,我们学会了第一个正则语法:|  代表或的意思。

大家学会了嘛?继续冲鸭!!

3、提取字符串

在字符串提取中,经常有个噩梦就是提取字符串中的数字。

各种乱七八糟的数字文本混合,使得我们非常的头痛。

比如我们要提取文本中最左边的数字。

使用 LEFT 函数 + LOOKUP 函数。

=-LOOKUP(9^9-LEFT(A2,ROW($1$15)))

但是我们要提取的是第一个数字。那就得换另外的公式。

=LOOKUP(9^9,MID(A2,MATCH(1,MID(A2,ROW($1:$15),1)^0,0),ROW($1:$15))*1)

头皮疼!!!!/(ㄒ o ㄒ)/~~

不过现在,我们有正则函数,一下子就能搞定!

=REGEXP(A2"\d+")

搭配 INDEX 函数,我们想取第几个就取第几个!

除了提取数字外,还可以提取非数字的字符串。

=REGEXP(A2,"\D+")

来来来,我们来看看公式~

公式中,主要涉及两个正则语法

\d+,表示匹配一个以及以上数字,所以将字符串中全部是数字的匹配出来;

\D+,则表示匹配一个以及以上的非数字,所以将字符串中全部是非数字的匹配出来。

似不似很方便!!

敲黑板:

这里我们提到两个正则语法。

\d:表示所有的数字,相当于 [0-9];

\D:表示所有的非数字,相当于 [^0-9];

+:加号表示量词,意思是一个到多个。

另外的量词有 * ,表示 0 到多个;

? 表示 0 个或者 1 个。

到这里,小伙伴们又学到几个正则语法了,太棒了,继续冲鸭~

4、替换字符串

当我们清洗数据的时候,总有一些烦人的备注在捣蛋。所以我们需要将括号中的内容通通删除掉。

通过 FIND 函数查找两个括号的位置,提取内容后,用 SUBSTITUTE 函数将它替换掉!

=SUBSTITUTEA2,MID(A2,FIND("("A2)FIND(")"A2)-FIND("("A2)+1)"")

传统做法好麻烦。

别怕!

有了正则函数,也是一个函数搞定!

=REGEXP(A2,"\(.*\)",2)

老规矩,我们来看看公式中的第二参数的正则表达式

\(   \ 表示转义字符,由于括号有特殊含义,所以需要用转义字符转换。

. *  .表示除了换行符 / 回车符以外的任意字符。

\)   与 \(同理

第三参数为 2 ,表示替换,第四参数不写默认为空。

所以公式就不难理解,就是 正则表达式匹配字符串中括号的内容,并将括号中的内容替换为空,从而达到删除的目的。

敲黑板 :

这里我们又学到两个正则语法

\ 为转义字符,主要将特殊符号进行转义。

.代表除换行回车符以外的任意字符。

5、最后的话

正则是处理字符串的一个很强大的利器,很多传统函数很难做到的一些数据处理,正则都可以轻松搞定!

本文涉及了几个正则语法:

|  代表或

\d 代表数字

\D 代表非数字

量词中

+ 代表一个到多个。

* 代表零个到多个。

? 代表 零个或者一个。

\ 代表转义字符

当然正则语法不止有这些,文章篇幅有限,后面有机会我们再介绍。

本文来自微信公众号:秋叶 Excel (ID:excel100),作者:小爽

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论