MongoDB 正则表达式

正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。

许多程序设计语言都支持利用正则表达式进行字符串操作。

MongoDB 还提供了使用$regex运算符进行字符串模式匹配的正则表达式功能。MongoDB 使用 PCRE(Perl Compatible Regular Expression)作为正则表达式语言。

与文本搜索不同,我们不需要做任何配置或命令来就可以使用正则表达式。

假设我们在名为posts的数据库中插入了一个文档,如下所示

> db.posts.insert(
{
   "post_text": "enjoy the mongodb articles on jiyik",
   "tags": [
      "mongodb",
      "tutorialspoint"
   ]
}
WriteResult({ "nInserted" : 1 })

使用正则表达式

以下正则表达式查询搜索所有包含字符串 jiyik 的帖子

> db.posts.find({post_text:{$regex:"jiyik"}}).pretty()
{
    "_id" : ObjectId("5dd7ce28f1dd4583e7103fe0"),
    "post_text" : "enjoy the mongodb articles on jiyik",
    "tags" : [
        "mongodb",
        "jiyik"
    ]
}
{
    "_id" : ObjectId("5dd7d111f1dd4583e7103fe2"),
    "post_text" : "enjoy the mongodb articles on jiyik",
    "tags" : [
        "mongodb",
        "jiyik"
    ]
}
>

相同的查询也可以写为 -

>db.posts.find({post_text:/jiyik/})

使用不区分大小写的正则表达式

为了使搜索不区分大小写,我们使用值为$i的$options参数。以下命令将查找具有单词 jiyik 的字符串,无论是小写还是大写

>db.posts.find({post_text:{$regex:"jiyik",$options:"$i"}})

此查询返回的结果之一是以下文档,其中包含不同情况下的 jiyik 一词

{
   "_id" : ObjectId("53493d37d852429c10000004"),
   "post_text" : "hey! this is my post on JiyiK", 
   "tags" : [ "jiyik" ]
} 

对数组元素使用正则表达式

我们也可以在数组字段上使用正则表达式。这在我们实现标签的功能时尤为重要。因此,如果你需要查找包含以 jiy 开头的标签数据(ji 或 jiy 或 jiyik), 你可以使用以下代码:

>db.posts.find({tags:{$regex:"jiy"}})

优化正则表达式查询

  • 如果你的文档中字段设置了索引,那么使用索引相比于正则表达式匹配查找所有的数据查询速度更快。
  • 如果正则表达式是前缀表达式,所有匹配的数据将以指定的前缀字符串为开始。例如: 如果正则表达式为 ^tut ,查询语句将查找以 tut 为开头的字符串。

查看笔记

扫码一下
查看教程更方便