ChatGPT解决这个技术问题 Extra ChatGPT

检查字段是否包含字符串

我正在寻找一个运算符,它允许我检查字段的值是否包含某个字符串。

就像是:

db.users.findOne({$contains:{"username":"son"}})

那可能吗?


S
Skippy le Grand Gourou

您可以使用以下代码来完成。

db.users.findOne({"username" : {$regex : "son"}});

请注意,这将不会有效地使用索引并导致扫描所有值以查找匹配项。请参阅 Regular Expressions 上的注释
@Stennie,那么您建议如何有效利用索引并找到子字符串。
@Vish:如果您的常见用例是字段的自由文本搜索并且您有大量文档,我会标记文本以进行更有效的查询。您可以使用 multikeys 进行简单的全文搜索,或者将 inverted index 构建为单独的集合。对于不频繁的搜索或少量文档,扫描完整索引可能是可接受的(尽管不是最佳的)性能。
这不是有点矫枉过正吗?你想要的是db.users.findOne({"username" : {$regex : "son"}});
可能想在 Mongo 2.6 中查看全文搜索
J
James Gan

由于 Mongo shell 支持正则表达式,这是完全可能的。

db.users.findOne({"username" : /.*son.*/});

如果我们希望查询不区分大小写,我们可以使用“i”选项,如下所示:

db.users.findOne({"username" : /.*son.*/i});

请参阅:http://www.mongodb.org/display/DOCS/Advanced+Queries#AdvancedQueries-RegularExpressions


请包含一个代码片段,演示如何使用正则表达式进行搜索。答案应包含更多信息,而不仅仅是链接...
选择的答案对我不起作用,但是这个答案(我正在通过 docker exec 命令执行 mongo 查询)我认为这个应该是选择的答案,因为它看起来更通用。
就像所选答案中的评论一样,我相信 db.users.findOne({"username" : /.*son.*/}); 也可能是矫枉过正,正则表达式可能很简单 /son/
比使用 $regex 更简洁的方法
编辑它以仅使用 { username: /son/ }
Z
Zheng Kai

https://docs.mongodb.com/manual/reference/sql-comparison/

http://php.net/manual/en/mongo.sqltomongo.php

MySQL

SELECT * FROM users WHERE username LIKE "%Son%"

MongoDB

db.users.find({username:/Son/})

删除所有查询或更改它?大多数人都知道SQL,它有助于理解MongoDB
@maerics 我个人发现Zheng 包含MySQL 非常有用,因为它提供了一个参考点。
我还发现 SQL 参考相关,我认为它应该保留。
的确。 SQL 示例只是两行文本。有些人可能宁愿忽略它,而另一些人可能会从中受益,而对第一组人的成本可能远远超过对第二组人的好处。
@zhengKai 如果你想查询像儿子这样的用户名和其他值怎么办。是否可以有多个条件?例如:db.users.find({username:/Son/,/Dad/,/Mom/}) 检索所有包含“Son, dad, mom”等的用户名。
o
okoboko

从 2.4 版开始,您可以在字段上创建一个 text index 来搜索并使用 $text 运算符进行查询。

首先,创建索引:

db.users.createIndex( { "username": "text" } )

然后,搜索:

db.users.find( { $text: { $search: "son" } } )

基准(约 150K 文档):

正则表达式(其他答案)=> 5.6-6.9 秒

文本搜索 => .164-.201 秒

笔记:

一个集合只能有一个文本索引。如果要搜索任何字符串字段,可以使用通配符文本索引,例如:db.collection.createIndex( { "$**": "text" } )。

文本索引可能很大。它为插入的每个文档的每个索引字段中的每个唯一后置词包含一个索引条目。

与普通索引相比,构建文本索引需要更长的时间。

文本索引不存储有关文档中单词接近度的短语或信息。因此,当整个集合适合 RAM 时,短语查询将更有效地运行。


不,事实上文本运算符不允许执行“包含”,所以它只会返回完全匹配的单词,目前 3.0 的唯一选项是使用正则表达式,即 db.users.find( { username:/son/i } )这个查找每个包含“儿子”的用户(不区分大小写)
当您在集合中添加或删除文档时,您是否必须重新索引?
问题的标题是“包含”。全文搜索不适用于该问题。
@comeGetSome 你是对的。关于如何快速有效地做到这一点的任何更新?
N
Nitai

由于这是搜索引擎中的第一个热门搜索引擎,而且上述方法似乎都不适用于 MongoDB 3.x,因此这里有一个可以正常工作的正则表达式搜索:

db.users.find( { 'name' : { '$regex' : yourvalue, '$options' : 'i' } } )

无需创建和额外的索引等。


正则表达式需要清理。
来自谷歌,这是唯一对我有用的。从文档中,选项 i 用于“不区分大小写以匹配大小写”。
2022,正确答案。因为如果我使用 $regaxe 而不是 '$regex' Pylance 会给我错误。
嘿@Nitai 只是想问我想在正则表达式中给出 2 个值的问题。我的意思是字符串与 value1 或 value2 匹配。如何修改此查询?
@Nitai 上面的东西不适用于 url search google.com/test/test_page
P
Patthebug

如果您通过 Python 连接 MongoDB,请执行以下操作

db.users.find({"username": {'$regex' : '.*' + 'Son' + '.*'}})

您也可以使用变量名而不是 'Son' 并因此使用字符串连接。


上面的查询在 $match 运算符下不能与 url 一起使用,例如 "details.uri": { "$regex": ".*phubprod.princeton.edu/psp/phubprod.*", "$options": "一世” }
A
Anurag Misra

完成此任务的最简单方法

如果您希望查询区分大小写

db.getCollection("users").find({'username':/Son/})

如果您希望查询不区分大小写

db.getCollection("users").find({'username':/Son/i})

如何在正则表达式中使用变量?
H
Hisham

理想答案它的使用索引 i 选项用于不区分大小写

db.users.findOne({"username" : new RegExp(search_value, 'i') });

正则表达式需要清理。
t
turivishal

这应该做的工作

db.users.find({ username: { $in: [ /son/i ] } });

i 只是为了防止匹配单个字母大小写的限制。

您可以查看 MongoDB 文档中的 $regex 文档。这是一个链接:https://docs.mongodb.com/manual/reference/operator/query/regex/


T
Thanh Nhật Nguyễn

我使用此代码,它适用于搜索子字符串

db.users.find({key: { $regex: new RegExp(value, 'i')}})

b
bello hargbola

如果您需要搜索多个属性,您可以使用 $or。例如

Symbol.find(
  {
    $or: [
      { 'symbol': { '$regex': input, '$options': 'i' } },
      { 'name': { '$regex': input, '$options': 'i' } }
    ]
  }
).then((data) => {
  console.log(data)
}).catch((err) => {
  console.log(err)
})

在这里,您的搜索基于输入是否包含在符号属性或名称属性中。


K
KushalSeth

如果正则表达式在您的聚合解决方案中不起作用并且您有嵌套对象。试试这个聚合管道:(如果你的对象结构很简单,只需从下面的查询中删除其他条件):

db.user.aggregate({$match: 
     {$and:[
   {"UserObject.Personal.Status":"ACTV"},
   {"UserObject.Personal.Address.Home.Type":"HME"},
   {"UserObject.Personal.Address.Home.Value": /.*son.*/ }
   ]}}
   ) 

另一种方法是像这样直接查询:

db.user.findOne({"UserObject.Personal.Address.Home.Value": /.*son.*/ });

S
Scott Wager

如果您的正则表达式包含一个变量,请确保 escape 它。

function escapeRegExp(string) {
  return string.replace(/[.*+?^${}()|[\]\\]/g, '\\$&'); // $& means the whole matched string
}

可以这样使用

new RegExp(escapeRegExp(searchString), 'i')

或者在这样的 mongoDb 查询中

{ '$regex': escapeRegExp(searchString) }

发表了相同的评论here


F
F.H.

对于聚合框架

现场搜索

'$options': 'i' 用于不区分大小写的搜索)

db.users.aggregate([
    {
        $match: {
            'email': { '$regex': '@gmail.com', '$options': 'i' }
        }
    }
]);

完整文档搜索

(仅适用于使用 text index 索引的字段

db.articles.aggregate([
    {
        $match: { $text: { $search: 'brave new world' } }
    }
])

我如何在 URL 搜索中使用第一个选项,例如我想排除 http 协议和查询参数,google.com?id=1 在此可以忽略 http、www 和查询参数
您可以传入任何有效的正则表达式模式,请参阅 mongodb.com/docs/manual/reference/operator/query/regex
T
Tamás Polgár

如何在 RegExp 匹配中忽略 HTML 标签:

var text = '<p>The <b>tiger</b> (<i>Panthera tigris</i>) is the largest <a href="/wiki/Felidae" title="Felidae">cat</a> <a href="/wiki/Species" title="Species">species</a>, most recognizable for its pattern of dark vertical stripes on reddish-orange fur with a lighter underside. The species is classified in the genus <i><a href="/wiki/Panthera" title="Panthera">Panthera</a></i> with the <a href="/wiki/Lion" title="Lion">lion</a>, <a href="/wiki/Leopard" title="Leopard">leopard</a>, <a href="/wiki/Jaguar" title="Jaguar">jaguar</a>, and <a href="/wiki/Snow_leopard" title="Snow leopard">snow leopard</a>. It is an <a href="/wiki/Apex_predator" title="Apex predator">apex predator</a>, primarily preying on <a href="/wiki/Ungulate" title="Ungulate">ungulates</a> such as <a href="/wiki/Deer" title="Deer">deer</a> and <a href="/wiki/Bovid" class="mw-redirect" title="Bovid">bovids</a>.</p>';
var searchString = 'largest cat species';

var rx = '';
searchString.split(' ').forEach(e => {
  rx += '('+e+')((?:\\s*(?:<\/?\\w[^<>]*>)?\\s*)*)';
});

rx = new RegExp(rx, 'igm');

console.log(text.match(rx));

这可能很容易变成 MongoDB 聚合过滤器。