ChatGPT解决这个技术问题 Extra ChatGPT

用于 Javascript 正则表达式的转义字符串 [重复]

这个问题在这里已经有了答案:9 年前关闭。

可能重复:Javascript 中是否有 RegExp.escape 函数?

我正在尝试根据用户输入构建一个 javascript 正则表达式:

function FindString(input) {
    var reg = new RegExp('' + input + '');
    // [snip] perform search
}

但是当用户输入包含 ?* 时,regex 将无法正常工作,因为它们被解释为 regex specials。事实上,如果用户在他们的字符串中放置了不平衡的 ([,则正则表达式甚至无效。

正确转义所有特殊字符以在正则表达式中使用的 javascript 函数是什么?

Lodash 有一个 escapeRegExp 专用函数:lodash.com/docs#escapeRegExp

c
coolaj86

Short 'n Sweet(2021 年更新)

要转义 RegExp 本身:

function escapeRegExp(string) {
    return string.replace(/[.*+?^${}()|[\]\\]/g, '\\$&'); // $& means the whole matched string
}

要转义替换字符串:

function escapeReplacement(string) {
    return string.replace(/\$/g, '$$$$');
}

例子

所有转义的 RegExp 字符:

escapeRegExp("All of these should be escaped: \ ^ $ * + ? . ( ) | { } [ ]");
>>> "All of these should be escaped: \\ \^ \$ \* \+ \? \. \( \) \| \{ \} \[ \] "

查找和替换字符串:

var haystack = "I love $x!";

var needle = "$x";
var safeNeedle = escapeRegExp(needle); // "\\$x"

var replacement = "$100 bills"
var safeReplacement = escapeReplacement(replacement); // "$$100 bills"

haystack.replace(
  new RegExp(safeNeedle, 'g'),
  escapeReplacement(safeReplacement),
);
// "I love $100 bills!"

注意:以上不是原始答案;它经过编辑以显示 one from MDN。这意味着它确实与您在低于 npm,并且 not 与以下长答案中显示的内容匹配。评论现在也令人困惑。我的建议:使用上述内容,或从 MDN 获取,并忽略此答案的其余部分.-达伦,2019 年 11 月)

安装

在 npm 上以 escape-string-regexp 的形式提供

npm install --save escape-string-regexp

笔记

请参阅MDN: Javascript Guide: Regular Expressions

其他符号 (~`!@# ...) 可以转义而不会产生任何后果,但不是必须的。

.

.

.

.

测试用例:一个典型的 url

escapeRegExp("/path/to/resource.html?search=query");

>>> "\/path\/to\/resource\.html\?search=query"

长答案

如果你要使用上面的函数,至少在你的代码文档中链接到这个堆栈溢出帖子,这样它就不会看起来像疯狂的难以测试的巫术。

var escapeRegExp;

(function () {
  // Referring to the table here:
  // https://developer.mozilla.org/en/JavaScript/Reference/Global_Objects/regexp
  // these characters should be escaped
  // \ ^ $ * + ? . ( ) | { } [ ]
  // These characters only have special meaning inside of brackets
  // they do not need to be escaped, but they MAY be escaped
  // without any adverse effects (to the best of my knowledge and casual testing)
  // : ! , = 
  // my test "~!@#$%^&*(){}[]`/=?+\|-_;:'\",<.>".match(/[\#]/g)

  var specials = [
        // order matters for these
          "-"
        , "["
        , "]"
        // order doesn't matter for any of these
        , "/"
        , "{"
        , "}"
        , "("
        , ")"
        , "*"
        , "+"
        , "?"
        , "."
        , "\\"
        , "^"
        , "$"
        , "|"
      ]

      // I choose to escape every character with '\'
      // even though only some strictly require it when inside of []
    , regex = RegExp('[' + specials.join('\\') + ']', 'g')
    ;

  escapeRegExp = function (str) {
    return str.replace(regex, "\\$&");
  };

  // test escapeRegExp("/path/to/res?search=this.that")
}());

哇,好啰嗦。我更喜欢bobince's version。但是任何可以在没有不必要地逃避事情的情况下工作的东西......
为什么用'\\$&'代替。这是什么意思?对不起,我是JS新手。
@SushantGupta "\\" 添加了新的反斜杠,它转义了匹配的特殊正则表达式字符。 "$&" 是对当前模式匹配内容的反向引用,添加了原始的特殊正则表达式字符。
这些字符中的大多数不需要在字符类中进行转义。破折号和正斜杠根本不需要转义。因此,这可以简化为: return str.replace(/[[{}()*+?^$|\]\.\\]/g, "\\$&");
2016年有没有更理智的方式?