测试向量是否包含给定元素

r vector r-faq

如何检查向量是否包含给定值？

有时我问自己为什么 R 不使用包含这个词来让用户更容易使用

认为“in”包含在“conta(in)s”中；我认为在这种情况下，“in”是一个相当简洁的竞争者

也许加上侧翼的 % 符号就是这样。单词 in 是 R 中用于 for 循环构造的保留字。

@greg121 dplyr 已经有一个 contains 函数，但它用于不同的目的：在数据框中选择一列。例如 select(iris, contains("etal"))。

对于给定精度的实数值，是否有一种简洁的方法？

Community

match()（返回第一次出现）和 %in%（返回布尔值）函数都是为此而设计的。

v <- c('a','b','c','e')

'b' %in% v
## returns TRUE

match('b',v)
## returns the first location of 'b', in this case: 2

如何获得所有出场，而不仅仅是第一个？

也许我来的有点晚。 which(v, 'b')。注意论点的顺序。

您的 which(v, 'b') 给了我一条错误消息：>Error in which(v, 'b') : argument to 'which' is not logical

语法是 which(v == b) 或任何其他逻辑运算符。在这种情况下， this 的返回值为 2。如果 v 是 c("b", "b", "c", "b", "d")，返回 which(v == b) 将是1、2、4。

Justin Nafe

is.element() 使代码更具可读性，并且与 %in% 相同

v <- c('a','b','c','e')

is.element('b', v)
'b' %in% v
## both return TRUE

is.element('f', v)
'f' %in% v
## both return FALSE

subv <- c('a', 'f')
subv %in% v
## returns a vector TRUE FALSE
is.element(subv, v)
## returns a vector TRUE FALSE

我知道文档说 is.element(x, y) is identical to x %in% y。但是，我不知道为什么，is.elements 在混合整数和数字时有效，而 %in% 无效

@pomber：你能举个例子吗？

@pomber 修复了吗？

is.element() 与 %in% 的优越可读性是主观的。可以使中缀运算符更具可读性，因为它消除了参数顺序的歧义。 apple in fruit 有道理，fruit in apple 没有。 is.element(apple, fruit) 或 is.element(fruit, apple) 都可能是正确的，具体取决于 is.element 函数的实现。

ishandutta2007

我将根据输出对选项进行分组。假设所有示例都使用以下向量。

v <- c('z', 'a','b','a','e')

检查存在：

％在％

> 'a' %in% v
[1] TRUE

任何（）

> any('a'==v)
[1] TRUE

is.element()

> is.element('a', v)
[1] TRUE

为了找到第一次出现：

匹配（）

> match('a', v)
[1] 2

查找所有出现作为索引向量：

哪个（）

> which('a' == v)
[1] 2 4

查找所有出现的逻辑向量：

> 'a' == v
[1] FALSE  TRUE FALSE  TRUE FALSE

编辑：出于评论中提到的原因，从列表中删除 grep() 和 grepl()

正如已经评论的 here 和 here，不要使用 grep() 或正则表达式来查找完全匹配。

Dan Goldstein

any() 函数使代码可读

> w <- c(1,2,3)
> any(w==1)
[1] TRUE

> v <- c('a','b','c')
> any(v=='b')
[1] TRUE

> any(v=='f')
[1] FALSE

请注意，这与 %in% 的行为不同：any(1==NA) 返回 NA，其中 1 %in% NA 返回 FALSE。

@user3603486：any(1==NA, na.rm=TRUE) 返回 FALSE。

ars

您可以使用 %in% 运算符：

vec <- c(1, 2, 3, 4, 5)
1 %in% vec # true
10 %in% vec # false

ah bon

还可以找到元素“which”的位置可以用作

pop <- c(3, 4, 5, 7, 13)

which(pop==13)

并找到不包含在目标向量中的元素，可以这样做：

pop <- c(1, 2, 4, 6, 10)

Tset <- c(2, 10, 7)   # Target set

pop[which(!(pop%in%Tset))]

与 match 不同，which 有时实际上更可取，因为它为您提供 all 匹配位置（作为数组）。尽管这可能不是 OP 所要求的，但与 stackoverflow.com/questions/1169388/… 不同

如果您只想查找不在 Tset 中的元素，为什么还要使用 which？您可以直接索引 pop； pop[!pop%in%Tset]

ojdajuiceman

为此，我非常喜欢 grep() 和 grepl()。

grep() 返回一个整数向量，表示匹配的位置。

yo <- c("a", "a", "b", "b", "c", "c")

grep("b", yo)
[1] 3 4

grepl() 返回一个逻辑向量，在匹配的位置带有“TRUE”。

yo <- c("a", "a", "b", "b", "c", "c")

grepl("b", yo)
[1] FALSE FALSE  TRUE  TRUE FALSE FALSE

这些函数区分大小写。

默认情况下，grep 将正则表达式作为其第一个元素，因此要对 "b" 进行完全匹配，请使用 ^e$ 或添加 , fixed=TRUE)。

不要使用正则表达式进行精确匹配。这是危险的，可能会产生意想不到的结果

是的，这是一个糟糕的、不好的、非常糟糕的主意——效率低下，而且肯定会失败。例如，即使“b”不在 myvar 中，myvar <- 'blah'; grepl('b', myvar, fixed=TRUE) 也会返回 TRUE。

Quinten

检查向量中是否存在元素的另一种方法是使用 inops package 中的 %in{}% 语法，如下所示：

library(inops)
#> 
#> Attaching package: 'inops'
#> The following object is masked from 'package:base':
#> 
#>     <<-
v <- c('a','b','c','e')
v %in{}% c("b")
#> [1] FALSE  TRUE FALSE FALSE

^{由 reprex package (v2.0.1) 于 2022 年 7 月 16 日创建}

测试向量是否包含给定元素

关注公众号

想领先一步获取最新的外包任务吗？

相似问题

平台

支持

联系我们