R语言常用函数:交集intersect、并集union、找不同setdiff、判断相同setequal的运用

在R语言进行数据分析时,经常需要找不同组间的相同和不同,以下几个函数可供使用

交集intersect

两个向量的交集,集合可以是数字、字符串等

# 两个数值向量取交集

intersect(x=1:4, y = 2:6)

# [1] 2 3 4

# 两个字符向量取交集

intersect(x=letters[1:4], y = letters[2:6])

# [1] "b" "c" "d"

# 混合向量

intersect(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))

[1] "a" "4"

1

2

3

4

5

6

7

8

9

10

11

并集union

求两个向量的并集,集合可以是任何数值类型

# 两个数值向量取并集

union(x=1:4, y = 2:6)

# [1] 1 2 3 4 5 6

# 两个字符向量取并集

union(x=letters[1:4], y = letters[2:6])

# [1] "a" "b" "c" "d" "e" "f"

# 混合向量

union(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))

[1] "a" "b" "c" "4" "2" "3"

1

2

3

4

5

6

7

8

9

10

11

找不同setdiff

求向量x与向量y中不同的元素(只取x中不同的元素)

setdiff(x, y)

x = 1:4

y = 2:6

# 找x中不同于y的元素

setdiff(x, y)

# [1] 1

# 找y中不同于x的元素

setdiff(y, x)

# [1] 5 6

1

2

3

4

5

6

7

8

判断相同setequal

x = 1:4

y = 2:6

# 判断x与y是否相同,结果为假

setequal(x, y)

# [1] FALSE

# 找y与x是否相同,结果为假

setequal(y, x)

# [1] FALSE

# 只有完全相同的才返回TRUE

y = 1:4

setequal(x, y)

# [1] TRUE