rWCVP入门
- 介绍
- 1. 访问到WCVP
- 1.1 方法一
- 1.2 方法二(谨慎)
 
- 2. WCVP数据筛选
- 2.1 关于按分类单元筛选的说明
- 2.2 关于按分布区域筛选的说明
 
 
- 笔者实践
介绍
世界维管植物名录(WCVP)是维管植物物种的全球共识。它提供了科学已知的> 340,000 种维管植物物种的名称、同义词、分类学和分布。
作者们开发了 rWCVP,使一些使用 WCVP 的常见任务更容易。其中包括根据WCVP标准化分类单元名称列表,获取和绘制物种分布图,以及创建在特定区域发现的分类单元清单。
1. 访问到WCVP
要使 rWCVP 中的函数正常工作,您需要有权访问 WCVP 的副本。
1.1 方法一
加载 WCVP 的一种方法是安装关联的数据包 rWCVPdata:
if (!require(rWCVPdata)) {
  install.packages("rWCVPdata",
    repos = c(
      "https://matildabrown.github.io/drat",
      "https://cloud.r-project.org"
    )
  )
}
==等待下载安装完成后,==可以看到rWCVPdata的类群和分布数据:
library(rWCVPdata)
names = rWCVPdata::wcvp_names
distribution = rWCVPdata::wcvp_distributions
rWCVPdata含有超过140万条物种信息:
 
 rWCVPdata含有超过190万条物种分布信息:
 
1.2 方法二(谨慎)
如果数据包不可用,或者您希望使用不同版本的 WCVP,则可以向此包中的主函数提供数据的本地副本。例如,要生成清单:
names <- read_csv("/path/to/wcvp_names.csv")
distributions <- read_csv("/path/to/wcvp_distributions.csv")
checklist <- wcvp_checklist("Acacia",
  taxon_rank = "genus", area_codes = "CPP",
  wcvp_names = names, wcvp_distributions = distributions
)
如果您使用的是自己的WCVP版本,请小心!WCVP 表的结构有时会因版本而异。应将 rWCVP 设置为与最新版本的 WCVP 以及共享相同结构的任何先前版本一起使用。
2. WCVP数据筛选
一些rWCVP功能涉及WCVP数据筛选,以生成特定区域中维管植物物种的列表或摘要。
这些函数接受两个用于筛选 WCVP 的参数:
- taxon:具有物种或更高物种分类等级的有效分类单元的名称(例如物种“Myrcia almasensis”,属“Myrcia”或“Myrtaceae”科)。
- area:要关注的区域的 WGSRPD 3 级代码向量。
这些参数可以在wcvp_checklist、wcvp_occ_mat和wcvp_summary中组合使用,以产生所需区域中焦点分类群的输出。例如,巴西的桃金娘科:
# filter Myrtaceae species in Brazil
checklist <- wcvp_checklist("Myrtaceae",
                            taxon_rank = "family",
                            area_codes = c("BZC", "BZN", "BZS", "BZE", "BZL")
)

2.1 关于按分类单元筛选的说明
按分类筛选时,需要使用 taxon.rank 参数告诉函数您提供的名称的分类等级
例如,生成早熟禾属的摘要表:
# summary table for Poa
wcvp_summary("Poa", taxon_rank = "genus")
ℹ No area specified. Generating global summary.
$Taxon
[1] "Poa"
$Area
[1] "the world"
$Grouping_variable
[1] "area_code_l3"
$Total_number_of_species
[1] 573
$Number_of_regionally_endemic_species
[1] 573
$Summary
# A tibble: 280 × 6
   area_code_l3 Native Endemic Introduced Extinct Total
   <chr>         <int>   <int>      <int>   <int> <int>
 1 ABT              21       0          5       0    26
 2 AFG              23       1          0       0    23
 3 AGE              13       2          5       0    18
 4 AGS              24       0         10       0    34
 5 AGW              34       8          3       0    37
 6 ALA               6       0          3       0     9
 7 ALB              17       0          0       0    17
 8 ALG               8       0          1       0    11
 9 ALT              30       3          1       0    31
10 ALU               7       0          3       0    10
# ℹ 270 more rows
# ℹ Use `print(n = ...)` to see more rows
您可以提供等级的分类单元名称 种、属、科、目或更高。 WCVP仅提供科级以下的分类信息。我们包括了一个名为taxonomic_mapping的表格,用于根据APG IV将家族映射到目和更高的分类法。
# APG Ⅳ
head(taxonomic_mapping)
       higher       order          family
1 Angiosperms    Acorales       Acoraceae
2 Angiosperms Alismatales    Alismataceae
3 Angiosperms Alismatales Aponogetonaceae
4 Angiosperms Alismatales         Araceae
5 Angiosperms Alismatales      Butomaceae
6 Angiosperms Alismatales   Cymodoceaceae
我们在后台使用此表,以便使用这些更高的分类排名进行筛选。例如,对所有禾本目进行汇总:
# summary all Poales:
wcvp_summary("Poales", taxon_rank = "order")
ℹ No area specified. Generating global summary.
$Taxon
[1] "Poales"
$Area
[1] "the world"
$Grouping_variable
[1] "area_code_l3"
$Total_number_of_species
[1] 23770
$Number_of_regionally_endemic_species
[1] 23770
$Summary
# A tibble: 368 × 6
   area_code_l3 Native Endemic Introduced Extinct Total
   <chr>         <int>   <int>      <int>   <int> <int>
 1 ABT             359       0         70       0   429
 2 AFG             485      16         15       0   504
 3 AGE             908      31        166       0  1074
 4 AGS             389      20         88       0   477
 5 AGW             890     130        105       0   995
 6 ALA             711       2        153       0   864
 7 ALB             363       4         14       0   387
 8 ALD              44       7         13       0    57
 9 ALG             445      11         41       0   497
10 ALT             383       9          6       0   389
# ℹ 358 more rows
# ℹ Use `print(n = ...)` to see more rows
2.2 关于按分布区域筛选的说明
WCVP使用世界记录植物分布地理方案(WGSRPD)在第3级列出分类单元分布。这一水平对应于“植物国家”,它们大多遵循国家的边界,除非大国被分割或省略边远地区。rWCVP 中的函数期望area作为 WGSRPD 3 级代码的向量提供。
查找您感兴趣的整个区域可能会很烦人。例如,要按巴西的物种过滤,您需要提供 5 个代码的向量。为了方便起见,rWCVP 具有将区域名称转换为 WGSRPD 3 级代码向量的功能。
# convert region to codes
get_wgsrpd3_codes("Brazil")
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
[1] "BZC" "BZE" "BZL" "BZN" "BZS"
这可以直接输入到按区域过滤 WCVP 的函数中。
wcvp_summary("Poa", taxon_rank = "genus", area = get_wgsrpd3_codes("Southern Hemisphere"))
ℹ Matches to input geography found at Hemisphere level
ℹ Including WGSRPD areas that span the equator. To turn this off, use `include_equatorial = FALSE`
$Taxon
[1] "Poa"
$Area
[1] "Southern Hemisphere (incl. equatorial Level 3 areas)"
$Grouping_variable
[1] "area_code_l3"
$Total_number_of_species
[1] 264
$Number_of_regionally_endemic_species
[1] 237
$Summary
# A tibble: 74 × 6
   area_code_l3 Native Endemic Introduced Extinct Total
   <chr>         <int>   <int>      <int>   <int> <int>
 1 AGE              13       2          5       0    18
 2 AGS              24       0         10       0    34
 3 AGW              34       8          3       0    37
 4 ANT               0       0          1       0     1
 5 ASC               0       0          1       0     1
 6 ASP               2       1          3       0     5
 7 ATP               8       1          3       0    11
 8 BOL              31       2          3       0    34
 9 BOR               2       1          0       0     2
10 BUR               3       0          0       0     3
# ℹ 64 more rows
# ℹ Use `print(n = ...)` to see more rows
笔者实践
m = wcvp_checklist(taxon = "Mahonia", taxon_rank = "genus")
b = wcvp_checklist(taxon = "Berberis", taxon_rank = "genus")

 
 m表示的是mahonia,b表示berberis。在WCVP中并不承认mahonia的独立属地位,将其并入berberis 中。或许在rWCVP中筛选得到berberis,再从U.Taxonstand中尝试能否将Mahonia挑选出来。



















