Posted in: Biology Science

用阿拉伯数字来表示生物 —— 世界上有多少物种?

作为一个科学工作者,不能老灌水。有时候也写点专业的文章吧!

虽然标题写得很大很空洞,但这个问题是无解的——因为永远有未知的物种在等着你。那么我们换一个更加实际的问题:世界上有多少已知的生物物种呢?

物种的定义

要回答这个问题,让我们先做如下假定以便于让问题简化:

  1. 物种之间要存在一定程度的生殖隔离。
    • 全世界的人(Homo sapiens)视为一个物种。
    • 狼与狗也能视为一个物种(Canis lupus),因为狼和狗之间并不存在生殖隔离。
    • 但鱼就不能视为一个物种了,太多不同的鱼了,相互之间不能交配的。🐟🦈🐠🐡
  2. 生物需要由细胞构成。病毒🦠暂时不计入,它脱离了宿主细胞就不能生存了。例如类病毒就是一个 RNA 分子,和 H2O 分子没有本质区别。

物种的学名(拉丁名)

即使不是生物专业的人,只要稍微接触过理科的,一定听说过物种的“学名”,因为是用拉丁语单词来表示,又叫拉丁名。例如:

  • 🏃 – Homo sapiens
  • 🐶/🐺 – Canis lupus
  • 🐱 – Felis catus
  • 🌾 – Oryza sativa

重名的烦恼(duplicated binomial)

很多人(甚至有些教科书)都认为一个拉丁名就能独一无二地确定一个物种,包括维基百科上也是这么说的:

二名法系统的价值体现在它的简便性和广泛性:

  • 同样的名称在所有语言中通用,避免了翻译的困难。
  • 任何的一个物种都可以明确无误的由两个单词确定。
  • 本系统已经在植物学 (始于 1753),动物学 (始于 1758) 和细菌学 (始于 1980)中广泛应用。
https://zh.wikipedia.org/wiki/二名法

事实并非如此。例如 Centropogon australis 这个名字就可以指两个不同的物种:

之所以会重名也是冤枉,因为 Centropogon australis 用来表示一种鱼的情况是在 1790 年(相当于清朝乾隆年间)由一个姓 White 的人记录的,而 Centropogon australis 用来表示一种植物的情况是在 1925 年(相当于民国年间)由一个姓 Gleason 的人记录的。那时候又没有网络,一个植物学家哪有那么容易查询所有动物的名字以确保不重名?于是为了不重名只好加上作者的姓氏和年份,即 Centropogon australis (White, 1790)(一种鱼)和 Centropogon australis (Gleason, 1925)(一种植物)。真是麻烦死了👿。关于重名的例子可参考此处。

高级分类单元也会重名

不仅是物种的“学名”会重名,高级分类单元(界门纲目科属等)的“学名”也会重名。大家熟悉的“脊椎动物”的学名叫做 Vertebrata,属于“亚门”。问题是,有一种红藻的属名也叫做 Vertebrata。这就更麻烦了!因为这些是包含了很多个不同物种的高级分类单元,不能像物种那样加上作者的名字和年份来定位。怎么办呢?

用阿拉伯数字来表示生物

有一个比较投机取巧的办法:直接用阿拉伯数字来表示!无论是物种、还是上一级的分类单元(界门纲目科属等),每个“节点”都赋予一个独一无二的阿拉伯数字串就好了,即好记而且绝对不会重名。目前比较流行的,是美国国家生物技术信息中心(National Center for Biotechnology Information,简称NCBI)的编号系统。所有物种都有一个独一无二的编号,且公布在网上可以让全世界用户免费查询和下载分析。花美国纳税人的钱造福全世界👍。例如:

  • 🏃 – Homo sapiens9606
  • 🐶/🐺 – Canis lupus – 9612
  • 🐱 – Felis catus – 9685
  • 🌾 – Oryza sativa – 4530

这种编号方法打破了动物、植物、微生物等不同学科的壁垒,所有物种一视同仁、都用数字来表示,分析统计起来也非常方便。接下来我们就来回答“世界上有多少已知的生物物种”这个问题。

让我们来计数

脊椎动物 🐶🐦🐢🐸🐟:7742

与我们人类亲缘关系最接近的是脊椎动物。脊椎动物是一个单系群1,编号是 7742。那么我们怎样才能查询出来它包括那些物种呢?这就是 NCBI 数据库厉害的地方,只要在搜索框里输入如下命令就能列出来它包含的全部物种:

"species"[Rank] AND txid7742[Organism:exp] NOT "uncultured"[Filter]

最后一个 NOT "uncultured"[Filter] 是为了排除一些不准确的条目。类似于化学里面的“混合物”。

因为 NCBI 数据库每天都在更新,所以只能列出当前查询的结果:98,420 个物种。

脊椎动物包含鱼🐟、两栖动物🐸、爬行动物🐢、鸟🐦、哺乳动物🐶等,大部分人都很熟悉,就不再科普了。

无脊椎动物 🦐🦀🐚🐌🪼🪱🕷️🐞🦋 :[33208]-[7742]

动物里面、不属于脊椎动物的就是无脊椎动物(废话!)但是请注意⚠️:无脊椎动物不是一个单系群

当然,动物(Metazoa,动物界)作为一个整体是一个单系群,编号是 33208。所以我们要用“消减法”:动物(33208)- 脊椎动物(7742)= 无脊椎动物:

"species"[Rank] AND txid33208[Organism:exp] NOT txid7742[Organism:exp] NOT "uncultured"[Filter]

当前查询的结果:977,850 个物种。

无脊椎动物包含了非常非常多的种类,根本列不完。只能列举一些常见的🦐🦀🐚🐌🪼🪱🕷️🐞🦋。物种数量这么多也是意料之中的,别忘了昆虫就是无脊椎动物的一类,“昆”就是数量繁多的意思。

因此,无脊椎动物可以定义为[33208]-[7742]2

植物 🌳🌹🌾:33090

植物(Viridiplantae,植物界)是一个单系群,编号是 33090。

"species"[Rank] AND txid33090[Organism:exp] NOT "uncultured"[Filter]

当前查询的结果:225,617 个物种。包括苔、藓、蕨类、裸子植物(松杉柏)、被子植物(有花)等,这些大家都很熟悉。

题外话:绿藻与红藻

接下来是非常令外行人莫名其妙的地方:植物界(33090) 包括绿藻(Chlorophyta,绿藻门,编号是 3041),但是不包括红藻、褐藻、硅藻等任何其他“藻类”。

确实有点不可思议,仅仅是因为颜色的不同就有嫡庶之分?确实如此。红藻和其他藻到底属于什么,后面再谈。

真菌 🍄:4751

真菌(Fungi,真菌界)是一个单系群,编号是 4751。

"species"[Rank] AND txid4751[Organism:exp] NOT "uncultured"[Filter]

当前查询的结果:180,885 个物种,包括我们熟悉的蘑菇、香菇、木耳、酵母菌、霉菌等。

原生生物:[2759]-[33208]-[33090]-[4751]

真核生物(Eukaryota,编号 2759)除了动物界(33208)、植物界(33090)和真菌界(4751)之外,剩下的可以称为“原生生物(Protists)”。和“无脊椎动物”一样,原生生物不是一个单系群。因此我们又要借助于“消减法”:真核生物(2759)- 动物界(33208)- 植物界(33090)- 真菌界(4751)= 原生生物。

"species"[Rank] AND txid2759[Organism:exp] NOT txid4751[Organism:exp] NOT txid33090[Organism:exp] NOT txid33208[Organism:exp] NOT "uncultured"[Filter]

当前查询的结果:48,623 个物种。

上面提到的红藻门(2763)就是其中一个群体。

细菌:2

细菌(Bacteria)是一个单系群,编号是 2。已经包括了蓝藻、放线菌、支原体、衣原体等微生物。

"species"[Rank] AND txid2[Organism:exp] NOT "uncultured"[Filter]

当前查询的结果:466,957个物种。

古生菌:7890

古生菌(Archaea)是一个单系群,编号是 7890。

"species"[Rank] AND txid2157[Organism:exp] NOT "uncultured"[Filter]

当前查询的结果:7,890 个物种。

汇总

我们关心的是上述分类有没有“漏掉”什么生物?汇总如下,合计一共为 2,006,242 个物种:

分类物种数目(2024年11月29日)
脊椎动物 Vertebrates98,420
无脊椎动物 Invertebrates977,850
植物 Plants225,617
真菌 Fungi180,885
原生生物 Protists48,623
细菌 Bacteria466,957
古生菌 Archaea7,890
合计2,006,242

NCBI 的数据库为有细胞的物种创建了一个节点:cellular organisms,编号是 131567,查询物种数目:

"species"[Rank] AND txid131567[Organism:exp] NOT "uncultured"[Filter]

不多不少,正好 2,006,242 个。说明以上分类没有遗漏。因此我们可以下结论:世界上已知的生物物种大约为200万种。

题外话:还有哪些类别不是单系群?

爬行动物:[1294634]+[8504]+[8459]

这可能是比较经典的例子了:爬行动物自己不是单系群,爬行动物加上鸟才是单系群,因为鸟🐦实际上是一种特殊的恐龙🦖。

爬行动物加上鸟,叫做蜥形动物(Sauropsida,编号8457),有 22,532 个物种。而鸟纲(Aves,编号8782)有 11,077 个物种。因此爬行动物的物种数 = 蜥形动物(8457) – 鸟(8782) = 22,532 – 11,077 = 11,455

爬行动物一般认为有以下三大群体。

  • 鳄鱼🐊(Crocodylia,编号1294634),有 41 种
  • 蜥蜴🦎与🐍(Lepidosauria,编号8504),有 10,937 种
  • 龟🐢(Testudines,编号8459),有 475 种

三者加起来是 11,453 种。还有 2 种是什么呢?可以当脑筋急转弯来使用3

鱼:[117565]+[117569]+[7777]+[7898]+[118072]+[7878]

鱼也不是一个单系群,但两栖动物(Amphibia,编号8292)、蜥形动物(Sauropsida,编号8457)、哺乳动物(Mammalia,编号40674)均是单系群,所以我们用消减法:

鱼的物种数 = 脊椎动物(7742)- 两栖动物(8292)- 蜥形动物(8457)- 哺乳动物(40674)= 98,420 – 13,576 – 22,532 – 9,831 = 52,481

鱼一般认为有以下六大群体。

  • 盲鳗(Myxini,编号 117565),有 81 种
  • 七鳃鳗(Hyperoartia,编号 117569),有 492 种
  • 软骨鱼类(Chondrichthyes,编号 7777),有 2,015 种
  • 硬骨鱼类(Actinopterygii,编号 7898),有 49,876 种
  • 棘鱼(Coelacanthimorpha,编号 118072),只有 2 种
  • 肺鱼(Dipnomorpha,编号 7878),有 15 种

合计正好是 52,481 种,一个不差。可见这种编号系统用来进行广域统计是非常准确的。

双子叶植物:[3398]-[4447]

被子植物分为单子叶植物和双子叶植物,这在初中生物里面就学过。有意思的是,被子植物(Magnoliopsida,编号3398,192,710种)和单子叶植物(Liliopsida,编号4447,43,229种)都是单系群,但双子叶植物不是单系群。因此:

双子叶植物 = 被子植物(3398)- 单子叶植物(4447)= 192,710 – 43,229 = 149,481

双子叶植物一般认为有以下七大群体

  • 无油樟(Amborellales,编号 261009),只有 1 种。
  • 睡莲(Nymphaeales,编号 261007),177 种。
  • 木兰藤(Austrobaileyales,编号 82956),82 种。
  • 金粟兰(Chloranthales,编号 261008),73 种。
  • 木兰类(Magnoliidae,编号 232347),5,502 种。
  • 金鱼藻(Ceratophyllales,编号 91811),8 种。
  • 真双子叶类(eudicotyledons,编号 71240),139,106 种。
真双子叶类(例如菊花类)

合计 144,949 种,还差了4,532种。这是因为还有以下四类属于真双子叶植物里面不那么“真”的部分(好拗口啊!),没有被包括在(eudicotyledons,编号 71240)内:

  • 黄杨类(Buxales,编号 280577),141种
  • 山龙眼类(Proteales,编号 232378),1,082种
  • 毛茛类(Ranunculales,编号 41768),3,229种
  • 昆栏树类(Trochodendrales,编号 400839),只有2种

现在还差 78 种,是一些已记录但未明确分类的物种:

  • Thymelaceae(编号 2695755),4种
  • 未分类的Magnoliophyta(编号 232379),73种
  • 未分类的Magnoliopsida(编号 2695920),1种

4+73+1 = 78,凑齐了。

苔藓植物:[13809]+[3208]+[3195]

分为三类:

  • 角苔(Anthocerotophyta,编号 13809)
  • 藓类(Bryophyta,编号 3208)
  • 地钱(Marchantiophyta,编号 3195)

有意思的裸子植物:1437180

裸子植物定义为种子植物中不属于被子植物的部分。本来不是单系群,因为它包括种子蕨类 (Pteridospermatophyta,很多种)和末端裸子植物(Acrogymnospermae,编号1437180)两大组。可是种子蕨类已经灭绝了,所以现在的裸子植物反而变成了一个单系群,直接使用编号1437180即可,包括松柏、银杏、苏铁、买麻藤四大类。

  1. 定义:所有成员有一个共同祖先,而且这个祖先下面不能再出现别的新成员 ↩︎
  2. 加上中括号是为了表明这个数字不代表数量 ↩︎
  3. 🦖🦕 ↩︎

Comments (9) on "用阿拉伯数字来表示生物 —— 世界上有多少物种?"

  1. Google Chrome 130.0.6723.118 Mac OS X  10.15.7

    不光这样,NCBI的genome的存放路径也设计的很科学,比如:ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/419/365/GCF_000419365.1_C_griseus_v1.0/

    其中/000/419/365/这样的9位数字的编号,每三个切开,然后多层的进行存储,使得访问文件夹以及遍历时很快,如果不分层,所有放在同一层目录下,那访问时的速度会非常的慢。

  2. Google Chrome 131.0.0.0 Windows 10 x64 Edition

    全面。
    之前认为细菌多。发现还没有无脊椎动物多.
    界、门、纲、目、科、属、种.
    光学习这个估计就学不完了。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注