作为一个科学工作者,不能老灌水。有时候也写点专业的文章吧!
虽然标题写得很大很空洞,但这个问题是无解的——因为永远有未知的物种在等着你。那么我们换一个更加实际的问题:世界上有多少已知的生物物种呢?
物种的定义
要回答这个问题,让我们先做如下假定以便于让问题简化:
- 物种之间要存在一定程度的生殖隔离。
- 全世界的人(Homo sapiens)视为一个物种。
- 狼与狗也能视为一个物种(Canis lupus),因为狼和狗之间并不存在生殖隔离。
- 但鱼就不能视为一个物种了,太多不同的鱼了,相互之间不能交配的。🐟🦈🐠🐡
- 生物需要由细胞构成。病毒🦠暂时不计入,它脱离了宿主细胞就不能生存了。例如类病毒就是一个 RNA 分子,和 H2O 分子没有本质区别。
物种的学名(拉丁名)
即使不是生物专业的人,只要稍微接触过理科的,一定听说过物种的“学名”,因为是用拉丁语单词来表示,又叫拉丁名。例如:
- 🏃 – Homo sapiens
- 🐶/🐺 – Canis lupus
- 🐱 – Felis catus
- 🌾 – Oryza sativa
重名的烦恼(duplicated binomial)
很多人(甚至有些教科书)都认为一个拉丁名就能独一无二地确定一个物种,包括维基百科上也是这么说的:
二名法系统的价值体现在它的简便性和广泛性:
https://zh.wikipedia.org/wiki/二名法
- 同样的名称在所有语言中通用,避免了翻译的困难。
- 任何的一个物种都可以明确无误的由两个单词确定。
- 本系统已经在植物学 (始于 1753),动物学 (始于 1758) 和细菌学 (始于 1980)中广泛应用。
事实并非如此。例如 Centropogon australis 这个名字就可以指两个不同的物种:
之所以会重名也是冤枉,因为 Centropogon australis 用来表示一种鱼的情况是在 1790 年(相当于清朝乾隆年间)由一个姓 White 的人记录的,而 Centropogon australis 用来表示一种植物的情况是在 1925 年(相当于民国年间)由一个姓 Gleason 的人记录的。那时候又没有网络,一个植物学家哪有那么容易查询所有动物的名字以确保不重名?于是为了不重名只好加上作者的姓氏和年份,即 Centropogon australis (White, 1790)(一种鱼)和 Centropogon australis (Gleason, 1925)(一种植物)。真是麻烦死了👿。关于重名的例子可参考此处。
高级分类单元也会重名
不仅是物种的“学名”会重名,高级分类单元(界门纲目科属等)的“学名”也会重名。大家熟悉的“脊椎动物”的学名叫做 Vertebrata,属于“亚门”。问题是,有一种红藻的属名也叫做 Vertebrata。这就更麻烦了!因为这些是包含了很多个不同物种的高级分类单元,不能像物种那样加上作者的名字和年份来定位。怎么办呢?
用阿拉伯数字来表示生物
有一个比较投机取巧的办法:直接用阿拉伯数字来表示!无论是物种、还是上一级的分类单元(界门纲目科属等),每个“节点”都赋予一个独一无二的阿拉伯数字串就好了,即好记而且绝对不会重名。目前比较流行的,是美国国家生物技术信息中心(National Center for Biotechnology Information,简称NCBI)的编号系统。所有物种都有一个独一无二的编号,且公布在网上可以让全世界用户免费查询和下载分析。花美国纳税人的钱造福全世界👍。例如:
- 🏃 – Homo sapiens – 9606
- 🐶/🐺 – Canis lupus – 9612
- 🐱 – Felis catus – 9685
- 🌾 – Oryza sativa – 4530
这种编号方法打破了动物、植物、微生物等不同学科的壁垒,所有物种一视同仁、都用数字来表示,分析统计起来也非常方便。接下来我们就来回答“世界上有多少已知的生物物种”这个问题。
让我们来计数
脊椎动物 🐶🐦🐢🐸🐟:7742
与我们人类亲缘关系最接近的是脊椎动物。脊椎动物是一个单系群1,编号是 7742。那么我们怎样才能查询出来它包括那些物种呢?这就是 NCBI 数据库厉害的地方,只要在搜索框里输入如下命令就能列出来它包含的全部物种:
"species"[Rank] AND txid7742[Organism:exp] NOT "uncultured"[Filter]
最后一个 NOT "uncultured"[Filter]
是为了排除一些不准确的条目。类似于化学里面的“混合物”。
因为 NCBI 数据库每天都在更新,所以只能列出当前查询的结果:98,420 个物种。
脊椎动物包含鱼🐟、两栖动物🐸、爬行动物🐢、鸟🐦、哺乳动物🐶等,大部分人都很熟悉,就不再科普了。
无脊椎动物 🦐🦀🐚🐌🪼🪱🕷️🐞🦋 :[33208]-[7742]
动物里面、不属于脊椎动物的就是无脊椎动物(废话!)但是请注意⚠️:无脊椎动物不是一个单系群。
当然,动物(Metazoa,动物界)作为一个整体是一个单系群,编号是 33208。所以我们要用“消减法”:动物(33208)- 脊椎动物(7742)= 无脊椎动物:
"species"[Rank] AND txid33208[Organism:exp] NOT txid7742[Organism:exp] NOT "uncultured"[Filter]
当前查询的结果:977,850 个物种。
无脊椎动物包含了非常非常多的种类,根本列不完。只能列举一些常见的🦐🦀🐚🐌🪼🪱🕷️🐞🦋。物种数量这么多也是意料之中的,别忘了昆虫就是无脊椎动物的一类,“昆”就是数量繁多的意思。
因此,无脊椎动物可以定义为[33208]-[7742]2。
植物 🌳🌹🌾:33090
植物(Viridiplantae,植物界)是一个单系群,编号是 33090。
"species"[Rank] AND txid33090[Organism:exp] NOT "uncultured"[Filter]
当前查询的结果:225,617 个物种。包括苔、藓、蕨类、裸子植物(松杉柏)、被子植物(有花)等,这些大家都很熟悉。
题外话:绿藻与红藻
接下来是非常令外行人莫名其妙的地方:植物界(33090) 包括绿藻(Chlorophyta,绿藻门,编号是 3041),但是不包括红藻、褐藻、硅藻等任何其他“藻类”。
确实有点不可思议,仅仅是因为颜色的不同就有嫡庶之分?确实如此。红藻和其他藻到底属于什么,后面再谈。
真菌 🍄:4751
真菌(Fungi,真菌界)是一个单系群,编号是 4751。
"species"[Rank] AND txid4751[Organism:exp] NOT "uncultured"[Filter]
当前查询的结果:180,885 个物种,包括我们熟悉的蘑菇、香菇、木耳、酵母菌、霉菌等。
原生生物:[2759]-[33208]-[33090]-[4751]
真核生物(Eukaryota,编号 2759)除了动物界(33208)、植物界(33090)和真菌界(4751)之外,剩下的可以称为“原生生物(Protists)”。和“无脊椎动物”一样,原生生物不是一个单系群。因此我们又要借助于“消减法”:真核生物(2759)- 动物界(33208)- 植物界(33090)- 真菌界(4751)= 原生生物。
"species"[Rank] AND txid2759[Organism:exp] NOT txid4751[Organism:exp] NOT txid33090[Organism:exp] NOT txid33208[Organism:exp] NOT "uncultured"[Filter]
当前查询的结果:48,623 个物种。
上面提到的红藻门(2763)就是其中一个群体。
细菌:2
细菌(Bacteria)是一个单系群,编号是 2。已经包括了蓝藻、放线菌、支原体、衣原体等微生物。
"species"[Rank] AND txid2[Organism:exp] NOT "uncultured"[Filter]
当前查询的结果:466,957个物种。
古生菌:7890
古生菌(Archaea)是一个单系群,编号是 7890。
"species"[Rank] AND txid2157[Organism:exp] NOT "uncultured"[Filter]
当前查询的结果:7,890 个物种。
汇总
我们关心的是上述分类有没有“漏掉”什么生物?汇总如下,合计一共为 2,006,242 个物种:
分类 | 物种数目(2024年11月29日) |
---|---|
脊椎动物 Vertebrates | 98,420 |
无脊椎动物 Invertebrates | 977,850 |
植物 Plants | 225,617 |
真菌 Fungi | 180,885 |
原生生物 Protists | 48,623 |
细菌 Bacteria | 466,957 |
古生菌 Archaea | 7,890 |
合计 | 2,006,242 |
NCBI 的数据库为有细胞的物种创建了一个节点:cellular organisms,编号是 131567,查询物种数目:
"species"[Rank] AND txid131567[Organism:exp] NOT "uncultured"[Filter]
不多不少,正好 2,006,242 个。说明以上分类没有遗漏。因此我们可以下结论:世界上已知的生物物种大约为200万种。
题外话:还有哪些类别不是单系群?
爬行动物:[1294634]+[8504]+[8459]
这可能是比较经典的例子了:爬行动物自己不是单系群,爬行动物加上鸟才是单系群,因为鸟🐦实际上是一种特殊的恐龙🦖。
爬行动物加上鸟,叫做蜥形动物(Sauropsida,编号8457),有 22,532 个物种。而鸟纲(Aves,编号8782)有 11,077 个物种。因此爬行动物的物种数 = 蜥形动物(8457) – 鸟(8782) = 22,532 – 11,077 = 11,455
爬行动物一般认为有以下三大群体。
- 鳄鱼🐊(Crocodylia,编号1294634),有 41 种
- 蜥蜴🦎与🐍(Lepidosauria,编号8504),有 10,937 种
- 龟🐢(Testudines,编号8459),有 475 种
三者加起来是 11,453 种。还有 2 种是什么呢?可以当脑筋急转弯来使用3。
鱼:[117565]+[117569]+[7777]+[7898]+[118072]+[7878]
鱼也不是一个单系群,但两栖动物(Amphibia,编号8292)、蜥形动物(Sauropsida,编号8457)、哺乳动物(Mammalia,编号40674)均是单系群,所以我们用消减法:
鱼的物种数 = 脊椎动物(7742)- 两栖动物(8292)- 蜥形动物(8457)- 哺乳动物(40674)= 98,420 – 13,576 – 22,532 – 9,831 = 52,481
鱼一般认为有以下六大群体。
- 盲鳗(Myxini,编号 117565),有 81 种
- 七鳃鳗(Hyperoartia,编号 117569),有 492 种
- 软骨鱼类(Chondrichthyes,编号 7777),有 2,015 种
- 硬骨鱼类(Actinopterygii,编号 7898),有 49,876 种
- 腔棘鱼(Coelacanthimorpha,编号 118072),只有 2 种
- 肺鱼(Dipnomorpha,编号 7878),有 15 种
合计正好是 52,481 种,一个不差。可见这种编号系统用来进行广域统计是非常准确的。
双子叶植物:[3398]-[4447]
被子植物分为单子叶植物和双子叶植物,这在初中生物里面就学过。有意思的是,被子植物(Magnoliopsida,编号3398,192,710种)和单子叶植物(Liliopsida,编号4447,43,229种)都是单系群,但双子叶植物不是单系群。因此:
双子叶植物 = 被子植物(3398)- 单子叶植物(4447)= 192,710 – 43,229 = 149,481 种
双子叶植物一般认为有以下七大群体。
- 无油樟(Amborellales,编号 261009),只有 1 种。
- 睡莲(Nymphaeales,编号 261007),177 种。
- 木兰藤(Austrobaileyales,编号 82956),82 种。
- 金粟兰(Chloranthales,编号 261008),73 种。
- 木兰类(Magnoliidae,编号 232347),5,502 种。
- 金鱼藻(Ceratophyllales,编号 91811),8 种。
- 真双子叶类(eudicotyledons,编号 71240),139,106 种。
合计 144,949 种,还差了4,532种。这是因为还有以下四类属于真双子叶植物里面不那么“真”的部分(好拗口啊!),没有被包括在(eudicotyledons,编号 71240)内:
- 黄杨类(Buxales,编号 280577),141种
- 山龙眼类(Proteales,编号 232378),1,082种
- 毛茛类(Ranunculales,编号 41768),3,229种
- 昆栏树类(Trochodendrales,编号 400839),只有2种
现在还差 78 种,是一些已记录但未明确分类的物种:
- Thymelaceae(编号 2695755),4种
- 未分类的Magnoliophyta(编号 232379),73种
- 未分类的Magnoliopsida(编号 2695920),1种
4+73+1 = 78,凑齐了。
苔藓植物:[13809]+[3208]+[3195]
分为三类:
- 角苔(Anthocerotophyta,编号 13809)
- 藓类(Bryophyta,编号 3208)
- 地钱(Marchantiophyta,编号 3195)
有意思的裸子植物:1437180
裸子植物定义为种子植物中不属于被子植物的部分。本来不是单系群,因为它包括种子蕨类 (Pteridospermatophyta,很多种)和末端裸子植物(Acrogymnospermae,编号1437180)两大组。可是种子蕨类已经灭绝了,所以现在的裸子植物反而变成了一个单系群,直接使用编号1437180即可,包括松柏、银杏、苏铁、买麻藤四大类。
打卡!
圖片很精美,像百科全書。
因為主要就是維基百科的圖
看完了,进我的收藏夹吧!
然后我发现画进化树的时候头都大了 😥
就一直感觉进化论不太靠谱
不光这样,NCBI的genome的存放路径也设计的很科学,比如:ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/419/365/GCF_000419365.1_C_griseus_v1.0/
其中/000/419/365/这样的9位数字的编号,每三个切开,然后多层的进行存储,使得访问文件夹以及遍历时很快,如果不分层,所有放在同一层目录下,那访问时的速度会非常的慢。
确实这是一个好方法
全面。
之前认为细菌多。发现还没有无脊椎动物多.
界、门、纲、目、科、属、种.
光学习这个估计就学不完了。
无脊椎动物主要是昆虫多。细菌只是数量多,种类并不多。