AI正在绘制大脑的“细胞社区地图”

房地产经纪人常说,买房最关键的因素是“地段、地段、地段”。在神经科学领域,也存在一种类似的核心观点:“位置几乎决定了一切。”神经科学家博西利卡·塔西奇(Boscica Tasic)将自己形容为一名“生物制图师”,她指出,大脑中不同区域的位置与功能之间存在极其紧密的关系。一次脑损伤可能导致记忆缺失,而另一次损伤则可能影响人格结构。如果缺乏一张清晰的大脑地图,神经科学家和临床医生往往会陷入迷茫。

过去一个多世纪以来,研究人员一直在尝试绘制大脑的结构图谱。早期方法主要依赖显微镜观察细胞形态,通过识别细胞排列与密度的差异,绘制出色彩丰富的大脑分区图,并尝试将这些区域与特定功能联系起来。近年来,随着技术进步,科学家开始能够以“单细胞”为单位进行分析,并通过基因表达活动来定义每一个细胞的身份。然而,即便如此精细的分析,大脑图谱依然显得不完整、碎片化甚至彼此矛盾。例如,一些较大的脑区被发现同时参与多种功能,这使得科学家怀疑这些区域实际上可能还可以进一步细分为更小、功能更专一的单元。目前,将庞大的基因数据转化为清晰的细胞空间结构,仍然是一项极具挑战性的任务。

最近,艾伦脑科学研究所(Allen Institute for Brain Science)的神经科学家兼基因组学专家塔西奇及其团队,引入了人工智能技术来协助大脑制图工作。他们收集了来自五只小鼠大脑的遗传数据,共计超过1040万个细胞,每个细胞包含数百个基因表达信息,并将这些数据输入定制的机器学习模型进行分析。这一系统生成了一幅极其精细的“大脑邻域地图”,不仅包含已知的脑区划分,还揭示了此前从未被识别的新结构。研究人员认为,这种精度的人脑或动物脑地图,是人类研究者在可预见的时间内难以手工完成的。

该研究成果发表于《自然通讯》(Nature Communications)。通过这种方法,科学家们得以从单细胞RNA数据中重建大脑组织结构,并进一步理解不同细胞类型之间的空间关系与功能分布。研究人员表示,他们的目标是最终将这一方法扩展到其他动物,甚至是人类大脑,从而提出并验证关于大脑功能与疾病机制的新假设。

哥伦比亚大学神经科学家克劳迪娅·多伊格(Claudia Doig)评论指出:“我们必须理解细胞在三维空间中的组织方式,只有这样,才能真正理解它们如何协同工作。”

大脑映射(brain mapping)本身是一门历史悠久的学科,其起源可以追溯到20世纪初。德国神经科学家科尔比尼安·布罗德曼(Korbinian Brodmann)曾通过染色技术研究大脑切片,根据细胞结构差异划分出52个脑区,其中一些至今仍被广泛使用。这些早期工作奠定了现代脑图谱研究的基础。

长期以来,大脑制图的方法进展缓慢,甚至在很长一段时间里仍依赖“经验划线”式的人工标注。科学家在脑图像上手动勾画边界,这种方法虽然有效,但不可避免地带有主观性。例如,在艾伦小鼠大脑参考坐标框架(Allen Mouse Brain Common Coordinate Framework)等早期大型项目中,部分脑区的划分仍然依赖资深研究人员的经验判断。

随着分子生物学的发展,科学家开始能够通过单细胞RNA测序技术分析每个细胞的基因表达谱,从而识别细胞类型。这种方法可以将细胞中活跃的基因表达模式转化为“身份标签”,使研究者能够在更高分辨率下重建大脑结构。近年来,这种技术已经识别出数千种不同的脑细胞类型,远远超过传统认知。

例如,在2023年发布的艾伦脑小鼠细胞图谱中,科学家已经识别出超过5000种细胞类型。而初步的人类细胞图谱也基于数百万个细胞样本,定义了超过3000种细胞类型。然而,这些庞大的数据集并未自然生成清晰的“功能分区图”,因为大脑区域并不由单一细胞类型构成,而是由多种细胞混合组成,不同细胞类型也可能跨区域分布。

因此,仅仅依靠细胞分类并不能准确重建大脑的空间结构。研究人员开始意识到,要理解大脑,必须同时考虑“细胞类型”和“空间组织”之间的关系。就像从飞机上俯瞰城市,仅仅观察单栋建筑无法理解城市结构,必须结合建筑类型的分布规律,才能识别不同社区的边界与功能。

正是在这一背景下,塔西奇团队与加州大学旧金山分校的计算神经科学家雷扎·阿巴西-阿斯尔(Reza Abbasi-Asl)展开合作。他们希望借助人工智能来破解这一复杂问题。

阿巴西-阿斯尔与研究生Alex Lee开发了一种名为“CellTransformer”的机器学习模型。他们从小鼠大脑的数百万细胞RNA数据出发,训练模型去预测被隐藏身份的细胞类型。模型会根据周围细胞的基因表达模式进行推断,并不断通过误差反馈进行优化。经过数百万次迭代训练,系统逐渐学会识别不同细胞如何在空间中聚集,从而构建出高分辨率的大脑“邻域地图”。

在这一模型中,算法并不是孤立分析单个细胞,而是重点学习“邻近关系”。换句话说,它不仅关注细胞本身的特征,还学习它周围细胞的组合方式。这种方法类似于观察城市时遮住一栋建筑,再根据周围街区判断其性质。

阿巴西-阿斯尔认为,这种基于“邻域关系”的建模方式是关键所在,它使得算法能够识别出具有生物学意义的细胞群落结构。根据研究需求不同,该模型可以将小鼠大脑划分为从25个到1300个不同的细胞邻域。

塔西奇表示,通过人工智能技术,他们看到了人类肉眼无法识别的结构层级,这为理解大脑提供了全新的视角。

在对五只小鼠大脑的独立数据测试中,CellTransformer都生成了高度一致的结果,无论是雄性还是雌性,无论是不同切片方向的数据,都表现出良好的稳定性。这也证明了该方法的可靠性。

虽然该模型能够通过学习进行空间分组,但它并不会“创造”不存在的结构,因此不同于生成式AI的“幻觉问题”。不过,将其结果与传统脑图进行对照仍然至关重要。研究团队将其与艾伦小鼠脑参考图谱进行比较,发现两者在主要结构上高度一致,例如大脑皮层分层结构等。

同时,该模型还识别出一些此前未被注意到的细分区域。例如在纹状体(striatum)区域,传统观点认为它是一个相对统一的结构,但CellTransformer显示它实际上由多个功能不同的子区域组成,这些子区域在细胞组成与基因表达上存在明显差异。

这些发现得到了部分独立研究的支持。例如2016年的连接组研究也曾从不同技术路径推测过类似的细分结构。这意味着,不同方法正在逐渐趋向同一结论:大脑远比传统地图所展示的更加复杂。

一些神经科学家认为,这种更精细的结构划分,甚至可能帮助解决长期以来关于“同一脑区为何承担多种功能”的争议,因为这些功能可能实际上来自不同的子区域。

研究人员在脑干等较少被研究的区域也发现了新的“细胞邻域”,例如中脑网状结构中被划分出多个此前未识别的亚区域,每个区域都具有独特的细胞组合和基因表达模式。

不过,目前这些新发现仍处于初步阶段,大量区域仍需进一步实验验证。科学家计划通过激活或抑制特定细胞区域来观察行为变化,从而验证其功能。

塔西奇表示,大脑图谱的意义不仅在于“画出地图”,更在于利用这些地图提出可验证的科学假设。随着技术发展,这些方法最终有望扩展到人类大脑研究。

然而,目前人类大脑数据仍然远远不足以支撑同等精度的分析。相比小鼠约1亿个细胞,人类大脑约有1700亿个细胞,数据规模差距巨大。未来如果能够获得足够完整的人脑单细胞数据,类似CellTransformer的模型或许也能绘制出人类大脑的精细结构图。

研究团队还计划将连接追踪等其他技术整合进模型中,以获得更全面的脑结构图谱,这类似于在城市地图中同时加入道路与交通网络信息。

最终,这类研究不仅可能改变我们对大脑的理解,也可能扩展到肾脏、心脏等其他器官的细胞结构研究,用于比较健康与疾病状态下的组织差异。

多位科学家认为,人工智能将在这一领域扮演越来越重要的角色。正如一位研究者所说:“人类无法独自完成如此复杂的地图绘制工作,人工智能将显著加速这一进程。”

本文译自:quantamagazine(编译 / 整理:olaola

封面图片:unsplash/shawn day