AI正在绘制大脑的“细胞社区地图”

房地产经纪人常说，买房最关键的因素是“地段、地段、地段”。在神经科学领域，也存在一种类似的核心观点：“位置几乎决定了一切。”神经科学家博西利卡·塔西奇（Boscica Tasic）将自己形容为一名“生物制图师”，她指出，大脑中不同区域的位置与功能之间存在极其紧密的关系。一次脑损伤可能导致记忆缺失，而另一次损伤则可能影响人格结构。如果缺乏一张清晰的大脑地图，神经科学家和临床医生往往会陷入迷茫。

过去一个多世纪以来，研究人员一直在尝试绘制大脑的结构图谱。早期方法主要依赖显微镜观察细胞形态，通过识别细胞排列与密度的差异，绘制出色彩丰富的大脑分区图，并尝试将这些区域与特定功能联系起来。近年来，随着技术进步，科学家开始能够以“单细胞”为单位进行分析，并通过基因表达活动来定义每一个细胞的身份。然而，即便如此精细的分析，大脑图谱依然显得不完整、碎片化甚至彼此矛盾。例如，一些较大的脑区被发现同时参与多种功能，这使得科学家怀疑这些区域实际上可能还可以进一步细分为更小、功能更专一的单元。目前，将庞大的基因数据转化为清晰的细胞空间结构，仍然是一项极具挑战性的任务。

最近，艾伦脑科学研究所（Allen Institute for Brain Science）的神经科学家兼基因组学专家塔西奇及其团队，引入了人工智能技术来协助大脑制图工作。他们收集了来自五只小鼠大脑的遗传数据，共计超过1040万个细胞，每个细胞包含数百个基因表达信息，并将这些数据输入定制的机器学习模型进行分析。这一系统生成了一幅极其精细的“大脑邻域地图”，不仅包含已知的脑区划分，还揭示了此前从未被识别的新结构。研究人员认为，这种精度的人脑或动物脑地图，是人类研究者在可预见的时间内难以手工完成的。

该研究成果发表于《自然通讯》（Nature Communications）。通过这种方法，科学家们得以从单细胞RNA数据中重建大脑组织结构，并进一步理解不同细胞类型之间的空间关系与功能分布。研究人员表示，他们的目标是最终将这一方法扩展到其他动物，甚至是人类大脑，从而提出并验证关于大脑功能与疾病机制的新假设。

哥伦比亚大学神经科学家克劳迪娅·多伊格（Claudia Doig）评论指出：“我们必须理解细胞在三维空间中的组织方式，只有这样，才能真正理解它们如何协同工作。”

大脑映射（brain mapping）本身是一门历史悠久的学科，其起源可以追溯到20世纪初。德国神经科学家科尔比尼安·布罗德曼（Korbinian Brodmann）曾通过染色技术研究大脑切片，根据细胞结构差异划分出52个脑区，其中一些至今仍被广泛使用。这些早期工作奠定了现代脑图谱研究的基础。

长期以来，大脑制图的方法进展缓慢，甚至在很长一段时间里仍依赖“经验划线”式的人工标注。科学家在脑图像上手动勾画边界，这种方法虽然有效，但不可避免地带有主观性。例如，在艾伦小鼠大脑参考坐标框架（Allen Mouse Brain Common Coordinate Framework）等早期大型项目中，部分脑区的划分仍然依赖资深研究人员的经验判断。

随着分子生物学的发展，科学家开始能够通过单细胞RNA测序技术分析每个细胞的基因表达谱，从而识别细胞类型。这种方法可以将细胞中活跃的基因表达模式转化为“身份标签”，使研究者能够在更高分辨率下重建大脑结构。近年来，这种技术已经识别出数千种不同的脑细胞类型，远远超过传统认知。

例如，在2023年发布的艾伦脑小鼠细胞图谱中，科学家已经识别出超过5000种细胞类型。而初步的人类细胞图谱也基于数百万个细胞样本，定义了超过3000种细胞类型。然而，这些庞大的数据集并未自然生成清晰的“功能分区图”，因为大脑区域并不由单一细胞类型构成，而是由多种细胞混合组成，不同细胞类型也可能跨区域分布。

因此，仅仅依靠细胞分类并不能准确重建大脑的空间结构。研究人员开始意识到，要理解大脑，必须同时考虑“细胞类型”和“空间组织”之间的关系。就像从飞机上俯瞰城市，仅仅观察单栋建筑无法理解城市结构，必须结合建筑类型的分布规律，才能识别不同社区的边界与功能。

正是在这一背景下，塔西奇团队与加州大学旧金山分校的计算神经科学家雷扎·阿巴西-阿斯尔（Reza Abbasi-Asl）展开合作。他们希望借助人工智能来破解这一复杂问题。

阿巴西-阿斯尔与研究生Alex Lee开发了一种名为“CellTransformer”的机器学习模型。他们从小鼠大脑的数百万细胞RNA数据出发，训练模型去预测被隐藏身份的细胞类型。模型会根据周围细胞的基因表达模式进行推断，并不断通过误差反馈进行优化。经过数百万次迭代训练，系统逐渐学会识别不同细胞如何在空间中聚集，从而构建出高分辨率的大脑“邻域地图”。

在这一模型中，算法并不是孤立分析单个细胞，而是重点学习“邻近关系”。换句话说，它不仅关注细胞本身的特征，还学习它周围细胞的组合方式。这种方法类似于观察城市时遮住一栋建筑，再根据周围街区判断其性质。

阿巴西-阿斯尔认为，这种基于“邻域关系”的建模方式是关键所在，它使得算法能够识别出具有生物学意义的细胞群落结构。根据研究需求不同，该模型可以将小鼠大脑划分为从25个到1300个不同的细胞邻域。

塔西奇表示，通过人工智能技术，他们看到了人类肉眼无法识别的结构层级，这为理解大脑提供了全新的视角。

在对五只小鼠大脑的独立数据测试中，CellTransformer都生成了高度一致的结果，无论是雄性还是雌性，无论是不同切片方向的数据，都表现出良好的稳定性。这也证明了该方法的可靠性。

虽然该模型能够通过学习进行空间分组，但它并不会“创造”不存在的结构，因此不同于生成式AI的“幻觉问题”。不过，将其结果与传统脑图进行对照仍然至关重要。研究团队将其与艾伦小鼠脑参考图谱进行比较，发现两者在主要结构上高度一致，例如大脑皮层分层结构等。

同时，该模型还识别出一些此前未被注意到的细分区域。例如在纹状体（striatum）区域，传统观点认为它是一个相对统一的结构，但CellTransformer显示它实际上由多个功能不同的子区域组成，这些子区域在细胞组成与基因表达上存在明显差异。

这些发现得到了部分独立研究的支持。例如2016年的连接组研究也曾从不同技术路径推测过类似的细分结构。这意味着，不同方法正在逐渐趋向同一结论：大脑远比传统地图所展示的更加复杂。

一些神经科学家认为，这种更精细的结构划分，甚至可能帮助解决长期以来关于“同一脑区为何承担多种功能”的争议，因为这些功能可能实际上来自不同的子区域。

研究人员在脑干等较少被研究的区域也发现了新的“细胞邻域”，例如中脑网状结构中被划分出多个此前未识别的亚区域，每个区域都具有独特的细胞组合和基因表达模式。

不过，目前这些新发现仍处于初步阶段，大量区域仍需进一步实验验证。科学家计划通过激活或抑制特定细胞区域来观察行为变化，从而验证其功能。

塔西奇表示，大脑图谱的意义不仅在于“画出地图”，更在于利用这些地图提出可验证的科学假设。随着技术发展，这些方法最终有望扩展到人类大脑研究。

然而，目前人类大脑数据仍然远远不足以支撑同等精度的分析。相比小鼠约1亿个细胞，人类大脑约有1700亿个细胞，数据规模差距巨大。未来如果能够获得足够完整的人脑单细胞数据，类似CellTransformer的模型或许也能绘制出人类大脑的精细结构图。

研究团队还计划将连接追踪等其他技术整合进模型中，以获得更全面的脑结构图谱，这类似于在城市地图中同时加入道路与交通网络信息。

最终，这类研究不仅可能改变我们对大脑的理解，也可能扩展到肾脏、心脏等其他器官的细胞结构研究，用于比较健康与疾病状态下的组织差异。

多位科学家认为，人工智能将在这一领域扮演越来越重要的角色。正如一位研究者所说：“人类无法独自完成如此复杂的地图绘制工作，人工智能将显著加速这一进程。”

本文译自：quantamagazine（编译 / 整理：olaola）

封面图片：unsplash/shawn day