效率提高近百倍,山大团队AI新方法解析复杂器官空间组学,登Nature子刊
原创文章标题
Graph Fourier transform for spatial omics representation and analyses of complex organs
作者
山东大学研究团队
摘要
1. 空间组学技术通过解析复杂器官的功能组件,以细胞和亚细胞分辨率提供前所未有的见解。
2. 研究团队引入了空间图傅里叶变换 (SpaGFT),并将图信号处理应用于各种空间组学分析平台,以生成可解释的表示。
3. 该表示支持空间可变基因识别并改进基因表达推断,在分析人类和小鼠空间转录组数据方面优于现有工具,效率是现有工具的百倍。
4. SpaGFT 可以识别人类淋巴结Visium数据中 B 细胞成熟的免疫区域,并使用内部人类扁桃体CODEX数据表征次级滤泡的变化。
5. 此外,它可以无缝集成到其他机器学习框架中,将空间域识别、细胞类型注释和亚细胞特征推断的准确性提高多达 40%。
6. 值得注意的是,SpaGFT 在高分辨率空间蛋白质组学数据中检测稀有亚细胞器。这为探索组织生物学和功能提供了一种可解释的图形表示方法。
空间组学技术- 通过细胞和基因为中心的方法,全面解析组织分子景观。
- 经典细胞为中心方法:研究细胞组成和互动。
- 经典基于基因的方法:关注基因表达的空间变异性。
基于图的方法
- 整合细胞和基因视角,用节点表示细胞,边表示空间或功能联系。
- 图信号编码分子特征,提升分析可解释性。
- 现有的图机器学习方法存在「黑箱」问题。
空间图傅里叶变换 (SpaGFT)
- 分析特征表示方法,用于编码平滑图信号。
- 将图形信号处理技术与空间组学数据连接起来。
- 支持下游分析,促进生物学发现。 图示:SpaGFT 用于空间组学表示的架构。(来源:论文)
功能与性能
SpaGFT 框架提供了图信号转换和七个下游任务:
- SVG 识别
- 基因表达归纳
- 蛋白质信号去噪
- 空间域表征
- 细胞类型注释
- 细胞斑点比对
- 亚细胞界标推断
它消除了对预定义表达模式的需求,并显著提高了计算效率,这在 31 个人/小鼠 Visium 和 Slide-seq V2 数据集的基准测试中得到了证明。
SpaGFT 在识别 SVG 方面的表现优于其他工具,效率是其他工具的百倍。研究人员还强调了他们手动整理的 458 个小鼠和人类大脑基因作为接近优化的标准 SVG。
图示:SVG 识别和空间组学特征归纳的性能。(来源:论文)这将带来基于真实人/鼠数据的替代评估指标,它是对基于模拟的评估方法的补充,例如 BSP60、SPARK-X、SpatialDE、SPARK、scGCO 和其他基准测试工作。
此外,实施低通滤波器和逆 GFT 可以有效地推断低表达基因表达并去除高噪声蛋白质强度,从而实现更精确的空间域预测,如人类背外侧前额叶皮质所展示的那样。
值得注意的是,SpaGFT 通过实现更准确的机器学习预测,促进了空间组学数据的解释。
它在空间域识别的准确性、从细胞类型到斑点的注释转移的较低错误、细胞到斑点比对的正确性以及亚细胞标志推断的验证损失方面显著提高了现有框架的性能 8-40%。
价值与意义
从计算的角度看,SpaGFT 和 scGCO 是空间组学数据分析的两种图形表示方法,前者侧重于组学特征表示,后者侧重于 SVG 检测。scGCO 采用图切割的方法对组织进行分割,并比较分割与基因表达之间的一致性,以支持 SVG 检测。
SpaGFT 使用图傅里叶变换来寻找新的潜在空间来表示基因表达并实现各种下游任务,包括但不限于 SVG 识别、基因表达增强和功能组织单元推断。
此外,将 SpaGFT 应用到现有的可解释空间多模态框架(如 UnitedNet、MUSE 和 modalities-autoencoder)中也具有很好的潜力。
以 UnitedNet 为例,它采用可解释的机器学习技术来剖析训练有素的网络并量化不同模式下特征的相关性,特别是研究特定于细胞类型的关系。
SpaGFT 在空间组学分析中的应用简介
SpaGFT 是一种针对三个以细胞为中心的工具实现的空间组学分析方法,如图示所示。它由四列组成,每列对应空间组学分析、计算公式、优化示例工具中的 FC 实现以及性能评估。(来源:论文)
应用
为了增强 UnitedNet 的空间洞察力,SpaGFT 可以提供 (1) 增强特征和 (2) 可解释的正则化器。
- 增强特征:SpaGFT 可计算顶点域中的细胞-细胞关系,将其转换为 FC。FC 可编码和量化细胞-细胞变异模式,作为 UnitedNet 的输入之一。
- 可解释的正则化器:将扩散熵引入 UnitedNet 的重建损失函数中,以利用其编码器-解码器结构。通过正则化特征熵,UnitedNet 可学习低频信号的空间组织区域,有助于表征复杂的生物结构和识别稀有的亚细胞器。
提升空间
尽管 SpaGFT 已取得进展,但仍有提升空间:
- 多频信号解释:目前仅关注低频信号,未来需考虑中高频信号。
- 计算复杂度优化:使用快速傅里叶变换算法可将复杂度从 O(n^2) 降至 O(n×log(n))。
- 点图和 FTU 拓扑变化:不同样本的点图和 FTU 拓扑不同,导致 FC 无法比较。可使用机器学习框架或 H&E 图像作为共同参考进行嵌入和对齐。
- 自动化功能对象检测:SpaGFT 目前依赖专家知识预选功能区域。未来可开发基于 SpaGFT 特征表示的拓扑学习框架,自动检测和分割功能对象。图示:向 CAMPA 实施 FC 的案例。(来源:论文)
总的来说,该研究的价值在于为空间组学建模中可解释的人工智能带来另一种视角,包括多分辨率空间组学数据集成和跨时空数据的模式分析。
相关报道:
https://www.nature.com/articles/s41467-024-51590-5
以上就是效率提高近百倍,山大团队AI新方法解析复杂器官空间组学,登Nature子刊的详细内容,更多请关注IT视界其它相关文章!