# 单细胞转录组数据分析入门 - 0 - 简介
单细胞转录组学(Single-cell RNA sequencing,scRNA-seq)是近年生命科学研究中的热门领域。它为解析复杂生物系统提供了高分辨率,用于揭示细胞异质性和基因表达调控的微妙差异。本篇介绍单细胞转录组学的基本概念、技术发展和主要应用场景。
# 什么是单细胞转录组
传统的转录组学研究通常以细胞群体为研究对象,得到的是 “平均值” 表达水平,无法区分不同细胞亚群的差异。
而单细胞转录组学通过单细胞水平的数据捕获,每个细胞的数据独立生成,能够揭示细胞间的异质性。
单细胞转录组学的核心目标是:
- 揭示细胞异质性: 识别组织中不同类型的细胞及其功能。
- 解析细胞状态: 分析细胞在不同生理或病理条件下的状态变化。
- 构建细胞图谱: 建立复杂组织或器官中细胞的全面表达图谱。
- 追踪发育轨迹: 解析细胞从未分化状态到特定功能状态的动态变化。
# 单细胞转录组技术的发展
单细胞转录组技术经历了快速发展,主要技术包括:
- Smart-seq 系列:
- 基于全长转录本测序(Full-length Transcript Sequencing)。
- 优点:能够捕获完整转录本信息。
- 缺点:测序深度高、成本较高。
- 10X Genomics 平台:
- 基于微液滴技术进行高通量测序。
- 优点:通量高、成本较低。
- 缺点:数据稀疏,只能捕获转录本的 3' 或 5' 端。
- 微流控技术:
- 通过微流体芯片实现单细胞捕获和扩增。
- 应用场景:中小规模实验中实现单细胞捕获。
- 空间转录组学:
- 融合单细胞数据与空间信息,揭示细胞在组织中的空间分布。
目前最流行的技术是 10X Genomics。
# 与传统的转录组数据相比
与传统的转录组数据相比,单细胞转录组数据具有以下特点:
- 高维稀疏性: 仅少数基因在单个细胞中有显著表达。
- 噪声高: 数据中含有更多技术噪声和背景干扰。
- 批次效应显著: 不同实验批次间差异较大,需特殊处理。
- 数量庞大: 通常包括数千到数百万个细胞的基因表达数据。
这些特点使单细胞数据分析具有很大的挑战性,同时也催生了许多专业的分析工具和算法。
# 主要应用
- 组织细胞图谱绘制:
- 如《人体细胞图谱计划》(Human Cell Atlas),旨在建立覆盖全身各器官的细胞图谱。人类细胞图谱 (HCA) 联盟成立于 2016 年,旨在创建人体细胞的全面生物图谱。目前,HCA 正进入数据整合阶段(截至本文编写时间,2025 年 1 月 13 日),致力于汇编该图谱的初稿,重点关注 18 个生物网络图谱。为了实现这一里程碑,他们汇编了一系列论文,重点介绍了这一新阶段的重要成就。可以在此处查看。
- 疾病机制研究:
- 分析肿瘤微环境中的免疫细胞组成,揭示癌症发生机制。
- 研究自体免疫疾病中细胞异质性。
- 细胞分化与发育研究:
- 重建胚胎发育过程中细胞分化的时间轨迹。
- 新型疗法开发:
- 在 CAR-T 疗法研究中,追踪免疫细胞的动态变化。