置顶文章

7.4k7 分钟

# Hexo + ShokaX 博客搭建 参考: 官方文档 知乎用户 # 前置准备 安装 Node.js:Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境,用于构建高性能、可扩展的服务器端和网络应用程序。 Windows 用户在官网下载安装即可 Linux 用户则可以使用 nvm 来管理 Node.js 的版本,参考这个仓库 安装 Git:Git 是一个分布式版本控制系统,能够高效地处理项目的版本管理和代码协作。 Windows 用户在官网下载安装即可 Linux 用户可以直接使用 sudo apt install git 安装

文章列表

14k13 分钟

# 单细胞转录组数据分析入门 - 3-Seurat 对象详解和常用命令 Seurat 对象的数据结构是一个 S4 对象,它整合了单细胞 RNA 测序的原始数据、样本信息、分析结果等多种数据。 # 什么是 S4 对象 S4 对象是 R 语言中的一种高级面向对象编程机制,用于更复杂的对象和数据结构。相比于基础的列表(如 R 的 S3 对象),S4 对象具有更严格的规则,包括: 明确的类定义:每个 S4 对象的结构通过 setClass 定义,包含字段(slots)和类型限制。 字段和方法:通过 @ 操作符访问字段,例如 object@field 。 验证机制:对象创建时会验证字段和数据类
5.2k5 分钟

# 两种富集分析的理解 KEGG/GO 富集分析和 GSEA(基因集富集分析,Gene Set Enrichment Analysis)是两种不同但相关的分析方法,它们都有助于从基因表达数据中挖掘生物学意义,但它们的原理和使用场景有所不同。 # KEGG/GO 富集分析 KEGG/GO 富集分析是一种重要的基因功能注释和生物通路分析方法,通过统计学手段从基因列表中挖掘显著富集的功能注释(Gene Ontology, GO)或代谢通路(Kyoto Encyclopedia of Genes and Genomes, KEGG),以揭示基因表达变化的潜在生物学意义。
1.8k2 分钟

这篇文章最初写于 2020 年,题为 如何在 Ubuntu 下使用 QQ ,现在 QQ 官方已经发布了 Linux 版本,原文也由此成为时代的眼泪了...... 这些技术和技巧性的东西就是如此,有很强的时效性。5 年过去,也应当进行一些 ⌈老文翻新⌋ 了 # 基于 NoneBot2 的 QQ 机器人搭建 # 什么是 go-cqhttp go-cqhttp 是一个基于 OneBot 协议实现的高性能 QQ 协议机器人框架,使用 Go 编程语言开发,轻量、易用且跨平台,支持运行在多种环境中(如 Windows、Linux、macOS 和 Docker)。go-cqhttp 主要用于构建 QQ
17k16 分钟

# 单细胞转录组数据分析入门 - 2 - 各种格式的单细胞数据读取 单细胞转录组测序的格式可能有多种,包括单样本,多样本,10X 的标准输出文件,h5,h5ad,txt/csv/tsv 网上的教程鱼龙混杂,这使我在初次接触时晕头转向 # 10X 标准输出 这是目前比较主流的一种数据格式,对于一个样本,其包含: barcodes.tsv.gz :记录 cell id features.tsv.gz :记录 gene id matrix.mtx.gz :计数 counts 矩阵 三个文件,且命名必须与上面完全相同 直接使用 Seurat 的 Read10X() 函数
3.9k4 分钟

# 单细胞转录组数据分析入门 - 1 - 数据与分析平台 # 关于单细胞转录组数据 # 细胞与基因表达矩阵 单细胞转录组数据的核心是一个细胞与基因的表达矩阵,通常以行代表基因,列代表细胞。矩阵中的每个数值表示某个基因在某个细胞中的表达水平。这个矩阵有如下特点: 稀疏性: 多数基因的表达值为零或接近零,因为在特定细胞中只有部分基因会被活跃表达。 高维度: 单细胞实验通常包含数千个基因和数千至数百万个细胞。 # 数据来源: 测序原始数据: FASTQ 文件通过预处理(如 Cell Ranger)生成表达矩阵。 表达值单位: 包括原始 UMI 计数、归一化值(TPM、FPKM)或对数转换值。
1.5k1 分钟

# 单细胞转录组数据分析入门 - 0 - 简介 单细胞转录组学(Single-cell RNA sequencing,scRNA-seq)是近年生命科学研究中的热门领域。它为解析复杂生物系统提供了高分辨率,用于揭示细胞异质性和基因表达调控的微妙差异。本篇介绍单细胞转录组学的基本概念、技术发展和主要应用场景。 # 什么是单细胞转录组 传统的转录组学研究通常以细胞群体为研究对象,得到的是 “平均值” 表达水平,无法区分不同细胞亚群的差异。 而单细胞转录组学通过单细胞水平的数据捕获,每个细胞的数据独立生成,能够揭示细胞间的异质性。 单细胞转录组学的核心目标是: 揭示细胞异质性: 识别组织中不同类型
1.4k1 分钟

# “本体” 是什么? 在生物学和生物信息学中,“本体”(Ontology)是一种用于组织和表示知识的框架,它定义了一组概念及其相互关系,帮助理解和管理复杂的数据。生物学中的本体特别用于描述生物学相关的实体和现象,以及它们之间的关系。 # 本体的核心特点 定义的标准化: 本体通过定义标准的术语来描述概念和实体,确保不同研究人员或系统对相同的术语有统一的理解。 层次化结构: 本体通常采用树状结构或有向无环图(DAG)形式,表示从通用概念到具体概念的层次关系。例如,“细胞” 可以是 “真核细胞” 或 “原核细胞” 的父节点。 语义关系: 本体不仅描述术语,还定义术语之间的关系,例如
3.1k3 分钟

# 常见的 marker 基因以及一些文章的单细胞代码 # 人类细胞 marker Cell type Cell-type specific markers Astrocyte AGXT2L1, GFAP, ALDOC, SLC1A3, AGT, ALDH1L1 B cell CD19, MS4A1, BANK1, BLK, IRF8, ABCB4, ABCB9, AFF4, AIDA, AIM2 Endothelial cell VWF, PECAM1, CDH5, VEGFA, FLT1, ECSCR, ACYP1, ADGRL2, SELE, ICAM1 Epi
1.1k1 分钟

# 从零开始的 AI 学习 - 1 - 入门机器学习 # 基本概念 # 特征(Feature) 数据中的属性或变量,用于描述样本。 示例:在房价预测中,房屋面积和房间数量是特征。 # 标签(Label) 监督学习中目标变量的真实值,用于训练模型。 示例:房价预测中的真实房价。 # 模型 描述输入与输出之间映射关系的数学函数。 示例:线性回归模型:y=w⋅x+by = w \cdot x + by=w⋅x+b # 模型训练与测试 训练集:用于学习模型参数。 测试集:用于评估模型性能。 # 模型评估 通常,使用一些指标来衡量模型的性
7761 分钟

# 从零开始的 AI 学习 - 0 - 路径规划 入门机器学习:掌握机器学习的基本原理和方法 主题: 监督学习与无监督学习的基本概念 常见算法:线性回归、逻辑回归、决策树、K-means 模型评估:交叉验证、混淆矩阵、ROC 曲线 实践: 使用 Scikit-learn 进行模型训练 在 Kaggle 上完成基础的机器学习比赛,如 Titanic 数据集 深入学习深度学习:掌握神经网络和深度学习技术 主题: 神经网络基础:前馈网络、激活函数、损失函数 优化方法:梯度下降、反向传播。 深度学习框架:TensorFlow 和 PyTorch