置顶文章

7.4k7 分钟

# Hexo + ShokaX 博客搭建 参考: 官方文档 知乎用户 # 前置准备 安装 Node.js:Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境,用于构建高性能、可扩展的服务器端和网络应用程序。 Windows 用户在官网下载安装即可 Linux 用户则可以使用 nvm 来管理 Node.js 的版本,参考这个仓库 安装 Git:Git 是一个分布式版本控制系统,能够高效地处理项目的版本管理和代码协作。 Windows 用户在官网下载安装即可 Linux 用户可以直接使用 sudo apt install git 安装

文章列表

5.6k5 分钟

# 两种使用 Python 获取基因信息的方法 # 使用 Entrez API 此方法需要在 NCBI 使用邮箱注册账号 from Bio import Entrez, Medlinedef fetch_gene_annotatio(gene_name: str): """Fetch gene annotation from Entrez""" Entrez.email = "xxxxxxx@xx.com" handle = Entrez.esearch(db=&qu
1.5k1 分钟

# Ubuntu 中 WPS 的字体渲染问题 Ubuntu 上的 WPS 经常遇到字体渲染异常的问题,一方面是由于缺失,另一方面则是依赖。 # 字体缺失问题 这个 Github 仓库提供了解决方案: git clone https://github.com/dv-anomaly/ttf-wps-fonts.gitcd ttf-wps-fontssudo bash install.sh# 依赖缺失导致的渲染问题 通常是黑体的异常加粗重叠,我们需要手动安装 debian 的一个依赖包,在此处下载 libfreetype6_2.12.1+dfsg-5+d
14k13 分钟

# 单细胞转录组数据分析入门 - 3-Seurat 对象详解和常用命令 Seurat 对象的数据结构是一个 S4 对象,它整合了单细胞 RNA 测序的原始数据、样本信息、分析结果等多种数据。 # 什么是 S4 对象 S4 对象是 R 语言中的一种高级面向对象编程机制,用于更复杂的对象和数据结构。相比于基础的列表(如 R 的 S3 对象),S4 对象具有更严格的规则,包括: 明确的类定义:每个 S4 对象的结构通过 setClass 定义,包含字段(slots)和类型限制。 字段和方法:通过 @ 操作符访问字段,例如 object@field 。 验证机制:对象创建时会验证字段和数据类
5.2k5 分钟

# 两种富集分析的理解 KEGG/GO 富集分析和 GSEA(基因集富集分析,Gene Set Enrichment Analysis)是两种不同但相关的分析方法,它们都有助于从基因表达数据中挖掘生物学意义,但它们的原理和使用场景有所不同。 # KEGG/GO 富集分析 KEGG/GO 富集分析是一种重要的基因功能注释和生物通路分析方法,通过统计学手段从基因列表中挖掘显著富集的功能注释(Gene Ontology, GO)或代谢通路(Kyoto Encyclopedia of Genes and Genomes, KEGG),以揭示基因表达变化的潜在生物学意义。
1.9k2 分钟

这篇文章最初写于 2020 年,题为 如何在 Ubuntu 下使用 QQ ,现在 QQ 官方已经发布了 Linux 版本,原文也由此成为时代的眼泪了...... 这些技术和技巧性的东西就是如此,时效性极强。5 年过去,也应当进行一些 ⌈老文翻新⌋ 了,本文介绍如何基于 NoneBot2 在 Ubuntu 下的 QQNT 中搭建机器人 # 基于 NoneBot2 的 QQ 机器人搭建 # 什么是 go-cqhtt go-cqhttp 是一个基于 OneBot 协议实现的高性能 QQ 协议机器人框架,使用 Go 编程语言开发,轻量、易用且跨平台,支持运行在多种环境中(如 Windows、Lin
17k16 分钟

# 单细胞转录组数据分析入门 - 2 - 各种格式的单细胞数据读取 单细胞转录组测序的格式可能有多种,包括单样本,多样本,10X 的标准输出文件,h5,h5ad,txt/csv/tsv 网上的教程鱼龙混杂,这使我在初次接触时晕头转向 # 10X 标准输出 这是目前比较主流的一种数据格式,对于一个样本,其包含: barcodes.tsv.gz :记录 cell id features.tsv.gz :记录 gene id matrix.mtx.gz :计数 counts 矩阵 三个文件,且命名必须与上面完全相同 直接使用 Seurat 的 Read10X() 函数
3.9k4 分钟

# 单细胞转录组数据分析入门 - 1 - 数据与分析平台 # 关于单细胞转录组数据 # 细胞与基因表达矩阵 单细胞转录组数据的核心是一个细胞与基因的表达矩阵,通常以行代表基因,列代表细胞。矩阵中的每个数值表示某个基因在某个细胞中的表达水平。这个矩阵有如下特点: 稀疏性: 多数基因的表达值为零或接近零,因为在特定细胞中只有部分基因会被活跃表达。 高维度: 单细胞实验通常包含数千个基因和数千至数百万个细胞。 # 数据来源: 测序原始数据: FASTQ 文件通过预处理(如 Cell Ranger)生成表达矩阵。 表达值单位: 包括原始 UMI 计数、归一化值(TPM、FPKM)或对数转换值。
1.5k1 分钟

# 单细胞转录组数据分析入门 - 0 - 简介 单细胞转录组学(Single-cell RNA sequencing,scRNA-seq)是近年生命科学研究中的热门领域。它为解析复杂生物系统提供了高分辨率,用于揭示细胞异质性和基因表达调控的微妙差异。本篇介绍单细胞转录组学的基本概念、技术发展和主要应用场景。 # 什么是单细胞转录组 传统的转录组学研究通常以细胞群体为研究对象,得到的是 “平均值” 表达水平,无法区分不同细胞亚群的差异。 而单细胞转录组学通过单细胞水平的数据捕获,每个细胞的数据独立生成,能够揭示细胞间的异质性。 单细胞转录组学的核心目标是: 揭示细胞异质性: 识别组织中不同类型
1.4k1 分钟

# “本体” 是什么? 在生物学和生物信息学中,“本体”(Ontology)是一种用于组织和表示知识的框架,它定义了一组概念及其相互关系,帮助理解和管理复杂的数据。生物学中的本体特别用于描述生物学相关的实体和现象,以及它们之间的关系。 # 本体的核心特点 定义的标准化: 本体通过定义标准的术语来描述概念和实体,确保不同研究人员或系统对相同的术语有统一的理解。 层次化结构: 本体通常采用树状结构或有向无环图(DAG)形式,表示从通用概念到具体概念的层次关系。例如,“细胞” 可以是 “真核细胞” 或 “原核细胞” 的父节点。 语义关系: 本体不仅描述术语,还定义术语之间的关系,例如
3.1k3 分钟

# 常见的 marker 基因以及一些文章的单细胞代码 # 人类细胞 marker Cell type Cell-type specific markers Astrocyte AGXT2L1, GFAP, ALDOC, SLC1A3, AGT, ALDH1L1 B cell CD19, MS4A1, BANK1, BLK, IRF8, ABCB4, ABCB9, AFF4, AIDA, AIM2 Endothelial cell VWF, PECAM1, CDH5, VEGFA, FLT1, ECSCR, ACYP1, ADGRL2, SELE, ICAM1 Epi