WhyLIM = Being on sea, sail; being on land, settle. = 1 1 1 0 0 1 0 1 1

置顶文章

2024-05-277.4k字7 分钟

Hexo + ShokaX 博客搭建

# Hexo + ShokaX 博客搭建参考：官方文档知乎用户 # 前置准备安装 Node.js：Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境，用于构建高性能、可扩展的服务器端和网络应用程序。 Windows 用户在官网下载安装即可 Linux 用户则可以使用 nvm 来管理 Node.js 的版本，参考这个仓库安装 Git：Git 是一个分布式版本控制系统，能够高效地处理项目的版本管理和代码协作。 Windows 用户在官网下载安装即可 Linux 用户可以直接使用 sudo apt install git 安装

more...

文章列表

2025-03-065.6k字5 分钟

两种使用 Python 获取基因信息的方法

# 两种使用 Python 获取基因信息的方法 # 使用 Entrez API 此方法需要在 NCBI 使用邮箱注册账号 from Bio import Entrez, Medlinedef fetch_gene_annotatio(gene_name: str): """Fetch gene annotation from Entrez""" Entrez.email = "xxxxxxx@xx.com" handle = Entrez.esearch(db=&qu

more...

2025-02-121.5k字1 分钟

Ubuntu 中 WPS 的字体渲染问题

# Ubuntu 中 WPS 的字体渲染问题 Ubuntu 上的 WPS 经常遇到字体渲染异常的问题，一方面是由于缺失，另一方面则是依赖。 # 字体缺失问题这个 Github 仓库提供了解决方案： git clone https://github.com/dv-anomaly/ttf-wps-fonts.gitcd ttf-wps-fontssudo bash install.sh# 依赖缺失导致的渲染问题通常是黑体的异常加粗重叠，我们需要手动安装 debian 的一个依赖包，在此处下载 libfreetype6_2.12.1+dfsg-5+d

more...

2025-01-2314k字13 分钟

单细胞转录组数据分析入门-3-Seurat 对象详解和常用命令

# 单细胞转录组数据分析入门 - 3-Seurat 对象详解和常用命令 Seurat 对象的数据结构是一个 S4 对象，它整合了单细胞 RNA 测序的原始数据、样本信息、分析结果等多种数据。 # 什么是 S4 对象 S4 对象是 R 语言中的一种高级面向对象编程机制，用于更复杂的对象和数据结构。相比于基础的列表（如 R 的 S3 对象），S4 对象具有更严格的规则，包括：明确的类定义：每个 S4 对象的结构通过 setClass 定义，包含字段（slots）和类型限制。字段和方法：通过 @ 操作符访问字段，例如 object@field 。验证机制：对象创建时会验证字段和数据类

more...

2025-01-215.2k字5 分钟

两种富集分析的理解

# 两种富集分析的理解 KEGG/GO 富集分析和 GSEA（基因集富集分析，Gene Set Enrichment Analysis）是两种不同但相关的分析方法，它们都有助于从基因表达数据中挖掘生物学意义，但它们的原理和使用场景有所不同。 # KEGG/GO 富集分析 KEGG/GO 富集分析是一种重要的基因功能注释和生物通路分析方法，通过统计学手段从基因列表中挖掘显著富集的功能注释（Gene Ontology, GO）或代谢通路（Kyoto Encyclopedia of Genes and Genomes, KEGG），以揭示基因表达变化的潜在生物学意义。

more...

2025-01-211.9k字2 分钟

基于 NoneBot2 的 QQ 机器人搭建

这篇文章最初写于 2020 年，题为如何在 Ubuntu 下使用 QQ ，现在 QQ 官方已经发布了 Linux 版本，原文也由此成为时代的眼泪了...... 这些技术和技巧性的东西就是如此，时效性极强。5 年过去，也应当进行一些 ⌈老文翻新⌋ 了，本文介绍如何基于 NoneBot2 在 Ubuntu 下的 QQNT 中搭建机器人 # 基于 NoneBot2 的 QQ 机器人搭建 # 什么是 go-cqhtt go-cqhttp 是一个基于 OneBot 协议实现的高性能 QQ 协议机器人框架，使用 Go 编程语言开发，轻量、易用且跨平台，支持运行在多种环境中（如 Windows、Lin

more...

2025-01-1317k字16 分钟

单细胞转录组数据分析入门-2-各种格式的单细胞数据读取

# 单细胞转录组数据分析入门 - 2 - 各种格式的单细胞数据读取单细胞转录组测序的格式可能有多种，包括单样本，多样本，10X 的标准输出文件，h5，h5ad，txt/csv/tsv 网上的教程鱼龙混杂，这使我在初次接触时晕头转向 # 10X 标准输出这是目前比较主流的一种数据格式，对于一个样本，其包含： barcodes.tsv.gz ：记录 cell id features.tsv.gz ：记录 gene id matrix.mtx.gz ：计数 counts 矩阵三个文件，且命名必须与上面完全相同直接使用 Seurat 的 Read10X() 函数

more...

2025-01-133.9k字4 分钟

单细胞转录组数据分析入门-1-数据与分析平台

# 单细胞转录组数据分析入门 - 1 - 数据与分析平台 # 关于单细胞转录组数据 # 细胞与基因表达矩阵单细胞转录组数据的核心是一个细胞与基因的表达矩阵，通常以行代表基因，列代表细胞。矩阵中的每个数值表示某个基因在某个细胞中的表达水平。这个矩阵有如下特点：稀疏性：多数基因的表达值为零或接近零，因为在特定细胞中只有部分基因会被活跃表达。高维度：单细胞实验通常包含数千个基因和数千至数百万个细胞。 # 数据来源：测序原始数据： FASTQ 文件通过预处理（如 Cell Ranger）生成表达矩阵。表达值单位：包括原始 UMI 计数、归一化值（TPM、FPKM）或对数转换值。

more...

2025-01-131.5k字1 分钟

单细胞转录组数据分析入门-0-简介

# 单细胞转录组数据分析入门 - 0 - 简介单细胞转录组学（Single-cell RNA sequencing，scRNA-seq）是近年生命科学研究中的热门领域。它为解析复杂生物系统提供了高分辨率，用于揭示细胞异质性和基因表达调控的微妙差异。本篇介绍单细胞转录组学的基本概念、技术发展和主要应用场景。 # 什么是单细胞转录组传统的转录组学研究通常以细胞群体为研究对象，得到的是 “平均值” 表达水平，无法区分不同细胞亚群的差异。而单细胞转录组学通过单细胞水平的数据捕获，每个细胞的数据独立生成，能够揭示细胞间的异质性。单细胞转录组学的核心目标是：揭示细胞异质性：识别组织中不同类型

more...

2025-01-131.4k字1 分钟

“本体”是什么？

# “本体” 是什么？在生物学和生物信息学中，“本体”（Ontology）是一种用于组织和表示知识的框架，它定义了一组概念及其相互关系，帮助理解和管理复杂的数据。生物学中的本体特别用于描述生物学相关的实体和现象，以及它们之间的关系。 # 本体的核心特点定义的标准化：本体通过定义标准的术语来描述概念和实体，确保不同研究人员或系统对相同的术语有统一的理解。层次化结构：本体通常采用树状结构或有向无环图（DAG）形式，表示从通用概念到具体概念的层次关系。例如，“细胞” 可以是 “真核细胞” 或 “原核细胞” 的父节点。语义关系：本体不仅描述术语，还定义术语之间的关系，例如

more...

2025-01-103.1k字3 分钟

常见的 marker 基因以及一些文章的单细胞代码

# 常见的 marker 基因以及一些文章的单细胞代码 # 人类细胞 marker Cell type Cell-type specific markers Astrocyte AGXT2L1, GFAP, ALDOC, SLC1A3, AGT, ALDH1L1 B cell CD19, MS4A1, BANK1, BLK, IRF8, ABCB4, ABCB9, AFF4, AIDA, AIM2 Endothelial cell VWF, PECAM1, CDH5, VEGFA, FLT1, ECSCR, ACYP1, ADGRL2, SELE, ICAM1 Epi

more...