1.1k1 分钟

# 从零开始的 AI 学习 - 1 - 入门机器学习 # 基本概念 # 特征(Feature) 数据中的属性或变量,用于描述样本。 示例:在房价预测中,房屋面积和房间数量是特征。 # 标签(Label) 监督学习中目标变量的真实值,用于训练模型。 示例:房价预测中的真实房价。 # 模型 描述输入与输出之间映射关系的数学函数。 示例:线性回归模型:y=w⋅x+by = w \cdot x + by=w⋅x+b # 模型训练与测试 训练集:用于学习模型参数。 测试集:用于评估模型性能。 # 模型评估 通常,使用一些指标来衡量模型的性
7761 分钟

# 从零开始的 AI 学习 - 0 - 路径规划 入门机器学习:掌握机器学习的基本原理和方法 主题: 监督学习与无监督学习的基本概念 常见算法:线性回归、逻辑回归、决策树、K-means 模型评估:交叉验证、混淆矩阵、ROC 曲线 实践: 使用 Scikit-learn 进行模型训练 在 Kaggle 上完成基础的机器学习比赛,如 Titanic 数据集 深入学习深度学习:掌握神经网络和深度学习技术 主题: 神经网络基础:前馈网络、激活函数、损失函数 优化方法:梯度下降、反向传播。 深度学习框架:TensorFlow 和 PyTorch
1.8k2 分钟

# 使用 ggsc 绘制 Seurat 对象 Seurat 包自带了一些绘图函数,虽然也是基于 ggplot2 的,但是扩展性其实没那么强 正好 Y 叔写了个包 ggsc,虽然已经有基本的使用教程,但还是有些常用的应用场景需要自己探索一下: # 基本绘图 对我个人而言,基本绘图可以这样写 Idents(seurat_object) <- "celltype"p <- sc_dim(seurat_object, reduction = "umap") + sc_dim_geom_label(geom = shadowte
2.2k2 分钟

# 非负矩阵分解分析连续细胞状态 在现代生物学研究中,理解细胞状态的多样性和连续性是揭示复杂生物过程的重要一步。 无论是肿瘤微环境中的细胞演化,还是发育过程中的细胞分化,细胞状态的变化通常不是离散的,而是表现为一种渐变的连续谱。 非负矩阵分解(Non-negative Matrix Factorization, NMF) 能够有效提取和解释基因表达数据中的连续细胞状态。本文将探讨 NMF 在分析连续细胞状态中的应用原理及其生物学意义。 # 非负矩阵分解(NMF) NMF 是一种矩阵分解技术,用于将一个非负矩阵拆解为两个非负矩阵的乘积。形式上: V≈WHV \approx WH V≈WH 其中:
2.2k2 分钟

# 跨多个通路的 DEGs 可视化 报错的原因是 scale_fill_manual() 提供的颜色向量 custom_colors 中的颜色数量不足以覆盖 geom_scatterpie 内使用的 cols 所对应的路径数量,导致了 “需要 11 个颜色,但只提供了 9 个” 的错误。 # 原因分析 scale_fill_manual() 会同时影响所有使用 fill 映射的几何对象,包括: geom_scatterpie (用于 pathways 和器官分布) geom_label_repel (用于标签背景颜色)。 冲突: custom_colors
3.6k3 分钟

# 使用 Ensembl API 查询 SNP 在不同人群中的分布 Ensembl REST API 的端点和测试用例可以在这里找到。本文以 R 语言为例,介绍如何使用 Ensembl API 查询特定单核苷酸多态性(SNP)的分布情况,包括单个和批量查询的实现过程。 # 为什么要查询 SNP 的分布? SNP(单核苷酸多态性)是基因组中常见的变异形式,对研究基因与表型的关系、疾病关联分析和个性化医疗至关重要。SNP 在不同人群中的分布往往因种群历史、地理分布和自然选择而异,因此理解这些分布特征是遗传学研究的重要任务。 # 准备工作 需要加载几个 R 包来完成请求和数据处理: library(
951 分钟

# 想做的一些项目 # DTII 的功能扩展 药物相互作用组 距离算法 # GPT-Enrich 结合 GeneCards 和文献自动推断富集结果的意义
3k3 分钟

# 科研写作词汇表 英文 中文 例句 hypothesize 假设 We hypothesize that... leverage 利用 By leveraging machine learning techniques, we can... be apparent with 明显的 ...we can efficiently identify complex patterns that may not be apparent with traditional methods complement 补充 This could potentially complemen
1121 分钟

# Cytoscape.js 的使用 由于 PrismJS 尚不支持 Vue 的语法高亮,因此 Vue 代码块均先使用 HTML 的高亮 2024-09-23 在前面,
2k2 分钟

# 衰老指标评估 目前(2024-12-02)Aging 数据库的数据中,研究最多的 Biomarker 如下: Biomarker 中文 Count 试剂盒 Telomere Length 端粒长度 68 已有 Leukocyte Telomere Length 白细胞端粒长度 31 DNA Methylation (DNAm) DNA 甲基化(DNAm) 27 已有 Senescence-associated beta-galactosidase (SA-beta-gal) 衰老相关 β- 半乳糖苷酶(SA-β-gal) 21 已有 p16INK4a p1