avatar
Articles
90
Tags
70
Categories
11
Home
archives
tags
categories
link
about
zepoch's site
Home
archives
tags
categories
link
about

zepoch's site

空间组deg genemodule heatmap go分析
Created2024-01-03|tech技术
空间转录组通过手动划区注释之后,得到空间组的区域注释信息,这个时候我们便是想要得到其差异表达基因的功能注释信息,这里并没有能够通用的脚本,本人仅是提供一种思路,供大家参考。 由于我们的空间组的数据大都是 anndata 的 h5ad 的文件格式,所以我们需要将其转换为能够被 seurat 读取的 rds 文件格式,这里采用我们之前博客讲到的一个便捷工具 rds与h5ad的相互转换,大概代码如下所述: 12345sceasy::convertFormat('/data/*.h5ad', from="anndata", to="seurat", main_layer = 'count', outFile='/data/*.rds') 于是便是得到了相应的 rds 文件,之后我们借助 seurat 中的...
各区域不同细胞类型的统计
Created2024-01-02|tech技术
在处理空间组的数据的时候,很多情况下,我们会根据解剖学知识给某些地方进行区域注释;这块区域的细胞类型则是通过单细胞映射空间组进行的,再进行了手动赋予区域信息以及迁移映射了细胞类型信息之后,则需要对这些进行进行一些可视化以及一些统计分析。 可视化的代码如下,为一柱状堆积图: 12345678910111213141516171819202122232425library(pheatmap)library(ggplot2)library(viridis)library(tidyverse)df = read.table('*.csv', sep = ',')colnames(df) = df[1, ]df = df[-1, ] %>% select(-1)df = df %>% group_by(region) %>% count(celltype)df$Gyrus_Sulcus = factor(df$Ribbon, levels = c('Frontal', 'Insular',...
月度消费总结1
Created2024-01-01|生活
人的消费情况,是一个很好的反映人生活状态的指标。消费情况的好坏,直接影响到人的生活质量。所以决定对自己的消费情况进行总结,以此来反映自己的生活状态。 买衣服和吃饭的消费居于较高的位置。 买衣服的消费 249(一件厚的棉裤)+349(一件很好穿的滑雪服)+199(一件薄一些的棉裤)+28.84(袜子)+ 219(一件在北京的防风的裤子和鞋子)=1044.84 吃饭消费也是居多,大概情况如下: 下馆子 248+198+67.5+115+92+55+50.5+35.5 =...
Calculate the complexity of cells in a region
Created2023-12-29|tech
In some spatial group atlas articles, we often see a picture, which is to calculate the complexity of cells in a region. We take an article published in Cell this year as an example to see how to calculate the complexity of cells in a region. The name of the article is Single-cell spatial transcriptome reveals cell-type organization in the macaque cortex, and the link to the article is: https://linkinghub.elsevier.com/retrieve/pii/S0092867423006797, there is such a picture in Figure II: The...
计算某个区域中细胞的复杂性
Created2023-12-29|tech技术
在某系空间组图谱文章中,我们经常会看到一种图片,是去计算某个区域中细胞的复杂性,我们以今年在 Cell 上发表的一篇文章为例,来看看如何计算某个区域中细胞的复杂性。文章名字为Single-cell spatial transcriptome reveals cell-type organization in the macaque cortex,文章链接为:https://linkinghub.elsevier.com/retrieve/pii/S0092867423006797 ,图二中有这么一张图片: I图的意思是不同的 Layer 中的每个细胞的复杂度分布,每个细胞的复杂的计算为,以每个细胞为圆心,200个像素为半径,画一个圆圈,计算这个圆圈中和这个细胞的类型不同的细胞类型个数。根据这个理解,我们便是可以写程序了。 12345678910# 首先是包的引入import anndata as adimport numpy as npimport pandas as pdimport scanpy as scfrom matplotlib.ticker import...
空间转录组不同binsize之间迁移注释
Created2023-12-21|技术
在做空间转录组分析的时候,我们大多数会使用两种类型的数据,一种是bin100,bin50此类的数据,还有一种则是cellbin的数据,通常我们会使用 bin100/bin50 这样子的数据去做区域的注释,而 cellbin 的数据则是通过单细胞映射空间组,得到细胞类型的数据。但是这两种数据之间的迁移注释是一个问题,因为他们的分辨率不一样,所以我们需要将他们进行迁移注释,让 cellbin 的数据注释上脑区的信息。 首先要明确的是,我们的 bin100/bin50 的数据都是由同一个空间组的 gem 之类的文件生成的,要保证其基准坐标保持不变,这样子才能进行迁移注释。 但是基准不变的话,其实从 bin100 映射到 bin50 与 bin100 映射到 cellbin 其实原理是一样的,都是将 bin100 的数据映射到 bin50 或者 cellbin 的数据上,所以我们可以直接使用 bin100 的数据去做迁移注释。 首先,bin100 的每个 spots 都有一个坐标,但是实际上 bin100 应该是要有 100100 个坐标的,所以我们就需要将其还原回到 100100...
杂聊11
Created2023-11-30|生活
今天起床就更晚了,但是昨晚却是睡得很是舒适,昨天健身到了十一点多,相信身体确实是累了,所以睡得很是香甜。 今天早上起来,就是在床上躺了一会儿,然后就是起来洗漱,然后就是去研究院。 早上回顾了昨天留下来的一些工作,发现了一些奇妙的科学现象,这很奇妙,确实是一个比较好的科学发现了。 中午和大家一起吃了饭,回来之后睡到了两点,下午的工作在于读论文,做分析,处理数据,也是比较快乐了。 下午的时候悄悄的出去海底捞,和朋友们一起,一群单身的朋友们和我这一个有女朋友的人一起吃饭,这很是奇妙。 临近走的时候隔壁桌开始唱起了生日歌,倒是第一次感受这样子的情景。 晚上回来的时候,路上不停的吹着冷风,那个时候突然觉得好疲惫,好想休息,但是回到了研究院之后却觉得又是一切都变得精神抖擞了。 一天啊,就这样子过去了。 好好吃饭,好好睡觉,好好地生活下去,绝大多数事情都能迎刃而解。
杂聊10
Created2023-11-30|生活
...
spatial transcriptomics 3d visualization
Created2023-11-28|技术
With development of spatial transfriptomics, we can get the spatial information of gene expression. However, the data is 2D, and it is hard to visualize the data in 3D. Here, I will introduce some methods to visualize the data in 3D. But for the first time, there are only some visualization method, next i will introduce some methods. here is the code, which is easy for understanding. 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748def...
单细胞随机采样
Created2023-11-14|技术
最近单细胞图谱越来越多的涌现,我们经常要用到别人产出的超级高质量的单细胞与自己测的细胞进行比较分析,但是图谱往往具有非常多的细胞数量,正常的计算设备无法带动,以最近发表的Science专刊的单细胞数据为例,动辄便是三四百万的单细胞量级,这个时候我们就需要对数据进行随机采样,以达到我们的计算能力,同时也不会影响我们的分析结果。 以小鼠的单细胞数据为例,The cell type composition of the adult mouse brain revealed by single cell and spatial genomics,这篇文章有4388420单核数据,读取下来需要400G+的运行内存,于是需要我们进行下采样,进行后续的分析。 有两种下采样方式,一种是每种细胞类群取N个,另一种是每种细胞类群取百分比,我通常使用百分比取样,是的细胞比例分布不改变。详细代码如下所示。 123456789101112import anndata as adadata =...
1234…9
avatar
zepoch
A full-stack engineer who is improving every day
Articles
90
Tags
70
Categories
11
Follow Me
Announcement
Hello!
Recent Posts
时间真的越走越快吗2025-06-14
大规模GPU集群训练LLMs2025-06-01
工作自由度与社会公益的双赢2025-05-19
CentOS glibc 升级2025-05-08
正义的残缺2025-04-03
Categories
  • llm2
  • spatial transcriptomics2
  • tech10
    • 技术6
  • 技术21
  • 杂聊4
  • 生活13
  • 生物信息1
Tags
BOM 人工智能 CHATGPT 爬虫 LLMs 东京奥运会 this 搜索 转载 Scanpy SQL 碎碎念 毛选 Linux 日记 机器学习 spatial transcriptomics python Transformer yarn 科研 考研日记 torch 生物化学 NLP Promise 毕业 tech Coursera 动态规划 scanpy 论文 DOM 哈希表 tensorflow llm JavaScript 前端 考研 jQuery
Archives
  • June 2025 2
  • May 2025 2
  • April 2025 1
  • February 2025 2
  • January 2025 3
  • December 2024 2
  • May 2024 2
  • April 2024 1
Website Info
Article Count :
90
Total Word Count :
166.2k
Unique Visitors :
Page Views :
Last Update :
©2021 - 2025 By zepoch
Framework Hexo 7.3.0|Theme Butterfly 5.3.3