rds与h5ad的相互转换
之前做过一个 rds 转 h5ad 的教程,现在看来发现有些过于繁琐,且随着时间的发展,也有了更好的方法的出现,所以这里再写一个教程。 新的工具包是 https://github.com/cellgeni/sceasy ,这是一个专注于做各种单细胞文件格式转换的文件,但是作者也并没有写明一个特别完整的参数说明,所以这里我也只能根据自己的使用经验来写一下。 安装可以如作者所述,直接安装即可 123conda install -c bioconda r-sceasy# 或者devtools::install_github("cellgeni/sceasy") 安装并不复杂,这里会详细讲一下其更为优秀的使用 12345678910# 首先是包的载入,只需载入这两行即可,如果你的文件没有 loom的话,那么就不需要载入 loom包library(sceasy)library(reticulate)# 单细胞的 rds 文件与 h5ad 文件之间的互相转换如下即可sceasy::convertFormat(seurat_object,...
杂聊9
...
使用GTF和fasta生成每个geneid对应最长的fasta序列
在进行单细胞测序的时候,我们通常最后得到的是 cell*geneid 的 matrix 文件,有时候我们需要 geneid 以及 geneid 对应的 fasta 序列数据,这就需要让我们做一些处理。 我们所需的文件是 gtf 文件和 基因组文件,需要使用的工具是 gffread 文件,这些大家都可以从官网进行下载。 以我们的数据为例,我们使用的是 GRCh38.p13.genome.fa 的数据,所以便是可以进行如下的代码分析 1gffread gencode.v35.primary_assembly.annotation.gtf -g GRCh38.p13.genome.fa -w cds.fa --table @genename 在 cds.fa 数据中,我们就能得到 geneid 和 fasta 数据对应的文件,大概如下所示 1234567head 5...
杂聊8
...
scanpy多张图绘制于一张
当我们一次有多个数据,而且我们想要使用scanpy绘制umap图,或是spatial图的时候,大多数人一次只是绘制一个umap图或是一个spatial图在一个png或是一个pdf上面,对于我们可视化来说可能并没有那么轻便,于是需要做一些调整,借助于matplotlib的内参,让我们可以较为轻松的绘制多张图在一张图上面。代码比较容易理解,详细代码如下: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546fig=plt.figure(figsize=(20,20))for i in range(1,13): temp = adata[adata.obs['slices']==str(i)] # ax=fig.add_subplot(221) csv = pd.read_csv('/data/work/04.Transfer/RCTD/Result/all_batch/1014/' + str(i) +...
杂聊7
...
使用空间转录组文件gem生成相应的灰度图
一般我们在进行圈细胞之前需要将基因在空间上的表达情况绘制出来,同时与拍照的TIF图片进行对应,在我的上篇博客里面用了一位师兄的代码,但是却发现其执行效率过于低下,经常一张芯片要运行四五个小时。故自己写了新的架构,将速度提升了数百倍。代码如下所示: 12345678910111213141516171819202122232425262728293031323334353637383940414243# import spateo as stimport pandas as pdfrom PIL import Imageimport matplotlib.pyplot as pltfrom scipy.sparse import csr_matriximport numpy as npimport skimageimport cv2'''log setting'''import logginglog =...
如何在stomics平台使用spateo圈细胞
时空云平台(STOmics Cloud)是以时空为特色的多组学数据分析平台,可以管理和分析多组学数据。 STOmics Cloud以项目为核心,用户可快速将数据和工具整合到项目,实现分析过程可追溯,结果可复现,知识可分享,项目可协作,形成项目分析体系。并通过一个用户友好的门户,提供灵活易于使用的无代码标准和高级分析,高分辨率可视化分析,以及个性化的分析服务,任何注册登录的用户可以轻松在平台上访问,分析,使用和共享数据和工具。 总体来说,STOmics 平台是一个很出色的多组学的数据分析平台,但是仍然有一些不足,STOmics 在做数据分析的时候无法连接外部网络,如果说我们需要用到一些外部的模型或是其他资源的时候,则是会遇到十分大的阻碍,尤其是当我们调用 keras 的某些模型的时候,是需要进行联网下载的,那我们就需要对源码进行一些修改。 Spateo 利用 Stereo-seq 的超高空间分辨率、大视野和高 RNA 捕获灵敏度,通过核染色和基于 RNA 信号的细胞分割实现单细胞分辨率空间转录组学。Spateo...
how to run Spatial ID
before you start to run the program, you should make something installed. 12345pip install torch==2.1.2+cpu torchvision==0.16.2+cpu torchaudio==2.1.2+cpu --index-url https://download.pytorch.org/whl/cpupip install torch-cluster -f https://pytorch-geometric.com/whl/torch-2.0.1+cpu.htmlpip install torch-scatter -f https://pytorch-geometric.com/whl/torch-2.0.1+cpu.htmlpip install torch-sparse -f https://pytorch-geometric.com/whl/torch-2.0.1+cpu.htmlpip install torch-geometric==2.0 Before...
如何将rds转为h5ad
在进行单细胞或是空间组数据分析的时候,有的人喜欢使用 R 语言进行分析,有的同学喜欢使用 Python 进行分析,但是两个语言分析所使用的文件有所不同,R 语言通常保存的为 rds 文件,Python 通常保存的为 h5ad 文件,如果是多人合作分析的时候,往往需要将文件进行格式转换,这通常是一件较为麻烦的事情,看到过有使用 SeuratDisk 和 SeuratData 等 R 语言包进行转换的程序,但是由于本人 R 语言环境等等的问题,总是无法安装,故想了一个新的方法来进行格式转换,教程如下。 首先是将 rds 文件中的信息提取出来。 1234library(Seurat)# 读取 rds 文件信息rds_file = readRDS("rds_file.rds")rds_file An object of class Seurat 38153 features across 9567 samples within 2 assays Active assay: Spatial (19082 features, 0 variable...