avatar
Articles
90
Tags
70
Categories
11
Home
archives
tags
categories
link
about
zepoch's site
Home
archives
tags
categories
link
about

zepoch's site

rds与h5ad的相互转换
Created2023-11-13|技术
之前做过一个 rds 转 h5ad 的教程,现在看来发现有些过于繁琐,且随着时间的发展,也有了更好的方法的出现,所以这里再写一个教程。 新的工具包是 https://github.com/cellgeni/sceasy ,这是一个专注于做各种单细胞文件格式转换的文件,但是作者也并没有写明一个特别完整的参数说明,所以这里我也只能根据自己的使用经验来写一下。 安装可以如作者所述,直接安装即可 123conda install -c bioconda r-sceasy# 或者devtools::install_github("cellgeni/sceasy") 安装并不复杂,这里会详细讲一下其更为优秀的使用 12345678910# 首先是包的载入,只需载入这两行即可,如果你的文件没有 loom的话,那么就不需要载入 loom包library(sceasy)library(reticulate)# 单细胞的 rds 文件与 h5ad 文件之间的互相转换如下即可sceasy::convertFormat(seurat_object,...
杂聊9
Created2023-11-12|生活
...
使用GTF和fasta生成每个geneid对应最长的fasta序列
Created2023-11-02|技术
在进行单细胞测序的时候,我们通常最后得到的是 cell*geneid 的 matrix 文件,有时候我们需要 geneid 以及 geneid 对应的 fasta 序列数据,这就需要让我们做一些处理。 我们所需的文件是 gtf 文件和 基因组文件,需要使用的工具是 gffread 文件,这些大家都可以从官网进行下载。 以我们的数据为例,我们使用的是 GRCh38.p13.genome.fa 的数据,所以便是可以进行如下的代码分析 1gffread gencode.v35.primary_assembly.annotation.gtf -g GRCh38.p13.genome.fa -w cds.fa --table @genename 在 cds.fa 数据中,我们就能得到 geneid 和 fasta 数据对应的文件,大概如下所示 1234567head 5...
杂聊8
Created2023-10-29|生活
...
scanpy多张图绘制于一张
Created2023-10-18|技术
当我们一次有多个数据,而且我们想要使用scanpy绘制umap图,或是spatial图的时候,大多数人一次只是绘制一个umap图或是一个spatial图在一个png或是一个pdf上面,对于我们可视化来说可能并没有那么轻便,于是需要做一些调整,借助于matplotlib的内参,让我们可以较为轻松的绘制多张图在一张图上面。代码比较容易理解,详细代码如下: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546fig=plt.figure(figsize=(20,20))for i in range(1,13): temp = adata[adata.obs['slices']==str(i)] # ax=fig.add_subplot(221) csv = pd.read_csv('/data/work/04.Transfer/RCTD/Result/all_batch/1014/' + str(i) +...
杂聊7
Created2023-09-10|生活
...
使用空间转录组文件gem生成相应的灰度图
Created2023-07-27|spatial transcriptomics
一般我们在进行圈细胞之前需要将基因在空间上的表达情况绘制出来,同时与拍照的TIF图片进行对应,在我的上篇博客里面用了一位师兄的代码,但是却发现其执行效率过于低下,经常一张芯片要运行四五个小时。故自己写了新的架构,将速度提升了数百倍。代码如下所示: 12345678910111213141516171819202122232425262728293031323334353637383940414243# import spateo as stimport pandas as pdfrom PIL import Imageimport matplotlib.pyplot as pltfrom scipy.sparse import csr_matriximport numpy as npimport skimageimport cv2'''log setting'''import logginglog =...
如何在stomics平台使用spateo圈细胞
Created2023-07-26|spatial transcriptomics
时空云平台(STOmics Cloud)是以时空为特色的多组学数据分析平台,可以管理和分析多组学数据。 STOmics Cloud以项目为核心,用户可快速将数据和工具整合到项目,实现分析过程可追溯,结果可复现,知识可分享,项目可协作,形成项目分析体系。并通过一个用户友好的门户,提供灵活易于使用的无代码标准和高级分析,高分辨率可视化分析,以及个性化的分析服务,任何注册登录的用户可以轻松在平台上访问,分析,使用和共享数据和工具。 总体来说,STOmics 平台是一个很出色的多组学的数据分析平台,但是仍然有一些不足,STOmics 在做数据分析的时候无法连接外部网络,如果说我们需要用到一些外部的模型或是其他资源的时候,则是会遇到十分大的阻碍,尤其是当我们调用 keras 的某些模型的时候,是需要进行联网下载的,那我们就需要对源码进行一些修改。 Spateo 利用 Stereo-seq 的超高空间分辨率、大视野和高 RNA 捕获灵敏度,通过核染色和基于 RNA 信号的细胞分割实现单细胞分辨率空间转录组学。Spateo...
how to run Spatial ID
Created2023-06-07|tech
before you start to run the program, you should make something installed. 12345pip install torch==2.1.2+cpu torchvision==0.16.2+cpu torchaudio==2.1.2+cpu --index-url https://download.pytorch.org/whl/cpupip install torch-cluster -f https://pytorch-geometric.com/whl/torch-2.0.1+cpu.htmlpip install torch-scatter -f https://pytorch-geometric.com/whl/torch-2.0.1+cpu.htmlpip install torch-sparse -f https://pytorch-geometric.com/whl/torch-2.0.1+cpu.htmlpip install torch-geometric==2.0 Before...
如何将rds转为h5ad
Created2023-04-23|技术
在进行单细胞或是空间组数据分析的时候,有的人喜欢使用 R 语言进行分析,有的同学喜欢使用 Python 进行分析,但是两个语言分析所使用的文件有所不同,R 语言通常保存的为 rds 文件,Python 通常保存的为 h5ad 文件,如果是多人合作分析的时候,往往需要将文件进行格式转换,这通常是一件较为麻烦的事情,看到过有使用 SeuratDisk 和 SeuratData 等 R 语言包进行转换的程序,但是由于本人 R 语言环境等等的问题,总是无法安装,故想了一个新的方法来进行格式转换,教程如下。 首先是将 rds 文件中的信息提取出来。 1234library(Seurat)# 读取 rds 文件信息rds_file = readRDS("rds_file.rds")rds_file An object of class Seurat 38153 features across 9567 samples within 2 assays Active assay: Spatial (19082 features, 0 variable...
1…345…9
avatar
zepoch
A full-stack engineer who is improving every day
Articles
90
Tags
70
Categories
11
Follow Me
Announcement
Hello!
Recent Posts
时间真的越走越快吗2025-06-14
大规模GPU集群训练LLMs2025-06-01
工作自由度与社会公益的双赢2025-05-19
CentOS glibc 升级2025-05-08
正义的残缺2025-04-03
Categories
  • llm2
  • spatial transcriptomics2
  • tech10
    • 技术6
  • 技术21
  • 杂聊4
  • 生活13
  • 生物信息1
Tags
BOM 人工智能 CHATGPT 爬虫 LLMs 东京奥运会 this 搜索 转载 Scanpy SQL 碎碎念 毛选 Linux 日记 机器学习 spatial transcriptomics python Transformer yarn 科研 考研日记 torch 生物化学 NLP Promise 毕业 tech Coursera 动态规划 scanpy 论文 DOM 哈希表 tensorflow llm JavaScript 前端 考研 jQuery
Archives
  • June 2025 2
  • May 2025 2
  • April 2025 1
  • February 2025 2
  • January 2025 3
  • December 2024 2
  • May 2024 2
  • April 2024 1
Website Info
Article Count :
90
Total Word Count :
166.2k
Unique Visitors :
Page Views :
Last Update :
©2021 - 2025 By zepoch
Framework Hexo 7.3.0|Theme Butterfly 5.3.3