單細胞測序技術(single cell sequencing)是指在單個細胞水平上,對基因組、轉錄組、表觀組進行高通量測序分析的一項新技術,它能夠彌補傳統高通量測序的局限性,揭示單個細胞的基因結構和基因表達狀態,反映細胞間的異質性。2013年,單細胞測序技術被《Science》將其列為年度最值得關注的六大領域榜首;2015年再次登上Science轉化醫學封面。目前,單細胞測序技術在腫瘤、發育生物學、微生物學、神經科學、以及植物學等領域發揮重要作用。 正成為生命科學研究的焦點。具有廣闊的應用前景。
烈冰單細胞測序為了準確快速地進行單細胞測序研究,基于前沿的研究文獻進行多重優化,真正做到準確可靠全面的單細胞測序解析
組織、血液、培養的細胞系、制備好的單細胞懸液
注:若客戶樣本為組織,且尚未成功將組織樣本消化成單細胞懸液,烈冰將盡可能提供技術及實驗上的幫助,但因不同類型樣本的特異性,無法保證實驗方法適用于所有類型組織。
細胞活性大于70%,濃度為500-2000細胞/μl,
體積不小于200μl,細胞培養基及緩沖液不能含Ca2+和Mg2+,細胞體積小于40μm。
采用Fastp軟件對下機原始數據進行質控,對質控后測序數據中的cell barcode信息及其對應的counts數進行統計,判斷測序樣本中實際檢測到的細胞數量,獲得樣本的測序細胞數,并根據最終確認的cell barcode信息提取對應的reads。
注:橫坐 標為細胞數量,縱坐標為每個細胞對應的平均 counts 數,根據曲線的斜率判斷實際檢測的細胞數量
以cell barcode對應的reads為研究對象,采用STAR算法將測序數據比對到物種對應的基因組上,獲得基因組比對的bam文件。再以bam文件以及基因組注釋文件為研究對象,將比對到同一基因上的UMI進行合并,并去除其中重復的UMI序列,得到每個基因的UMI數量,統計每個細胞中檢測到的基因數以及轉錄本數量,并得到表達量矩陣表。
注:左圖為細胞中總共檢測到的基因數量,右圖為去除重復 UMI 后統計
利用基因組比對結果以及表達量結果對測序檢測到的細胞進行過濾,去除細胞中基因檢測數少、線粒體基因占比大的細胞,統計過濾后的細胞數量并得到對應的表達量矩陣表。采用數據標準化方法(CPM/RLE/UQ/TMM/scran/Downsampling等),對不同樣本中細胞基因表達量進行標準化,得到標準化后的表達量矩陣表。
注:橫坐標表示每個細胞中UMI的數量,縱坐標表示線粒體基因的占比情況
基于每個細胞中的基因表達量數據,采用聚類算法對細胞進行亞群分析,同時采用 t-SNE 分析對細胞的分群結果進行可視化展示。同時,還可以對不同樣本中各細胞亞群的占比情況進行統計分析。
注:上圖為乳腺癌腫瘤組織、正常組織、血液和淋巴結樣本中免疫細胞亞群鑒定;下圖為不同組織樣本中各細胞亞群的占比情況
鑒定不同細胞亞群中的Marker基因,并對Marker基因的表達分布進行可視化展示。
注: marker基因的Feature Plot圖(上)和Violin圖(下)
針對所有或者特定細胞亞群,進行細胞亞群間差異表達基因篩選,獲得細胞亞群間差異表達基因。
注:該圖為不同細胞亞群間差異基因聚類分析圖(Heatmap)
分別采用NCBI/UNIPROT/SWISSPROT/AMIGO等GO數據庫,以及KEGG數據庫,對Marker基因/差異基因進行功能分析和信號通路分析,從而得到這些基因群體所顯著性富集的GO條目和Pathway條目。
注:該圖為不同cluster之間差異基因顯著富集的Pathway條目
采用velocyto算法,預測單個細胞的變化方向,得到細胞間的轉變過程。
注:該圖為RNA velocity分析結果圖,圖中箭頭方向代表算法預測的細胞演化方向
以細胞的表達量數據為研究對象,采用TSCAN/monocle/SLICER/Ouija等算法,在虛擬時間軸上對細胞的變化模式進行分析,模擬重建細胞的動態變化過程,獲得細胞間的狀態轉換關系,以及不同狀態細胞間差異基因的表達情況。
注:細胞間狀態轉換的pesudotime軌跡圖(上)和Heatmap圖(下)
以細胞亞群的基因表達量數據為研究對象,獲得細胞中的配體及受體基因的表達信息,得到細胞亞群間的信號通訊關系。
注:橫坐標表示細胞類型,縱坐標表示細胞間通訊關系,圓圈大小表示顯著性差異水平,圓圈顏色越紅表示細胞間通訊關系越強
以TCGA臨床信息以及篩選到的關鍵基因為研究對象,結合TCGA臨床數據,進行預后分析,獲得該基因/基因集與臨床預后之間的關系。
注:橫坐標表示生存期,縱坐標表示占比,不同顏色曲線代表不同分組