CZ CELLxGENE Discover數(shù)據(jù)庫是由扎克伯格—陳基金支持的大型單細(xì)胞數(shù)據(jù)平臺,旨在為全球科研人員提供標(biāo)準(zhǔn)化的單細(xì)胞數(shù)據(jù)探索、分析和建模服務(wù)。該平臺收錄超過1900個數(shù)據(jù)集,包含約1.25億個獨(dú)特細(xì)胞,是目前全球最大的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫之一。CELLxGENE的優(yōu)勢不僅在于數(shù)據(jù)量大,更在于其嚴(yán)格的數(shù)據(jù)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)、強(qiáng)大的交互式探索能力、細(xì)致的細(xì)胞注釋信息和靈活的數(shù)據(jù)獲取方式。本文將介紹如何從CELLxGENE數(shù)據(jù)庫中下載到您研究需要的數(shù)據(jù)集。
CZ CELLxGENE Discover 數(shù)據(jù)庫使用方法
打開CZ CELLxGENE Discover官網(wǎng),便會看到如下界面(圖1)。界面中位于左上方的選項(xiàng)是該數(shù)據(jù)庫的幾個核心功能,它們分別是:
1、Collections:該數(shù)據(jù)庫收錄的研究項(xiàng)目,一個項(xiàng)目中可能包含多個數(shù)據(jù)集(Datasets),目前共有324個項(xiàng)目。
2、Datasets:該數(shù)據(jù)庫收錄的數(shù)據(jù)集,目前共有1919個數(shù)據(jù)集。
3、Gene Expression:允許用戶基于所有數(shù)據(jù)集,探索基因在不同細(xì)胞類型中的表達(dá)情況,以氣泡圖形式呈現(xiàn)。
4、Cell Guide:允許用戶基于所有數(shù)據(jù)集,獲得細(xì)胞類型的描述、marker和相關(guān)數(shù)據(jù)集。
5、Differential Expression:允許用戶基于所有數(shù)據(jù)集,查找自定義細(xì)胞群之間的差異表達(dá)基因。
圖1. CZ CELLxGENE Discover首頁
選擇“Collections”,進(jìn)入結(jié)果頁面(圖2)。新頁面給出每個研究項(xiàng)目的信息,包括名稱、發(fā)表信息、包含的組織數(shù)量、疾病類型和物種信息。頁面左側(cè)可根據(jù)用戶需求對研究項(xiàng)目進(jìn)行篩選,可供篩選的標(biāo)簽有:
1)Assay:選擇實(shí)驗(yàn)方法
2)Cell Type:篩選包含目的細(xì)胞類型的研究項(xiàng)目
3)Consortia:篩選特定大型生物醫(yī)學(xué)研究聯(lián)盟或項(xiàng)目所貢獻(xiàn)的數(shù)據(jù)集
4)Development Stage:選擇樣品的發(fā)育階段
5)Disease:篩選疾病類型
6)Organism:選擇物種
7)Publication:選擇已發(fā)表的文獻(xiàn)
8)Publication Data:篩選文獻(xiàn)發(fā)表的時間范圍
9)Self-Reported Ethnicity:選擇人種
10)Sex:選擇性別
11)Tissue:選擇目的組織類型
圖2. CZ CELLxGENE Discover 的研究項(xiàng)目列表
打開第一個研究項(xiàng)目進(jìn)入其詳情頁后(圖3),可以查看該項(xiàng)目的完整信息。頁面中會顯示該研究的詳細(xì)描述和發(fā)表信息,下方則列出了該項(xiàng)目包含的全部數(shù)據(jù)集——這些數(shù)據(jù)集均以h5ad對象文件格式存儲。每個對象文件的名稱、組織樣本數(shù)量、疾病類型、實(shí)驗(yàn)次數(shù)、物種信息以及細(xì)胞數(shù)量等詳細(xì)參數(shù)均有明確標(biāo)注。點(diǎn)擊右下角“Download”圖標(biāo),在彈出的窗口中可選擇通過瀏覽器、R API或Python API下載數(shù)據(jù)集。
圖3. 人胎兒視網(wǎng)膜項(xiàng)目詳情頁
點(diǎn)擊“Explore”圖標(biāo),可查看該數(shù)據(jù)集中的細(xì)胞信息,以2D的細(xì)胞降維圖形式呈現(xiàn)(圖4)。界面中間是細(xì)胞的UMAP降維結(jié)果,左側(cè)可選擇感興趣標(biāo)簽,了解細(xì)胞的分類信息。點(diǎn)擊水滴圖標(biāo)可使細(xì)胞著色(圖5)。右側(cè)可輸入感興趣基因或創(chuàng)建基因集,并在降維圖上直觀顯示基因或基因集的表達(dá)情況(圖6)。
圖4. 人胎兒視網(wǎng)膜數(shù)據(jù)集的細(xì)胞信息
圖5. 人胎兒視網(wǎng)膜細(xì)胞類型分布
圖6. 基因SOX2的表達(dá)分布
本期我們系統(tǒng)地介紹了如何從CZ CELLxGENE Discover這一權(quán)威平臺精準(zhǔn)搜索和高效下載單細(xì)胞數(shù)據(jù)集,希望能切實(shí)助力您的研究工作。我們后續(xù)也將持續(xù)推出更多生物學(xué)數(shù)據(jù)庫的介紹,如果您有特別想了解的數(shù)據(jù)庫,歡迎在評論區(qū)留言告訴我們!