2021-06-08
包含1.3億個(gè)突觸、數萬個(gè)神經元、很白1.4PB的人類腦組織小樣本渲染圖,谷歌和(hé)哈佛研究團隊發布了一份迄今秒街最大的「H01」人腦成像數據集。
2020年1月(yuè),谷歌推出了果蠅的半腦連接體照服,這個(gè)在線數據庫提供了果蠅半腦的形拍畫态結構和(hé)突觸聯系。這個(gè)數據庫及其配套的可(kě)錢空視化工具果蠅大腦中(zhōng)神經回路(lù)的研究和(hé)理解坐低方式。雖然果蠅的大腦很小,可(kě)以使用現代映射技術(s討暗hù)獲得相對完整的圖譜,但獲得的洞見對于理解神經科學中(zhōng)最暗農有趣的對象——人類大腦還遠(yuǎn)遠(yuǎn)不夠。
這個(gè)新的「連接體」描繪了果蠅大腦中(zhōng)大約25000個(gè)神經元,這裡顯示了其中(zhōng)的一部分。
「H01」數據集:數萬個(gè)神經元、1.3億個(gè)突觸
基于此,谷歌聯合哈佛大學Lichtman實驗室于近日推出了「H01」數據集,這是一個(gè)1.4PB的人類腦組織小樣本渲染圖。H01樣本通(tōng)過連續切片電子(zǐ)顯微鏡獲得了4nm分辨率的圖像,利用自動(dòng)計算技術(shù)進行重建和(hé)注釋,并文術進行分析以初步了解人類皮層的結構。該項目的主要目标是為研究人腦紅頻提供一種新的資(zī)源,并改進和(hé報河)擴展潛在的連接組學技術(shù)。
「H01」數據集包含了大約1立方毫米腦組織的成像數據,包括數以萬計的重建神經元、數百萬個(gè)神經元片司近段、1.3億個(gè)帶注釋的突觸、104個(gè)校(xiào)對過的細胞,以及許多額外的亞細胞注釋和(農她hé)結構,所有這些都可(kě)以通(tōng)過Neuroglancer浏覽器(qì)界面輕松訪問(wèn)。
這是迄今為止人類編制的最全面、最詳細的「人類大下西腦地圖」,也是第一個(gè)大規模研究人類大腦皮層問民的突觸連接的樣本,該成果為研究人類大腦提相樂供了重要資(zī)源。這一樣本仍然隻是整個(gè)人類話那大腦容量的百萬分之一,未來的擴展研究仍然是一個友風(gè)巨大的技術(shù)挑戰。
數據集地址:https://h01-release.storage.googl年看eapis.com/landing.html
左:數據的小子(zǐ)集;右:數據集中(zhōng)5000個(gè)神經元,以及興奮性(綠色)和(hé)抑制性(紅色)連接車低的子(zǐ)圖
大腦皮層是脊椎動(dòng)物大腦的薄表層,在不同的哺乳快的動(dòng)物中(zhōng)尺寸差異較大(尤其關能在人類中(zhōng))。大腦皮層的每個(gè)部分都有六層,風們每層有不同種類的神經細胞。大腦皮層在高級認知功能(比如(rú)思考、記憶、計唱人劃、感知、語言和(hé)注意力)中(zhōng)起着至關(作男guān)重要的作用。人類雖然在這種複雜組織的宏觀結吃車構理解上已經取得了一些進展,但對于單個(gè)神經細胞及其相互見來連接的突觸水平上的組織結構還不清楚。
大腦側視圖
人類大腦連接學:從外科活檢到3D數據庫
以單個(gè)突觸的分辨率繪制大腦結構圖需要高分辨率東為顯微鏡技術(shù),這種技術(shù)可(kě)以對生物化學穩定的組織進快水行成像。研究團隊與腦外科醫生合作,他們在進行治療癫痫的答裡手術(shù)時,有時會把正常人大腦皮層的一部分切掉,以便進入畫雨大腦深處癫痫發作的位置。被切掉的部分通(tōng)常會被丢棄,而研究者得到了資靜病人匿名捐贈的這個(gè)組織,以供Lichtman實驗室的同事做研究。
哈佛大學的研究人員使用一台自動(dòng)我兵化磁帶收集超微切片機,将組織切割成約5300個(gè)30納米的切片,将這些切片放到矽片上,然後在一台定制的61束平行掃描電子(zǐ)顯微鏡中(zhōng)以4nm分辨率對腦組織進行成像,以便快速獲取圖像。
對約5300個(gè)物理切片進行成像産生2.25億張單獨的2D圖像。研究團隊将這些數據拼接(stitch)和(hé)對齊(align),生成一個(gè)單一的3D體積(volume)。雖然數據質量都很好,但這些對齊(alignment)pipeline必須有力地處理許多挑戰,包括成像僞影、切體農片缺失、顯微鏡參數的變化以及組織的物理拉伸和(hé術山)壓縮。對齊之後,一個(gè)使用了數千谷歌雲TPU、多尺度的flood-filling Network pipeline就會被應用于生成組織中(zhōng)每個(gè)單獨細胞的從白3D分割。
此外,其他的機器(qì)學習算法被應用于識别和(hé)表征1.3億個(gè)突觸,将每個(gè)3D片段分類為不同的子(zǐ)區域(如(rú)軸突、樹(shù)突或細但唱胞體),并識别其他感興趣的結構,如(rú)髓磷脂和(hé)纖毛。自動(近人dòng)重建的結果并不完美,所以人工校(xiào)對了大線身約100個(gè)細胞的數據。随着時間推移,研究團隊希望通(tōng)過額外的手動(d麗家òng)操作和(hé)自動(dòng)化的進一步發展,在這個(gè)經新話過驗證的集合中(zhōng)添加額外的細胞。
成像數據、重建結果和(hé)注釋都可(kě)以通(t用我ōng)過基于web的交互式3D可(kě)視化界面查看,這個(gè)界面叫做Neuroglancer,最初是為了可(kě)視化果蠅的大腦而開發的。
Neuroglancer界面截圖
Neuroglancer是開源的,被廣泛的應用于連接組學領域。研究團隊引入新特征來支持分析H01數據集,特别是支持根據神經元的類型或其他屬性搜索數據集書件中(zhōng)的特定神經元。
連接H01和(hé)注釋的Neuroglancer接口。用戶可(kě)以根據細胞的層次和(hé)要亮類型選擇特定的細胞,可(kě)以查看輸入和(hé)輸出的突觸。黃答
H01為大腦皮層研究奠定了基礎
目前,這項研究的最新成果《A connectomic study of a姐金petascale fragment of 線錯human cerebral cortex》已經發表在bioRxiv上,研究者展示了H01是如(rú)何被用來研究人類大腦皮層組織有趣方面。特别是,新的細胞類型已術話經被發現,以及「異常」軸突輸入的存在,它們與目标樹(shù)突建他空立了強大的突觸連接。雖然這些發現是一個(gè)數友有希望的開始,但龐大的H01數據集,将為大腦皮層的進一步研究奠定基礎。
論文(wén)地址:https://www.biorxiv.org/照藍content/10.1101/2021.05.29.446289v1
為了加快對H01分析,研究團隊還提供了使用SimCLR自監督學習變體訓練神經網絡生成的H01數據的嵌入。研究團隊使用Googl eCloud TPU pods對這些嵌入進行了訓練,然後對分布在整個(gè)體積下行中(zhōng)的大約40億個(gè)數據位置進行了推斷。
自監督學習嵌入(embeddings)
H01是一個(gè)PB級的數據集,但隻有整個(gè)人腦的百萬分之一。在将突觸級别的大腦映射擴展到我員整個(gè)老鼠大腦(比H01大500倍)存在嚴重的技術(shù)挑戰,更不用務煙說整個(gè)人類大腦了。面臨的一個(gè)挑戰是數據存儲:一個(gè)老鼠厭說的大腦可(kě)以産生一個(gè)EB級的數據,需要昂貴的存儲。為了解決這個(gè)問(wèn)題,研究團習店隊還發表了一篇論文(wén)《Denoising-based Image Compres舞紅sion for Connectomics商坐》,論文(wén)中(zhōng)描述了如(rú)何使用基于機器(qì)學習不資的去噪策略來壓縮數據的細節,例如(rú)H01,至少(shǎo)17-fold(下(xià)圖中(zhōng)的虛線),在自動要得(dòng)重建中(zhōng)精度損失可(月門kě)以忽略不計。
論文(wén)地址:https://www.biorxiv.去件org/content/10.1101/2算子021.05.29.445828v1
未來,數據集的龐大規模要求研究人員開發新的策略,來組織和女場(hé)訪問(wèn)連接數據中(zhōng北近)固有的豐富信息,這也是谷歌研究者提到未來繼續努力的方相線向。
(轉載自機器(qì)之心)