三代測(cè)序的原理
一、測(cè)序原理先介紹 nanopore 測(cè)序中的幾位主角:
reader :在自然界中,有一種可以嵌入到細(xì)胞膜中作為離子或分子通道的跨膜蛋白,具有**的蛋白納米孔。經(jīng)過人為基因工程修飾后,得到的就是 nanopore 測(cè)序所需的 reader 蛋白。
membrane:reader 蛋白會(huì)被嵌入到高電阻率的 membrane (人工合成的多聚物膜),膜兩側(cè)是離子溶液,在兩側(cè)加不同的電位,離子就會(huì)在孔中流動(dòng),形成電流。
motor:在 nanopore 文庫構(gòu)建時(shí),需要在接頭上連接一種動(dòng)力蛋白,用于將dna或rna分子推入納米孔中。以dna解螺旋酶作為 motor(動(dòng)力蛋白)為例,它可以除了可以解開雙螺旋,使之變?yōu)閱捂湥€可以提供推動(dòng)力。
tether:該蛋白用于錨定dna或rna鏈,防止在溶液中飄動(dòng),并使其進(jìn)入納米孔中。
這時(shí),解開的其中一條鏈會(huì)穿過蛋白質(zhì)孔,它在通過蛋白孔時(shí),會(huì)對(duì)膜兩邊離子的穩(wěn)定流動(dòng)產(chǎn)生擾動(dòng)。不同的堿基,對(duì)離子流的影響不同,也就會(huì)產(chǎn)生不同的電流大小,進(jìn)而形成下面的電流信號(hào)圖。
利用這些電流信號(hào),使用計(jì)算機(jī)軟件識(shí)別后,推斷出堿基類型,完成測(cè)序。
二、測(cè)序儀介紹雖然 nanopore 測(cè)序儀種類很多,但都是基于nanopore芯片來搭建的平臺(tái),大到由多個(gè)芯片陣列組成的promehion,gridion系列測(cè)序儀,小到可以連接手機(jī)的type c,電腦usb的mnion系列便攜式測(cè)序儀。
這里邊,較*的就是mnion系列,2016年8月,美國(guó)宇航員凱特·魯賓斯在**空間站完成微重力條件的dna測(cè)序。
它在測(cè)序時(shí),一般像下圖這樣連接就行,顯而易見的便攜性。比如,可以直接用它在深入疫區(qū)采集樣本后進(jìn)行實(shí)時(shí)分析,為防疫工作爭(zhēng)取大量寶貴的時(shí)間和資源。
測(cè)序時(shí),將制備好的文庫或樣本溶液,滴在芯片小孔中,開始測(cè)序。
一張芯片中有 2048 個(gè) membrane wells,也就是芯片上的一個(gè)孔,每個(gè)孔包含一個(gè)nanopore reader。
每四個(gè) wells 共享一個(gè) amplifier(信號(hào)放大器),一張芯片中有 512 個(gè)信號(hào)放大器,也就是 512 組 wells。
在啟動(dòng)測(cè)序儀后,機(jī)器自檢,會(huì)將每組 wells 中依據(jù)效率高低排序。測(cè)序開始,儀器先用每組 wells 中效率較高的 wells,運(yùn)行 8 小時(shí)后,更換效率*二的,以此類推。
但是,在實(shí)際使用過程中,只有 1200 個(gè) wells可以正常工作。
造成 wells 失效的原因:
wells 中沒有 reader 蛋白,或納米孔不通,這時(shí)無電信號(hào)
膜破損,這時(shí)有強(qiáng)電信號(hào),不能正常測(cè)序
在單個(gè) well 中有兩個(gè)及以上的 reader 蛋白,電信號(hào)互相干擾
三、建庫方法1、1d 文庫1d文庫是將dna雙鏈,解鏈為正義鏈與反義鏈,分別測(cè)序,大約有 85% 的堿基判讀準(zhǔn)確率。
目前1d文庫有兩種建庫方案:
標(biāo)準(zhǔn)建庫
將 dna 打斷
補(bǔ)齊dna末端,末端加 a 堿基
連接 adapter( 接頭序列),接頭上連有 motor 蛋白
接頭中有一段序列可以與 tether 蛋白結(jié)合,作用是為了將 dna 鏈吸附在膜上,將 dna 錨定,不易被溶液洗走
下圖是 tether 與接頭序列識(shí)別及錨定過程
轉(zhuǎn)座酶建庫
建庫時(shí)使用連有測(cè)序接頭的轉(zhuǎn)座酶,該酶可以將長(zhǎng)鏈 dna 鏈切斷
由于該酶的特性,會(huì)在dna的斷點(diǎn)兩端加接頭序列
隨后在測(cè)序接頭加入 motor 蛋白
2、 文庫在 dna 兩側(cè)接 接頭,其他步驟和 1d 文庫類似。
這種文庫中的 接頭,可以讓*二鏈緊跟**鏈來一起測(cè)序。
由于可以測(cè)到兩條鏈,可以相互矯正,進(jìn)而提高判讀準(zhǔn)確率,能達(dá)到 90%以上的堿基判讀準(zhǔn)確率。
但是,由于文庫質(zhì)量,蛋白活性等因素,導(dǎo)致并不是所有的**鏈后都會(huì)測(cè)到*二鏈。
四、堿基判讀在測(cè)序過程中,得到的信號(hào)并不是每次測(cè)得一個(gè)堿基信號(hào)。而是根據(jù) reader 蛋白孔的縱向長(zhǎng)度,r9 大約為 5 個(gè)堿基長(zhǎng),也就是說,同時(shí)會(huì)測(cè)得 5 個(gè)堿基的電信號(hào),這并不是一項(xiàng)簡(jiǎn)單的判斷過程。
目前,nanopore 公司采用一種機(jī)器學(xué)習(xí)方法,遞歸神經(jīng)網(wǎng)絡(luò)(rnn),對(duì)堿基進(jìn)行判讀。
該過程簡(jiǎn)單來說,是將已知堿基序列的電信號(hào)波形圖做訓(xùn)練集和測(cè)試集,通過修正參數(shù),拿到模型。最后,將新測(cè)到的未知序列的波形圖與之比對(duì),從而提高判讀準(zhǔn)確率。
但是,還是有誤讀情況:
由于空間結(jié)構(gòu)相似性,嘌呤間誤讀,嘧啶間誤讀較容易發(fā)生。
堿基復(fù)雜度低的序列(如,polya序列),較容易誤讀
五、測(cè)序影響因素電壓以r9芯片為例,測(cè)序過程,先用 180 mv 電壓,每 10 min,短時(shí)間翻轉(zhuǎn)電壓方向,作用是激活被堵住或卡住的 reader 蛋白孔。但是,這個(gè)過程也會(huì)使正常測(cè)序的 dan鏈倒吐回去。
隨著電極使用時(shí)間的增加,電極的電壓會(huì)發(fā)生漂移,因此每過兩小時(shí),要增加 5mv 電壓抵消影響。
速度與產(chǎn)量r9 芯片,測(cè)序速度是 250 堿基/s,一張芯片可以得到約 5 ~ 10 g的堿基序列。
北京立博泰業(yè)科技有限公司專注于離心機(jī),三代測(cè)序,純水儀,正倒置一體研究級(jí)顯微鏡等