20190501-0507 RAD-Seq Library備置測試

主要使用陳凱儀 老師lab的protocol

1.2 限制酶切割

使用Cut Smart Buffer,37°C培養,使用PCR機。

1.3 P1 Adapter連結酶反應

1.4 樣本合併

一次震碎體積為100uL,一次可震12個合併樣本。40個樣本,每個需取(1200/40)uL。

1.5 混合樣品DNA分子的隨機斷裂

第一次使用7cycles (15on/90off,為bioruptor的400bp建議設定)。但結果發現,大部分片段散開,片段大小不集中。皆不若上次

20190501Rad-bio

接續為4cycles ,接續上補,並確認膠圖,直至片段多集中於400~500bp為主。

最多震碎cycles為7+4+4+4+4,最少為7+4+4。

20190502Rad-bio
此圖如B,便為可符合此步驟標準。

12管,由我和瓊之一人六管(為原來protocoal的總量),兩人分別繼續後續步驟。

1.6 DNA的濃縮與片段篩選

此步驟的DNA濃縮,使用Monarch® PCR & DNA Cleanup Kit (5 μg) 兩管回收,Wash buffer步驟僅使用兩次,使用水回溶,最後合併約70ul的溶液。

片段篩選後,最後回溶25uL左右,測濃度和跑膠各使用1uL,故剩餘23uL。

20190502 after AMpure

此步發現,>500bp的DNA片段過多(濃度大),故又另將>500bp的DNA片段震碎。並以標記「」和原200~500bp在分管進行。

20190503 after AMpure

此步之後,我和瓊之各有兩管:一為原200~500bp(我:35ug/uL,瓊之:24.2ug/uL),另一為 • 200~500bp (我:18.1ug/uL,瓊之:12.2ug/uL)分管進行下面步驟。

1.7 DNA破裂端修補反應

由於總兩管總量(200~500bp、 • 200~500bp,體積為23uL)皆不足所需的1ug。故將其真空濃縮至19uL,以符合此步驟體積。

1.8 P2 adapter連結反應

此步驟共有5步:1.8 11.8 21.8 31.8 41.8 5,最後回溶22uL,測濃度和跑膠各使用1uL。(1.8 11.8 31.8 5,有留約1ul後續一起跑膠。

片段篩選後的RAD library template濃度為:我:1.8 5:7.5ug/uL、 • 1.8 5:3.82ug/uL,瓊之:1.8 5:6.52ug/uL、 • 1.8 5:4.48ug/uL(protocol階段目標至少為:3ng/ul,最後體積為20ul,DNA量才能達50ng。)

1.9 RAD tag 擴增

1.9 1:RAD library template擴增。

我:1.8 5:7.5ug/uL,取7uL、  1.8 5:3.82ug/uL,取14uL,達50ng,開始擴增。

亦測試:我:1.9 1:0.436 ug/uL,瓊之:1.9 1:0.578 ug/uL。(此步體積為100ul,DNA總量為50ng。和當初放入的DNA總量一樣,並未擴增。)

1.9 2:RAD library template擴增+純化。

20190507RADseq1.9.jpg

1.9 經0.7倍磁珠純化後的 1.9 2,幾乎已無DNA。

 

20181018 RAD-Seq Library備置測試

接續20181017 RAD-Seq Library備置測試使用NEBNext® Ultra™ II DNA Library Prep Kit for Illumina®的protocol。

1.1 NEBNext End Prep

使用10/17這管,20ul(濃度31.6ng/ul)開始此步驟。這管全部接續下面步驟。(此kit建議起始DNA量:500pg~1ug,故為符合。)補水30ul,達kit要求體積50ul。

1.2 Adaptor Ligation

10/17使用新的P2 Adapter 1ul。

1.3 Size Selection or Cleanup of Adaptor-ligated DNA

上一步最後總體積為93.5ul,接續此步驟。

1.4 PCR Enrichment of Adaptor Ligated DNA

1.5 Size Selection or Cleanup of Amplification

膠圖很糟,需要再重跑10/18 Final(擴增並且最後一步Size Selection結束。)RAD template已用完。從濃度來看,應有擴增,但效率不佳。

USER 2018-10-18 16hr 13min.jpg

___________________________________

接續

1. 重新跑10/18 Final的膠,確定片段大小。(*20181023更新:已重新跑膠。)

2. 從樣本合併剩餘樣本(約剩17ul)開始。

 

USER 2018-10-23 09hr 47min

20181017 RAD-Seq Library備置測試

此次目標為:確定擴增問題是否為P2 Adapter的量。此篇主要解決要點:

  1. P2 Adapter減量:1ul。

_______________________________

1.2 限制酶切割

1.3 P1 Adapter連結酶反應

1.4 樣本合併

1.5 混合樣品DNA分子的隨機斷裂

使用9/20用剩之6管(20180918-28 RAD-Seq Library備置測試),10/17以下步驟剩餘後六管開始

1.6 DNA的濃縮與片段篩選

10/17 此步驟的DNA濃縮,使用Monarch® PCR & DNA Cleanup Kit (5 μg) 兩管回收(三震碎管入一管濃縮),Wash buffer步驟僅使用一次(Kit protocol中為兩次),使用水回溶,最後合併約70ul的溶液。(回溶分兩次:第一次20ul,第二次15ul。)

10/17 階段目標的膠圖和濃度:片段為200~500bp之間,濃度為31.6ng/ul,回溶23ul(-2ul於跑膠和測濃度)。>500bp濃度為28.2ng/ul。USER 2018-10-17 14hr 57min.jpg

後續使用NEBNext® Ultra™ II DNA Library Prep Kit for Illumina®的protocol。

 

20181004-12 RAD-Seq Library備置測試

接續20181004 Pst1 活性測試。此次目標為:解決擴增問題。此篇主要解決要點:

  1. 破碎DNA: 300 – 400 bp。
  2. P2 Adapter減量:1ul。
  3. 比較單純擴增後的濃度和膠圖。

 

10/4 使用Sample:20181004 Pst1 活性測試

1.2 限制酶切割

使用新購Pst1。20181004 Pst1 活性測試

1.3 P1 Adapter連結酶反應

20181004 Pst1 活性測試

1.4 樣本合併

由於只有三個樣本,每個樣本使用17ul置於一管(總體積約為50ul),進行下一步震碎。

1.5 混合樣品DNA分子的隨機斷裂

震碎為一管為須震碎樣本(50ul),其於11管裝水,使用Biouptor Pico,由於上次經驗,一次10+10循環使片段過小(200~500bp),此次目標為300~400bp。

這個slideshow需要JavaScript。

1.6 DNA的濃縮與片段篩選

此步驟的DNA濃縮,使用Monarch® PCR & DNA Cleanup Kit (5 μg) 一管回收,Wash buffer步驟僅使用一次,使用水回溶,最後約70ul的溶液。

10/11 (原10/4)片段篩選:此次片段篩選較為準確,從膠圖中能看出兩次片段篩選有差異,但300-500bp片段較少。但由於這次測試下的量較少(以往12管濃縮成一管,這次就三個樣本1管),故無法達成階段濃度50ng/ul。

USER 2018-10-11 17hr 14min

1.1 NEBNext End Prep

10/11 約剩20ul(濃度2.88ng/ul),這管全部接續下面步驟。(此kit建議起始DNA量:500pg~1ug,故為符合。)補水30ul,達kit要求體積50ul。

9/20 這管10ul(濃度94.4ng/ul),開始此步驟。(為上次剩餘20180918-28 RAD-Seq Library備置測試)補水40ul,達kit要求體積50ul。

1.2 Adaptor Ligation

P2 Adapter減量:「宜軒使用量:P2 Adapter 10uM(自製)使用量:1ul。」

10/11 使用新的P2 Adapter 1ul。

9/20 使用舊的P2 Adapter 1ul。(2016年分裝,為當時從台大帶過來的。)

1.3 Size Selection or Cleanup of Adaptor-ligated DNA

上一步最後總體積為93.5ul,留下3.5ul,進行跑膠測試。以90ul接續此步驟。

#此處低級錯誤,由於最後的9/2010/11template管子忘記標示,無法區分,以左右表示。>500管子都有區分。(請務必注意,管子標誌問題!!!)

USER 2018-10-12 14hr 46min.jpg

1.4 PCR Enrichment of Adaptor Ligated DNA

使用陳老師protocol的AMPure的片段篩選。從膠圖來看,結果是稍有擴增的(又以10/11 >500的為明顯,但不明白為什麼9/20的擴增前反而比擴增後的亮。)。由於此次在最後一次的磁珠片段篩選前有跑膠,故還可看見下方有dimer殘留。

USER 2018-10-12 16hr 00minUSER 2018-10-12 16hr 02min

1.5 Size Selection or Cleanup of Amplification

尚未操作。

 

___________________________________

上次潛在問題 和 此次改善:

1.限制酶 Pst1-HF為台大所帶過來,為去年(2017)購買,是否失效?

A: 此次測試10/11為新購Pst1-HF。

2.是否P2 Adapter放太多了?

A: P2 Adapter減量,使用量:1ul。

3.Solexa primer為台大所帶過來,為去年(2017)購買,是否失效?

A: 不確定效率,但以此次測試經驗,應有擴增成功。

4.擴增失敗原因,不知道是最後一步片段篩選的問題,或是真的擴增失敗?(擴增失敗原因可能為?)

A: 此次在最後一次片段篩選前,有和template做比較跑膠。可以發現有些為擴增跡象,以及dimer。

___________________________________

20181004 Pst1 活性測試

接續上篇實驗紀錄20180918-28 RAD-Seq Library備置測試,開始嘗試解決為成功擴增問題。由於研究室的Pst1限制酶已過期,且並未分裝。故先以接P1前的Pst1的限制酶活性為此篇主要解決要點:購買新的Pst1,並以其和過期的Pst1,測試新舊效果。

10/4 使用Sample如下:

P1 Adapter
ng/uL
需要1ug所需的量 (uL)(1ug=1000ng)
實驗用量(四捨五入)
補水(總體積44uL)
1
CF023
KFC  3604-4
93
10.75268817
11
33
2
CF025
KFC  3604-6
99.8
10.02004008
11
33
3
CF026
KFC  3605-3
92.4
10.82251082
11
33

結果

USER 2018-10-04 13hr 45min (1).jpg

發現:切割過後的DNA大小並未有明顯差異,並無法以膠圖確認限制酶活性。若以新的限制酶能有效切割為前提,此結果有可能為:1. Pst1切割後,DNA片段依然為大? 2. 舊的限制酶依然可以使用?

接續:使用此3個 10/4 sample繼續接下來的實驗步驟,藉著上次經驗:

1. 在破碎DNA時請注意:「直到大多數的 DNA 分子大小斷裂成為 300 bp 到 400 bp 之間。」不可太小,一上次經驗,直接10+10循環會使片段過小(200-300 bp)。可先測試:10、10+5。一管裝盛50uL。

2. P2 Adapter減量:「宜軒使用量:P2 Adapter 10uM(自製)使用量:1ul。」

3. 測試單純擴增後的濃度和膠圖。

___________________________________

20180918-28 RAD-Seq Library備置測試中的9/20這管(剩餘約10ul)繼續:

1. P2 Adapter減量:「宜軒使用量:P2 Adapter 10uM(自製)使用量:1ul。」

2. 測試單純擴增後的濃度和膠圖。

 

 

20180918-28 RAD-Seq Library備置測試

此次備置測試的樣本取得和標準:(寄給黃雅怡 博士的信件內容)

Test Run會以HiSeq 2500 pairend 100 bp定序,使用限制酶為PstI。這個lane中會有約40~50個個體間,所以會需要你們的個體數約有十個。(另外我們還有其他預計樣本:構樹*30、龍膽屬*10)由於實驗要一起執行,但因其他樣本都尚未備齊,預期在八月中下旬開始製備。所需樣本DNA條件如下:

1. 1μg genomic DNA,濃度 >25 ng/μL
也就是1μg DNA要溶於小於44 μL的水,不符合的話,請濃縮,或DNA量要足夠。DNA量"至少 “1 μg,如果可以多一點會更好。

2. 回溶DNA的液體請用水,不要TE buffer
特別注意絕對不要有鹽份和酒精的殘留,在抽取DNA時酒精要充分揮發。

3. DNA品質,不可有二次代謝物或色素
我是使用Monarch® PCR & DNA Cleanup Kit (5 μg)。
請記得所第1.點要求的DNA濃度是在純化後的濃度,簡單說DNA的質和量都要達標準。

4. DNA片段大小完整,不要smear

此次測試注意:

1. 不要來源難以取得或DNA量稀少的樣本
我過去是在台大別人的研究室做這個實驗,故目前尚未在中研院研究室獨立做過RAD-Seq Library製備,所以此次test run主要目的是以測試、建立經驗為主。等此次後成功之後,再來嘗試那些樣本比較保險。(簡單說,若不小心失敗,我會自責毀了你們的心血)

2. 預計在8/13那禮拜給我樣本
如果可以,先寄給我看一下DNA的相關品質資料:260/280 ratio、260/230 ratio(nanodrop)、ng/μL(Qubit)和膠圖。

___________________________________

9/17 使用Sample如下:

P1 Adapter
ng/uL
需要1ug所需的量 (uL)(1ug=1000ng)
實驗用量(四捨五入)
補水(總體積44uL)
1
CF023
KFC  3604-4
93
10.75268817
11
33
2
CF025
KFC  3604-6
99.8
10.02004008
11
33
3
CF026
KFC  3605-3
92.4
10.82251082
11
33
4
CF027
KFC  3605-4
106
9.433962264
10
34
5
CF008
KFC  3606-1
45.2
22.12389381
23
21
6
CF028
KFC  3606-3
110
9.090909091
10
34
7
CF029
KFC  3608-3
102
9.803921569
10
34
8
CF030
KFC  3608-4
64.6
15.47987616
16
28
9
CF012
KFC  3609
28.4
35.21126761
36
8
10
CF013
KFC  3610
36.8
27.17391304
28
16
11
CF034
KFC  3611
70.6
14.16430595
15
29
12
CF037
KFC  3613-5
98.8
10.12145749
11
33
13
CF038
KFC  3614-1
66.4
15.06024096
16
28
14
CF016
KFC  3615
33.4
29.94011976
30
14
15
CF018
KFC  3616-2
45
22.22222222
23
21
16
CF042
KFC  3617-2
31.4
31.84713376
32
12
17
CF043
KFC  3618-1
29
34.48275862
35
9
18
CF045
KFC  3618-3
76
13.15789474
14
30
19
CF046
KFC  3619-1
104
9.615384615
10
34
20
CF047
KFC  3619-2
52.6
19.01140684
20
24
21
CF051
KFC  3619-6
90.6
11.03752759
12
32
22
CF058
KFC  3619-G
94.2
10.61571125
11
33
23
CF060
KFC  3620-2
69.4
14.4092219
15
29
24
CF061
KFC  3620-3
54.4
18.38235294
19
25
25
CF062
KFC  3621
27.8
35.97122302
36
8
26
CF067
KFC  3625
31.2
32.05128205
33
11
27
CF068
KFC  3628
47.4
21.09704641
22
22
28
CF069
KFC  3629
38.2
26.17801047
27
17
29
C252
KFC3601_6
156
6.41025641
7
37
30
CF073
KFC  3643-4
108
9.259259259
10
34
31
FG26
37
27.02702703
28
16
32
GB1
63.8
15.67398119
16
28
33
GB2
39.8
25.12562814
26
18
34
LM15
39.4
25.38071066
26
18
35
LM19
51.6
19.37984496
20
24
36
LM3
71.4
14.00560224
15
29
37
MD7
38.2
26.17801047
27
17
38
SUGM19
63.2
15.82278481
16
28
39
WA2-5
39.6
25.25252525
26
18
40
WK7
36.2
27.62430939
28
16
41
4
28.7
34.84320557
35
9
42
12
31.4
31.84713376
32
12
43
20
34
29.41176471
30
14
44
23
27.1
36.900369
37
7
45
24
27
37.03703704
38
6
46
25
29.28
34.15300546
35
9
47
27
32.9
30.39513678
31
13
48
32
25.2
39.68253968
40
4
49
33-2
28.4
35.21126761
36
8
50
24-1
25.4
39.37007874
40
4

P1 Adapter 1~30為構樹(DNA來自嘉瑢)、31~40為珊瑚(DNA來自黃雅怡博士)、41~50為龍膽(DNA來自景淞)。濃度為DNA抽取者所提供。在實際操作時發現:在做的時候發現黃博士給我的十個sample,有七個sample的DNA量都不足1ug。如FG26濃度為37 ng/ul,那至少要有28 ul,才有1ug (37*28=1036 ng),不過他們的sample的體積都只有約15 ul。由於事先沒有再次檢查,但因為已經做下去又臨時無法改變,所以我只用了其中的三管(GB1、LM3、SUGM19)。

___________________________________

實驗protocol outline:這是由我改寫的protocol,此步驟在我的碩士論文研究中有使用過(當時擴增的效率並沒有使用陳老師protocol的好,故最後定序是使用後者protocol的樣本)。李宜軒亦使用此套protocol,在李宜軒的論文中有詳細記載。

主要使用陳凱儀 老師lab的protocol

1.2 限制酶切割

1.3 P1 Adapter連結酶反應

1.4 樣本合併

1.5 混合樣品DNA分子的隨機斷裂

1.6 DNA的濃縮與片段篩選

後續使用NEBNext® Ultra™ II DNA Library Prep Kit for Illumina®的protocol

1.1 NEBNext End Prep

1.2 Adaptor Ligation

1.3 Size Selection or Cleanup of Adaptor-ligated DNA

1.4 PCR Enrichment of Adaptor Ligated DNA

1.5 Size Selection or Cleanup of Amplification

___________________________________

1.2 限制酶切割(9/18 17:00 – 9/19 8:00)

潛在問題:限制酶 Pst-HF(2016/11過期)為台大所帶過來,是否已失效?

1.3 P1 Adapter連結酶反應(9/19)

1.4 樣本合併(9/19、9/20)

此步驟有個主要變因為DNA破碎機器改變:為使用Biouptor Pico。劉世慧 博士的經驗為:1. 大於3K的DNA經過三個循環(一循環為一次啟動/停止,皆為30秒),即可達300~700 bp。2. 裝取100ul的效率比裝載50ul的破碎效率好。故當時將陳老師的Protocol(每一個離心管裝50ul,至少總共21個循環)調整成:每一個離心管裝100ul,初次以2個循環,跑膠檢視片段大小,在逐一增加循環次數。

9/19:調整:每一管裝載100ul,故每個接完P1的樣本需各取28ul,最後合併為1200ul樣本,再分裝至12管0.65ml的microtube中。(注意!調整成100ul,預期外的問題*出在後續 1.6 DNA的濃縮與片段篩選。)

9/20:未調整:每一管裝載50ul,故每個接完P1的樣本需各取15ul,最後合併為600ul樣本,再分裝至12管0.65ml的microtube中。連結完成P1 Adapter的每個樣品體積為60ul,經9/199/20 兩次使用,目前剩餘60-28-15=17ul可從此步後續從新開始)。

1.5 混合樣品DNA分子的隨機斷裂

9/19:每一管裝載100ul,累加循環2、2+4、2+4+10、2+4+10+10循環。此測試發現:並沒有發生劉博經驗中的高破碎效率(差異可能為DNA的溶液差別?)。最後試出來的結果,和陳老師Protocol的次數相去不大。故我將此步驟維持為20個循環。

這個slideshow需要JavaScript。

9/20:每一管裝載50ul,直接10+10循環。此測試發現:大部分的片段為200~500bp左右。(9/20接下來僅用前面6管,剩餘六管可從此步驟開始。)(*20181017更新:此六管剩餘已於20181017 RAD-Seq Library備置測試使用完畢。)

USER 2018-09-20 15hr 54min.jpg

1.6 DNA的濃縮與片段篩選

9/199/20 濃縮:此步驟的DNA濃縮,使用Monarch® PCR & DNA Cleanup Kit (5 μg) 四管回收,Wash buffer步驟僅使用一次(Kit protocol中為兩次),使用水回溶,最後合併約70ul的溶液。

9/19 片段篩選:在DNA破碎的步驟,每一管裝載100ul,故DNA量其實為陳老師protocol量的兩倍,此時發現的預期外問題*為,DNA量增加兩倍,導致AMPure磁珠在操作上有很大的問題:幾乎無法受到磁鐵的吸引,磁珠和溶液無法分離。(9/19這管的實驗至此步停止)

9/20 片段篩選:在DNA破碎的步驟,每一管裝載50ul,在AMPure操作上順利。(接下來步驟由9/20這管繼續)階段目標的膠圖和濃度:片段為200~500bp之間,濃度為94.4ng/ul,回溶23ul(-2ul於跑膠和測濃度)。取DNA 1ug(此次使用為10ul,還剩餘約10ul,還可從此步後續從新開始)(*20181012更新:此管剩餘已於20181004-12 RAD-Seq Library備置測試使用完畢。)繼續下一步驟。

USER 2018-09-25 12hr 30min copy

後續使用NEBNext® Ultra™ II DNA Library Prep Kit for Illumina®的protocol

1.1 NEBNext End Prep

使用9/20這管,10ul(濃度94.4ng/ul)開始此步驟。

1.2 Adaptor Ligation

我這次測試P2 Adapter 10uM(自製)使用量:2.5ul。(宜軒:10uM, 1ul、Kit官方Adapter:15uM, 2.5ul)潛在問題:是否P2 Adapter放太多了?

1.3 Size Selection or Cleanup of Adaptor-ligated DNA

片段篩選後的RAD library template濃度為:5.72ng/ul(protocol階段目標至少為:4ng/ul,最後體積為15ul,DNA量才能達50ng。)

1.4 PCR Enrichment of Adaptor Ligated DNA

自製Solexa primer 10uM各放5ul,並使用Kit protocol中的PCR擴增程式。潛在問題:Solexa primer為台大所帶過來,為去年(2017)購買,是否失效?

1.5 Size Selection or Cleanup of Amplification

使用陳老師protocol的AMPure的片段篩選。結果並未擴增成功。潛在問題:沒有測試到單純擴增後的濃度和膠圖,不知是否為最後一步片段篩選的問題,或是真的擴增失敗。

USER 2018-09-27 16hr 51min.jpg

___________________________________

潛在問題 總整理:

  1. 限制酶 Pst-HF為台大所帶過來,為去年(2017)購買,是否失效?
  2. 是否P2 Adapter放太多了?
  3. Solexa primer為台大所帶過來,為去年(2017)購買,是否失效?
  4. 擴增失敗原因,不知道是最後一步片段篩選的問題,或是真的擴增失敗?(擴增失敗原因可能為?)

___________________________________

20181002 妤馨 建議:

我看了你的實驗紀錄。對於enzyme的活性有些懷疑。因為你是做complete digestion,可是在電泳圖看來,還有很多intact DNA。這代表這能有很多DNA沒有被切斷。不過這也有可能是酵素的特性。
不知道你之前使用這個酵素的經驗,是否也有很多intact DNA存留的情況
我以前測試酵素時,會拿一些DNA切切看,然後將具有相同濃度有切跟沒有切的DNA一起跑電泳,然後就會知道酵素有沒有切動以及切的效率為何
不知道你或宜軒以前成功的library是否有留下?假如你想知道Solexa primer是否失效,可以把以前已知濃度的library當作template,然後PCR看有沒有amplify成功

還有,實驗室的磁珠已經過期,雖然學姊有測試過沒有問題,還是得小心使用。
在1.6電泳圖裡,長度好像跟你標示的都不一樣,大部份的片段都集中在150bp? 有點不確定這個marker長度
在10+10的電泳圖裡,ladder最下面那一團不是100bp吧?假如我沒搞錯,這樣蠻多管的長度都只有100-200bp耶…

我 回覆:

1. 酵素反應後的片段大小。這點我覺得是我忽略的部分。我們之前不會特別測試酵素的活性(像是看膠圖這類的),這點我覺得很重要,非常感謝提醒。畢竟酵素也是前年買的,又從台大帶過來,我想可能會有問題。
2. 這次震碎的片段大小都偏小。這是問題。圖上面標示的,是那次膠圖的目標大小,非實際大小。所以這次在DNA破碎上沒有掌控好。因為第一次分次2+4+10+10的流程,最後好像還是有很大片段,所以第二次我就直接連續的10+10,但就震太小了。這我有想過,這之後會在注意。只是覺得這應該不是影響沒有擴增的主因。不過很謝謝提醒。

現在我打算:買新的酵素。感覺舊的酵素(還沒有分裝)比新訂的primert出問題的機率高太多。

想入門RAD-Seq卻不知從何開始讀的文獻推薦

這篇寫給剛要入門NGS和相關實驗、或是要做RAD-Seq (或Target-enrichment) ,卻不知道要從何找起資料的你:

先釐清幾個名詞概念:

次世代定序Next Generation Sequencing (NGS) :主要以massively parallel sequencing的概念建構的高通量技術,達到同時高速大量的核酸定序。簡單說,他就只是一種定序的概念,不同公司就發展出不同的定序策略,以達到大量、平行定序的目標,常見的公司像是illumina系列。(這部分的介紹、優缺點、和Sanger定序比較很多,網路隨便google都有,中文資料也很多。)

圖書庫 建庫 Library Construction:要餵給NGS定序機器之前的實驗步驟(可以自己做或給別人做)依造你的材料或目標,又可以分成許多不同策略:像是RAD-Seq或Target-enrichment,底下也還有細分成不同方法,如[RAD seq之外] HyRAD & HyRADX就屬於在這個階層的範疇。

好,再來就幾篇文章可以先看:

RAD-Seq的原始使用,並非用在解決Phylogeny的領域,所以這幾篇介紹文獻,如2008年Baird等人寫的第一篇、第一次發表的RAD-Seq的文章,並沒有很好理解,畢竟他主要不是在做Phylogeny,但就經典就看看吧,算是對於RAD-Seq透測了解的知識:

Baird, Nathan A., et al. “Rapid SNP discovery and genetic mapping using sequenced RAD markers." PloS one 3.10 (2008): e3376.

Davey, John W., and Mark L. Blaxter. “RADSeq: next-generation population genetics." Briefings in functional genomics 9.5-6 (2010): 416-423.

接下來推薦一系列的文章,或是他其實是一本書。這本裡裡面有8個章節,八個大主題,很淺顯易懂,加上主題就是環繞在我們領域相關(Plant Systematics)以及NGS,讀起來也會比較輕鬆。雖然有點太淺顯,僅適合當入門閱讀,若要深入瞭解一些細節,就需要再自己找資料。裡頭的第六章就是介紹RAD-Seq。但可能要找找看,似乎太不好拿到電子檔。

Regnum Vegetabile Volume 158 Next-Generation Sequencing in Plant Systematics

這篇Nature的Review寫得很不錯,主要介紹了幾種RAD-Seq的不同變形。(我都戲稱他們為RAD-Seq家族),可以在弄懂了RAD-Seq的方法之後,擴展橫向知識的文章:

Andrews, K. R., Good, J. M., Miller, M. R., Luikart, G., & Hohenlohe, P. A. (2016). Harnessing the power of RADseq for ecological and evolutionary genomics. Nature Reviews Genetics17(2), 81.

關於使用RAD-Seq解決 維多利亞湖 慈鯛輻射演化的例子,這就是關於Phylogeny了,加上這類群又是非模式物種,和我的例子比較接近:(現在這類的應用已經非常廣泛,隨便找都有,只是就我讀的第一篇,內容也不會太艱澀)

Wagner, Catherine E., et al. “Genome‐wide RAD sequence data provide unprecedented resolution of species boundaries and relationships in the Lake Victoria cichlid adaptive radiation." Molecular ecology 22.3 (2013): 787-798.

再來就是在實驗操作RAD-Seq上(可以只看材料與方法部分即可),我是先看我的共同指導老師的文獻(中英文各一篇):

謝明修, 吳東鴻, and 陳凱儀. “使用限制酶位點標定之核酸定序法進行稉稻雜交組合之穗上發芽數量性狀基因座的遺傳定位." 作物, 環境與生物資訊, 11 (1): (2013): 11-25.

Chen, Ai-Lin, et al. “Reassessment of QTLs for late blight resistance in the tomato accession L3708 using a restriction site associated DNA (RAD) linkage map and highly aggressive isolates of Phytophthora infestans." PloS one 9.5 (2014): e96417.

 

以上幾篇就是先推薦給剛入門卻不知道要從何找起資料的你,可以先看看。這幾篇都看完之後,就會慢慢有方向,再來就可以去看看新一點的文章。RAD-Seq相關的文章,幾乎每個月都有新的文章,每次稍微找一下,都有最新的文章出爐(關於分析軟體、新的實驗流程、門檻值設定和缺值的探討、用在不同族群的應用等),最後就會讀出心得,尤其一開始對於一些專有名詞的混亂,這可能要稍微適應一下,在NGS這個領域到現在,無論是RAD-Seq或Target-enrichment,很多相同意思不同字,或是不同意思或同一字的情況很多,端看那篇文章採用哪一種,但也可以自己做一些筆記,幫助自己釐清。對了,上面有提到的Nature的Review(2016)中,旁邊的box裡有專有名詞解釋。

接下來我應該會再寫一篇關於RAD-Seq的Raw data整理和分析相關的文獻整理,先醬。

20180614 Linux 基本 筆記

[Linux] 新增修改刪除 管理 使用者/群組 指令

Linux 的 passwd 指令範例教學

主要會使用到的指令:

0.登入server

ssh barbara.pena@140.109.29.210

然後輸入密碼

 

1.指定 UID

假如我想創建使用者 test002 , UID 設為 1022

# useradd -u 1022 test002

 

2.變更使用者密碼

一般的使用者執行 passwd 即可變更自己的密碼:

passwd

而變更密碼之前,必須先輸入現行密碼:

正在變更 gtwang 的密碼。
(目前的)UNIX 密碼: 
輸入新的 UNIX 密碼: 
再次輸入新的 UNIX 密碼: 
passwd:密碼已成功地變更

如果是 root 管理者的話,可以變更任何使用者的密碼:

sudo passwd gtwang

 

3.到/home下面開啟個人資料夾

bochung@bochung:/home$ sudo mkdir /home/barbara.pena

並開啟他的權限

bochung@bochung:/home$ sudo chmod 777 home/barbara.pena

 

 

 

目前用戶:

id bochung
uid=1000(bochung) gid=1000(bochung) groups=1000(bochung),4(adm),24(cdrom),27(sudo),30(dip),46(plugdev),110(lxd),115(lpadmin),116(sambashare)

id yuhsin.tseng
uid=1001(yuhsin.tseng) gid=105(systemd-bus-proxy) groups=105(systemd-bus-proxy),27(sudo)

id LiuSH
uid=1002(LiuSH) gid=105(systemd-bus-proxy) groups=105(systemd-bus-proxy)

id champ
uid=1007(champ) gid=1007(champ) groups=1007(champ),27(sudo)

[RAD seq之外] HyRAD & HyRADX

之前妤馨學姊有分享capture,target enchantment的研究,最後他有提到關於HyRAD和HyRADX這兩種方法。我整理目前一些常見的方法,簡單和大家分享。

無論是要聊capture或是RADseq,一開始會先介紹Reduced Representation Library (RRL)的概念,以獲得Loci的方法來看,這樣的Libaray製備的概念,大概就介於sanger定序和全基因體定序之間,可能會覺得不需使用到全基因體的資料,但又覺得sanger定序的資料太少或是太沒有效率,就會偏向使用這樣的方法。RRL這樣的概念,可以用於random或target的基因體上。我們比較常見的,也是之前我和宜軒用的方法,像是RADseq就是,或是之前陳老師有做的ddRADseq,或是像林老師他們做的GBS。

這裡簡單介紹一下RADseq的概念。簡單說就是靠限制酶的切位,定序這個site的前後一兩百bp。所以理論上來說,這樣就可以獲得每一個樣本,一樣的loci進行後續的分析。但事實上,並不是所有樣本都可以這麼順利。有可能是coverage的不足,或是本身的DNA品質不好,或是根本切位已經突變,就無法被取樣到。最後還會因為資料的處理,導致有些明明有定序出來的無法使用。一來這些都是變成missing data的原因。二來這些其實這些沒有用到的序列也都會被定序。因為一個lane的資料總量都是固定的,如果我們訂了一大堆不需要也不會用到的,相對也壓縮到需要的loci定序深度。最後拿到可以用的matrix時,缺值的比例就會很高。大概都高於50%以上。這也是為什麼RADseq會讓人詬病的原因之一。

另外再提另一個也屬RRL的方法,就是妤馨學姊做的capture,target enchantment的方法。上次他已經詳細介紹過了。簡單說他就是透過設計好的probe label目標DNA,最後用beads抓取這些被label的DNA,把不要的洗掉,最後就可以單純拿到target的序列。

這裡我整理一下,RADseq有幾個缺點:DNA品質限制,最後訂到的序列來路不明,大量缺值的問題。target enchantment的方法能彌補這幾個缺點,但是target enchantment的方法本身也有一些缺點,像是要研究從零開始的非模式物種,就需要花多一些時間和金錢來設計這些probe。所以就出現了介於這兩種方法的折衷。

像是Rapture,但這個方法其實沒有什麼特別,就只是在普通的RADseq library的製備流程中,在adaptor上加上biotin,可以更精準地抓到目標,減少雜訊,最後也可以提高locus的coverage。像是REAL baits,他其實和等一下要介紹的HyRAD很像(RADseq-based capture),但這是GBS-based capture。或是像這是上禮拜茂綸學長有在我們研究室社團分享的EecSeq,這就有點像等等要介紹的HyRAD-X,但是在probe的library產生的部分,他不是使用限制酶去標定的,不會因為這樣限制probe的數量。反正就是有新方法就各取名字的時代,差別可能只有幾個步驟的方法組合差異,像是RADseq的變形方法,或是用什麼來設計probe。但其實概念都差不了多少。

先來看hyRAD,首先會先備製兩個library,簡單說就是一個是要被抓的,一個是抓別人的。要被抓的就隨便做就好,這裡就是用shotgun library,一些品質比較差的樣本就會放在這邊。另一邊是要設計用來抓別人,所以本身的DNA品質就要好一些,這裡使用ddRADseq的方法,最後得到的reads在自行biotin label,自製probe就完成了。最後就兩邊混合capture,整體步驟就和target enchantment概念一樣。

在這篇研究中,分析的時候測試了三種reference,RAD-ref是用要抓別人的那個probe的library,那去定序,理論上這個作為reference應該是最合情合理的。另一個把最後抓到的序列定序後denovo assamble拿到的contig當作reference(像在RADseq後續分析一樣),還有一個是同時參考兩個定序後的結果,將RAD-ref做延伸,使用PriceTI設定比較嚴格組出的contig作為reference。最後結果可以發現單單用denovo assamble的reference所得到的contig是最多的。由於在抓的時候,專一性若不夠高,就很有可能會抓到其他的,尤其又是自製的probe,比起大公司合成(像是MYbaits和IDT),效果會更不好。接下來以single map的結果來看,用較嚴格的RAD-ref-ext作為reference的表現最好。再從最後得到的SNP總數來看,以map RAD-ref最好。

另外這研究在製備shotgun library,也就是被抓的的那個,他也有測試了要不要sonicate,結果發現舊一點的材料不需要會比較好,但過於老舊的(58歲那種,好像有沒有sonicate影響不大了),至於新鮮材料好像結果也沒影響太大。這裡看到fresh的材料獲得的SNP數量最少,感覺很怪,但裡頭有解釋說因為這裡設計用來抓人的reference sample和被抓的新鮮sample都是新鮮材料,兩種的genetic distance本來就比較小,找到的SNP就比較少。接著看到的是Matrix fullness(其實就是missing data比例反過來說而已)可以看到其實結果並沒有差很多,都有超過50%,也沒有哪一個condition的設定比較好,在這個研究中他用最後得到的結果反推,認為RAD-ref, non-sonicated的分析結果比較符合真實情況。原則上我覺得這個方法並沒有大破大立的進展,但就:缺值比例下降和平均的coverage提高而已。

接下來看到hyRAD-X,原則和概念和流程都和剛剛的hyRAD一樣,只是在自行合成probe的地方,他是用RNA做biotin labeling而已。但這個研究比較有趣的是用subfossil作為材料,就是沉積在湖底的銀冷杉松針。時間就拉到距今五千多到七千多年前。再抽DNA時也很酷,還要先照UV光。這裡主要測試了三種方法,和hyRAD做比較。這兩個長條圖為有沒有移掉PCR duplicates,map到reference的read數量所佔比例。在去除PCR duplicates之前和之後,不同方法所map到的結果也不太一樣。但仔細看,這些read所佔的百分比其實超少啊。hyRAD-X主要表現比較好的部分大概也是coverage提高。讀到最後好像有點失望,但回頭想想他可是從七千多年前的沈積物中拿到資訊來分析,並且拿到500 SNPs,缺值比例少於1/3,來其實也就很厲害了。

 

Suchan, T., Pitteloud, C., Gerasimova, N. S., Kostikova, A., Schmid, S., Arrigo, N., … & Alvarez, N. (2016). Hybridization capture using RAD probes (hyRAD), a new tool for performing genomic analyses on collection specimens. PloS one11(3), e0151651.

Schmid, S., Genevest, R., Gobet, E., Suchan, T., Sperisen, C., Tinner, W., & Alvarez, N. (2017). HyRAD‐X, a versatile method combining exome capture and RAD sequencing to extract genomic information from ancient DNA. Methods in Ecology and Evolution.