20170424 完成論文之後的雜談。

終於在1/24 完成論文口試,大概告一個段落。

到當兵之前的幾個月(3, 4, 5月)就被召回中研院整理研究,希望能轉化成paper。

但很快就知道還差了一大段,關於分析和結果的穩定性。能畢業只是代表一個階段的任務達到而已,我想還有一大段路要走才行。

逃了很久的試驗紀錄,這裡也就停滯了一段時間。想整理一些關於從零開始的研究歷程讓別人不小心google到然後參考,但遲遲沒有動筆。

想要打幾篇看完paper的紀錄,也當作我的筆記。

【關於一個階段性任務的結束。】

從18分鐘口試的突然結束到親手拿到一張薄薄的失業證書,以及把所有家當搬離台北,就這樣不小心沉澱了幾個禮拜。

遙想這個研究的開始,是2014年的那個春天,和游某在科博館的麥當勞開始,還記得我點了過於甜膩的冰炫風,那大概是接觸小檗的第一個記憶的味道。看著學長把各種小檗的葉和花一一畫出,那是我第一次開始認識這群高山的謎樣植物,當學長結束幾頁筆記紙的介紹後,拋下一句話:『你覺得你可以在這之中問什麼問題?』當時只覺得問這個問題的本身,好難。我甚至不知道DNA要怎麼從一棵植物"弄"出來,然後又要怎麼變成這個(我還沒想到的)問題的解答,我只覺得腦中一片混亂,然後眼前冰炫風就這樣融光了。

接下來不怎麼踏實的訓練就開始了,穿插好幾次高海拔稀薄空氣的沁涼、中海拔的泥濘和血漬、化學藥品的刺鼻、指令碼的乏味,甚至是不同時區的氣味,揉合了無奈和失落的巴掌,以及過於輕忽和得意忘形的嘴臉,難免銘心但享受。現在回頭看著『小孽的路,順順地走~』的字跡,絕對是個威力無比的祝福。相較這一路所相伴的幸運,我的努力就變得非常渺小,就像那晚南湖圈谷那夜的滿斗星空所包容著,無比奢侈。

向來對於階段性結束或開始的慶賀或制式化的典禮不感興趣,甚至會想刻意逃避。或許只是潛意識越來越討厭成為焦點或避免起伏太大的情緒轉變,因為日子依然繼續,那些重要的時刻和重要的人,我都會一直放在心底,並用有限的腦力將你們感激,直到阿茲海默症發起。

最後,感謝山,感謝台北。

20170217 

廣告

【Experimental Log】2016/09/19

3 Samples:CP144 (Berberis chingshuiensis), CPL19 (Berberis alpicola), CPL20 (Berberis alpicola)

DNA extraction [CPL19, CPL20]:CTab (未秤重,目視約一片正常大小葉子,加入液態氮磨碎。) 總體積用50 ug去溶。

純化kit:Monarch™ PCR & DNA Cleanup Kit (5 μg) (NEB)

DNA定量:Qbit

Qbit結果:CP144 (Berberis chingshuiensis):7.48 ng/uL, CPL19 (Berberis alpicola):34.6 ng/uL, CPL20 (Berberis alpicola):38.8 ng/uL

跑膠結果

20160919跑膠.jpg

結論:壓力來了就煩躁。

【Experimental Log】2016/09/08-10

14 Samples:CP247 (Berberis kawakamii), CP248 (Berberis kawakamii), CP249 (Berberis nantoensis ?), CP250 (Berberis nantoensis ?), CP251 (Berberis kawakamii), CP252 (Berberis kawakamii), CP253 (Berberis kawakamii), CP254 (Berberis kawakamii), CP255 (Berberis aristatoserrulata), CP256 (Berberis kawakamii), CP257 (Berberis kawakamii), CP258 (Berberis kawakamii), CP259 (Berberis nantoensis ?), CP260 (Berberis nantoensis ?)

DNA extraction:CTab (未秤重,目視約一片正常大小葉子,加入液態氮磨碎。) 總體積用50 ug去溶。

純化kit:Monarch™ PCR & DNA Cleanup Kit (5 μg) (NEB)

DNA定量:Qbit

Qbit結果:CP247 (Berberis kawakamii):95.4 ng/uL, CP248 (Berberis kawakamii):86.8 ng/uL, CP249 (Berberis nantoensis ?):86.2 ng/uL, CP250 (Berberis nantoensis ?):too high ng/uL, CP251 (Berberis kawakamii):82.6 ng/uL, CP252 (Berberis kawakamii):52.2 ng/uL, CP253 (Berberis kawakamii):too high ng/uL, CP254 (Berberis kawakamii):59.6 ng/uL, CP255 (Berberis aristatoserrulata):49.4 ng/uL, CP256 (Berberis kawakamii):108 ng/uL, CP257 (Berberis kawakamii):112 ng/uL, CP258 (Berberis kawakamii):too high ng/uL, CP259 (Berberis nantoensis ?):too high ng/uL, CP260 (Berberis nantoensis ?):too high ng/uL

跑膠結果

20160910跑膠.jpg

結論:最近很疲倦。

【Experimental Log】2016/08/19-20

8 Samples:CP239 (Berberis deinacantha), CP240 (Berberis deinacantha), CP241 (Berberis deinacantha), CP242 (Berberis grodtmanniae), CP243 (Berberis dumicola), CP244 (Berberis sanguinea), CP245 (Berberis kawakamii), CP246 (Berberis breviesepala)

DNA extraction:CTab (為乾燥材料,均質機打碎。一片葉子一管。) 總體積用50 ug去溶。[CP243 , CP244的狀況不好,抽了兩次 (8/19、20)。]

純化kit:Monarch™ PCR & DNA Cleanup Kit (5 μg) (NEB)

DNA定量:Qbit

Qbit結果

CP239 (Berberis deinacantha):too high ng/uL, CP240 (Berberis deinacantha):110 ng/uL, CP241 (Berberis deinacantha):too high ng/uL, CP242 (Berberis grodtmanniae):110 ng/uL, CP243 (Berberis dumicola):46.4 ng/uL, CP244 (Berberis sanguinea):15.8 ng/uL *(CP224的顏色很髒,在原液時,就有很多不明析出漂浮物,純化時無法清除顏色。)

CP243 (Berberis dumicola):82.6 ng/uL, CP244 (Berberis sanguinea):36.8 ng/uL, CP245 (Berberis kawakamii):83.4 ng/uL, CP246 (Berberis breviesepala):too high ng/uL *(這次沒有放overnight,只有三個小時,葉子放的量也減少,純化後顏色皆為透明。)

跑膠結果:

P1010428.JPG

結論:感覺CP224可以純縮成一管。其他的狀況都還算OK。已經可以正確判別葉子狀況適不適合抽出高純度DNA了。不適合,就也只能以量取勝法,來得到所需濃度和品質。

【Data process】2016/6/13

分析方向:看了一些paper,看到Stacks所設的m值:一個stack所需之最小定序深度 (read depth),其range大概在10~15左右。然而我測試是5,偏低。所以,想要開始測試高一點的值,看是否會影響樹型、分群或支持度。

48 samples (-m 10; -M 1 ; -n 1; -p 35) ‘allsample’

未命名.png

在台灣和南台灣小檗已經混在一起。清水山小檗被拆掉了。但各支序的支持度算高。

48 samples (-m 10; -M 1 ; -n 1; -p 40) ‘v1’

未命名.png

調高p值 (輸出的基因作至少須出現在多少族群中):35 → 40。發現支持度更差了。

台灣和南臺灣小檗依然為grade狀。高山和南投依然混在一起。所以我想要挑選各種下不同族群的Sample。台灣就挑合歡山、小奇萊族群;南台灣就挑北大武山族群;高山挑倫太文山、帕托魯山;南投挑合歡山小奇萊。得下面結果:

32 samples (-m 10; -M 1 ; -n 1; -p 40) ‘v2’

未命名.png

挑掉一些看似有問題的sample (不同地點的pengii和kawakamii,以及m值調高後,清水山就分掉了),便可發現各種間的分群就更好了;支持度亦高。

Next:

我認為可能是m值一下子調太高,清水山小檗本身的DNA品質就沒有其他人好,而在m值門檻調高後,沒有這麼足夠深度能組成一stack,就導致其在後面分析時的missing data較多,在樹的支序上就會誤判。以上是我的推測,所以我想接下來就逐漸調低m值 (8, 7…等)。之後再調整不同Sample的挑選,分開討論。

*分開討論:

  1. 先挑穩定且確定的各種族群,或是模式產地族群,優先分析。先測試前人的種的假說。
  2. 放入所有samples後,在其他的討論 (如:其實台灣的小檗還有很多新種?之類的,以及演化問題。)

【Data process】2016/6/10

和游學長討論,目前我的分析方向:

  1. 是否為好種?
  2. 演化關係?(外群問題)

從"外群"下手,kawakamii和pengii是否成clade的三大狀況:

  1. 在RAxML中指定wuyiensis為外群。
  2. 在RAxML中指定baradana為外群。
  3. 不加入wuyiensis,無外群。

 

結果:

↓ 在RAxML中指定wuyiensis為外群。outgroup_wu (20160610v2)

未命名

kawakamii和pengii為grade狀 (16, 21)。

↓ 在RAxML中指定baradana為外群。outgroup_bara (20160610v3)

未命名

kawakamii和pengii為grade狀 (16, 21)。

↓ 不加入wuyiensis,無根樹,無外群。no_wu (20160610v4)

未命名

kawakamii和pengii為一clade (16, 21)。

 

小結:wuyiensis似乎會影響kawakamii和pengii是否為clade或grade。到底是wuyiensis距離kawakamii和pengii的關係是太近?或太遠?在學長使用ndhF+rbcL+accD+ITS+psbA-trnH的樹中:wuyiensis距離kawakamii和pengii的關係是遠的,只是直線距離近而已。所以有可能是"長枝效應"而導致在資料上的誤判?(因為太遠,ATGC的變換已過一輪,又變回原來,兩者間在鹼基上的類似,誤判其關係太近。又尤其RAD的資料相對細緻。) 要去找解決"長枝效應"此狀況的方法 (突變率?) 又或者要如何解釋無根樹?(討論限制?有什麼是不能討論的?參考AFLP。)

在討論後續的演化前,要先弄清楚:樹本身的建構技術上的問題。

 

20160610(kawapengii)

↓ 只放所有的kawakamii和pengii,還有wuyiensis為外群。

未命名

4 (來自向陽山) 以下 (1~6),為kawakamii;以上 (7~12) 為pengii。關於他們的分布,或許有有趣的故事。pengii和kawakamii之間似乎沒有明確的species delimitation 。

 

NEXT:

  1. 放入所有pengii和kawakamii,並且先不放wuyiensis,嘗試建樹。
  2. 試跑STRUCTRUE,怎麼色塊分不開啦!!!@@ 齁 問題在哪。

【Data process】2016/6/7

20160606 和中研院越南學長討論完回來後,調整了參數 (populations的 -t 的參數),晚上重跑。

哈哈, 學習有時需要試誤呀!
不過我也剛剛也想我說得太滿, 一是你大概還不會估算需要多少記憶體? 二是
Yandi其實不時還有其他人再跑東西, 所以要給你用也是有點擔心啦!
我看到你已經開始在AgNEC1跑, 目前已經用到近70%的記憶體, 可以用"top"這個指
令看到互動畫面, 按"q"可以跳出來
如果又沒辦法登入, 大概有出事了, 再email給我吧

明後天我應該都會在農藝館318寫論文, 如果你需要問些操作上的問題, 可以來問
問, 但不能太久~

(20160606 甫錦學長的mail通知)

20160607

成功收到data,果然是"populations的 -t 的參數"問題。

*注意:Stacks出來的phylip檔的最後面,會多一行:"# Stacks v1.34; Phylip sequential; June 06, 2016″這類東西!要記得先刪掉,才能給Cipres RAxML吃!不然會出現error:顯示"最後有垃圾"而無法跑。

再接著跑Cipres RAxML-HPC BlackBox

得到RAxML_bipartitions的result檔,給FigTree吃。(我人生中的第一次,從葉子到DNA到Library到RAD data到Stacks到RAxML分析到出現樹)

未命名

自製的種階層簡圖如下:

TEST

和游學長的討論:

  1. 和原本用葉綠體跑的樹的假說做比較。原來kawakamii和pengii自成一clade,是明確的。但在RAD的樹中,kawakamii和pengii同種的同個體卻沒有成衣clade,而是有明確的分化現象;兩種之間也沒有形成一個clade。估計他們的族群內結構已出現。先使用當時學長所取樣kawakamii和pengii的地點的個體重跑樹,看是否有成為一個clade。於是出現k2p5的測試,挑選kawakamii2和pengii5,分別來自大雪山和北大武山 (為游學長當年做葉綠體的取樣)。結果出現,確實形成一clade。故將其挑出,再重跑一次。
  2. 除了尖萼clade,圓萼clade內部有了結構了。但因為一開始這部分都沒有解析度,所以可以重新開始寫我的假說。
  3. 定年問題:整合到葉綠體的樹裡來定年。
  4. 目前發現:baradana在裡面而非外面!

你要再繼續explore taroko和bara的關係,要很solid。因為這攸關 菲律賓高山植物的起源。這個關係很重要是因為 照目前你的圖看起來,菲律賓小檗是台灣傳播過去的,這樣我們等於某種程度上解開了菲律賓高地植物相的起源的一部分!是不是很興奮 百年來沒人證實過的!!

(游學長)

 

Next:

  1. 是否能跑出kawakamii和pengii同一clade。
  2. kawakamii和pengii種內、不同地點個體的結構問題。
  3. 可以先不看wuyiensis,他似乎比想像中的和kawakamii的關係還要近。似乎可以用無根樹呈現。

((((以上希望能在端午連假做好。))))

Next’s Next:

  1. 要到美國Botany 2016的poster的進度界線。(自己先想好,要和學長老師討論。)
  2. 其他分析方法的學習。(ex: structure)