secangkir kopi panas

selamat datang dan bergabung dengan blog saya, semoga memberi manfaat keilmuan dan meningkatkan ukhuwah islamiah

Selasa, 07 Juni 2011

mengenal aplikasi microsatellite untuk melacak hubungan filogenetic antar spesies tumbuhan


Review Artikel :
Analysis of SSR dynamics in chloroplast genomes of Brassicaceae family
Sumit G. Gandhi, Praveen Awasthi, Yashbir S. Bedi
Bioinformation 5(1): 16-20 (2010) ISSN 0973-2063

Oleh :
Ichsan Suwandhi
E. 461 10 0021/SVK

SINOPSIS ARTIKEL

Artikel ini menyajikan suatu pendekatan molekuler menggunakan analisis mikrosatelit (ssr) untuk menganalisis dinamika genom-genom pada kloroplast 12 jenis tanaman dari family brasicaceae, mencakup didalamnya Coding dan Non-Coding DNA.  Penelitian ini membuktikan bahwa DNA non coding yang sebelumnya dianggap sebagai non-functional ternyata memiliki fungsi atau peran yang strategis dalam organisasi genom, regulasi dan transkripsi.
Penelitian ini mencoba menyelidiki keragaman nucleotide repeat motifs (NRMs) yang ada di dalam kloroplas pada 12 jenis tanaman dari family brasicaceae, hasilnya menunjukkan distribusi NRMs tidak random baik pada coding maupun non-coding DNA.  Tri nucleotide repeats lebih umum dijumpai pada coding DNA, sedangkan repeat lainnya lebih banyak dijumpai pada non-coding DNA.  Jumlah total mikrosatelit pada coding region menunjukkan variasi yang kecil antar spesies, variasi justru ditunjukkan pada non coding region.
Dari penelitian ini, peneliti berhasil mendisain primer-primer yang mengahsilkan polimorfi tinggi dari 12 jenis tanaman tersebut.
Hasil analisis juga menunjukkan bahwa “amplicon length polymorphism” tidak berkorelasi nyata dengan “sequence based phylogeny” mikrosatelit di dalam cpDNA.

LATAR BELAKANG
SSRs atau mikrosatelit merupakan tandem repeat dari mono-, di-, tri-, dan tetra nucleotide motifs, sangat banyak terdapat pada sebagian besar eukariot dan seringnya memiliki polimorfis yang panjang.  Beberapa keunggulan lainnya, yaitu :
-       The reversible length altering mutations are resultant of unequal crossing over and replication slippage.
-       Relative conservation of the flanking regions, allow the variable length microsatellites to be used as locus specific, co-dominant, genetic markers across taxa.
SSRs yang ada pada non-coding DNA pada awalnya diketahui sebagai non-functional entities (tidak memiliki peran), tetapi sekarang telah diketahui bahwa mereka memiliki peran yang unik dalam organisasi genom, regulasi transkripsi, rekombinasi DNA dan memperbaiki dan sebagainya terutama pada kasus-kasus :

-       apabila terdapat pada segmen protein dalam coding DNA, mereka melakukan ekspansi atau kontraksi yang dapat berdampak besar dalam fungsi protein.  Beberapa penyakit pada manusia berhubungan dengan ekspansi mikrosatelite trinucleotide diantara protein.
-       Through “guilt by association”, beberapa loci mikrosatelit dalam tumbuhan berhubungan dengan stress tolerance, resistensi terhadap penyakit, pola-pola domestikasi dan perlakuan-perlakuan budidaya.
-       Cp DNA memiliki sedikit komponen yang sama dengan nuclear DNA, SSRs tertentu hanya banyak dijumpai pada gen-gen kloroplas.
Terdapat perbedaan prinsip antara nuclear DNA dengan cpDNA, yaitu pada marker nDNA diturunkan dari seed dan pollen (induk betina dan jantan), sedangkan cp DNA pada angiospermae hanya diturunkan dari jalur maternal saja (ibunya), sehingga pada cpDNA mengandung marker polymorfi yang sangat berpotensi untuk melacak asal-usul tanaman berdasarkan geografinya.
Hasil studi terkini menemukan persentase SSR yang tersebar di dalam kompartemen coding dan non-coding cpDNA pada anggota family brasicaceae (dikenal pula dengan istilah “mustard family”), merupakan kelompok tumbuhan annual atau perennial berupa herba. Jenis yang paling popular dari family ini digunakan sebagai tumbuhan model yaitu Arabidopsis thaliana.  Dari sekitar 3700 spesies, dipilih 12 spesies dari family ini untuk dianalisis mikrosatelit dan penggunaan marka genetiknya untuk melihat hubungan filogenetik.

METHODOLOGY

Mining of chloroplast genome sequences
Menyiapkan dan menggunakan sequens cpDNA dari 12 jenis anggota family Brasicaceae yang diperoleh dari GenBank (http://www.ncbi.nlm.nih.gov) meliputi : Aethionema cordifolium (NC_009265), Aethionema grandiflorum (NC_009266),  Arabidopsis thaliana (NC_000932), Arabis hirsute (NC_009268), Barbarea verna (NC_009269), Capsella bursa-pastoris (NC_009270), Crucihimalaya wallichii (NC_009271), Draba nemorosa (NC_009272), Lepidium virginicum (NC_009273), Lobularia maritime (NC_009274), Nasturtium officinale (NC_009275) and Olimarabidopsis pumila (NC_009267). Sedangkan sequens DNA untuk segmen coding dan non-coding cpDNA diperoleh dari Chloroplast Genome Database (http://chloroplast.cbio.psu.edu),



Mining SSRs from cpDNA and Primer design
Mencari motif-motif SSR dari cpDNA dengan criteria ukuran repeat sebagai berikut :
-       monomers, the minimum repeat size was 10 nt,
-       dimers, minimum repeat size was 5 nt,
-       trimer to decamer, minimum repeat size was 3 nt.

Both perfect SSRs and compound SSRs were detected. The maximum interruption size between compound SSRs was kept 5 nucleotides. SSRs were searched in full chloroplast genome as well as separate coding and non-coding regions for each species. About 200-400 nt sequences flanking the SSR was used in online tool primer3  for designing primers. Parameters used for primer3 were: optimum primer size - 20nt, optimum annealing temperature - 59°C, optimum GC content – 50%.

SSR dynamics in coding, non-coding and complete cpDNA
Data yang telah diperoleh dari SSR mining dianalisis dengan Microsoft Excel®. Informasi yang diperoleh meliputi persentase motif SSR yang berbeda tipe dan keberadaannya di dalam coding dan non-coding DNA, kemudian disajikan dalam bentuk grafik untuk melihat dinamikanya.  Hasil analisisnya ditunjukkan pada Figure 1.

Figure 1: Distribution of nucleotide repeat motifs (NRM) in choloroplast genomes of 12 species belonging to Brassicaceas family,(a) pie chart revealing the percentage of different types of NRMs (SSRS) in Brassicaceae (b) Bar graph indicating percentage of various NRMS in coding or non-coding regions of chloroplast DNA (c) species wise distribution of total SSRS in coding or non-coding regions of chloroplast DNA note :-percentages have been rounded to nearest integer.

Designing Universal primers & Virtual PCR on cpDNA :
Kegiatan selanjutnya adalah mendesain primer, flanking SSR dengan ukuran 200-400 nt telah ditandai dan 100% menggunakan universal primer yang diperoleh dari CLC DNA workbench dan kemudian diuji menggunakan FastPCR untuk amplifikasi dari cpDNA ke-12 spesies tersebut.  Selanjutnya data hasil amplifikasi ini dianalisis sebagaimana uraian sebagai berikut (dijelaskan sesuai artikel asli) :

Length polymorphism data was used to generate a distance matrix, using the ‘simint’ module of NTSYSpc ver 2.2 [11], and further clustered using UPGMA (Unweighted Pair Group Method with Arithmetic mean) algorithm for plotting a dendrogram. Amplicon sequence data was used to plot dendrogram on structural polymorphism basis. The amplicon sequences were aligned using ClustalW [12]. Neighbor-Joining clustering algorithm was used to plot a dendrogram. The robustness of the tree was tested using bootstrap analysis (1000 iterations).


PEMBAHASAN

Keragaman dan distribusi genom

Genom-genom kloroplas dari 12 spesies memiliki tipe-tipe yang bervariasi, tersebar pada coding dan non coding DNA.  Secara umum data menunjukkan bahwa masing-masing spesies memiliki karakter genom dan sebaran tertentu.
Bila ditinjau pada family secara umum diketahui sebagai berikut :
-         motif mononucleotide dan trinucleotide yang paling umum dijumpai dan memiliki kecenderungan proporsi yang sama (masing-masing 42% dan 40%),
-         motif-motif yang lebih besar dari pentanucleotide hanya 1% dari total SSR
-         12% dari total Nuclotide Repeat Motifs (NRMs) adalah dinucleotide yang dinominasi oleh tipe repeat AT/TA dibandingkan CG/GC, hal ini diduga karena CG/GC lebih banyak digunakan tanaman untuk meningkatkan stacking energy selama transkripsi.
-            Motif mononucleotide lebih banyak dijumpai didalam non coding DNA, sedangkan trinucleotide lebih banyak di coding DNA.  NRMs lainnya juga lebih banyak terdapat pada non coding DNA (Gambar 1b)
-         Keragaman antar spesies di dalam coding region cenderung rendah ditunjukkan oleh rendahnya variasi pada jumlah SSR (Gambar 1c), range only from 47 to 58, in different species, while total number of SSRs in non-coding region (about 49% of chloroplast genome) range from 84 to 120.  Rata-rata jumlah SSR pada non coding dua kali jumlah SSR pada coding region.
-         Expressed sequence tags (ESTs) represent the coding portion of the genome.[14] Mining of publicly available EST sequences for SSRs have been performed by several groups and almost invariably, trinucleotide motif has been reported as most common [15, 16], which corroborates with our results. This is expected as repeats other then trinucleotide motifs, would result in fram shift or null mutations, resulting in non-functional proteins, and hence would generally not be selected through evolution.

Microsatellite polymorphism across Brassicaceae:

-            Hasil desain primer universal yang menghasilkan variasi length amplicons disajikan pada Gambar 2a.
-            Hasil elektroforesis untuk mendemonstrasikan the extent of length polymorphism disajikan pada Gambar 2b
-            Dendrogram untuk melihat hubungan filogenetik disajikan pada Gambar 2c (berdasarkan amplicon length polymorphism) dan 2d (berdasarkan amplicon sequence polymorphism).
-            Hasil uji clustalW disajikan pada Gambar 3, yaitu melihat korelasi antara hubungan filogeni yang didasarkan sequence dengan length variation of SSR

Peneliti menyatakan bahwa hasil analisinya memiliki kecenderungan bahwa panjang polymorfi dan struktur tidak ada korelasi untuk cpDNA family brasicaceae (hasil yang sama diperoleh peneliti lain pada genom mitochondrial binatang budidaya sama dengan genom kloroplas pada spesies Cucumis. 

KESIMPULAN

Hasil penelitian menunjukkan bahwa secara umum SSR lebih banyak menyebar pada non-coding region of cpDNA.  Trinucleotide repeat merupakan motif dominan yang dijumpai pada coding regions.  Terdapat variasi yang rendah antar spesies.  Attempt to use amplicon length polymorphism to construct phylogenetic relationships did not yield results that were in complete congruity with amplicon sequence based phylogeny.