Maklumat

Alat simulasi evolusi jujukan

Alat simulasi evolusi jujukan


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Saya sedang mencari alat untuk mensimulasikan evolusi jujukan berdasarkan model mutasi tertentu dan model kelahiran-kematian. Saya mengetahui tentang alatan dan pakej seperti INDELible, Seq-Gen dan PhyloSim, tetapi ia mensimulasikan evolusi di sepanjang pokok filogenetik. Apa yang saya mahu ialah memberikan urutan dan meminta alat untuk mensimulasikan evolusi jujukan ini melalui generasi N. Keluaran mestilah sekumpulan besar jujukan keturunan. Saya sendiri telah berfikir tentang menulis alat sedemikian, tetapi sentiasa lebih baik untuk mencari sesuatu yang telah dikodkan.


Terdapat banyak platform simulasi genetik populasi ke hadapan dan ke belakang (penggabungan). Berikut ialah senarai yang tidak lengkap. Kesemuanya berbeza dan anda perlu menyemak manual mereka untuk melihat perkara yang lebih disesuaikan dengan keperluan anda.

Senarai perisian

Berikut ialah senarai panjang platform sedemikian. Senarai itu boleh dikatakan agak ketinggalan zaman hari ini dan kebanyakan perisian ini mungkin lambat atau ditinggalkan oleh pengarangnya.

Perisian yang paling biasa untuk pengalaman saya

Ada yang lebih dikenali daripada yang lain. Secara peribadi, saya sudah melihat penggunaan platform berikut dalam penerbitan: SimCoal, Nemo, Slim dan SFS_Code.

SimBit

Sudah tentu, saya mesti menunjukkan platform simulasi saya sendiri SimBit. Mengikut pengalaman saya, SimBit biasanya lebih pantas daripada Nemo. Ia lebih perlahan daripada SFS_Code dan Slim untuk simulasi yang sangat kecil tetapi menjadi lebih pantas daripada SFS_Code dan Slim apabila anda memerlukan simulasi dengan jumlah keturunan kepelbagaian genetik.

Perkara yang paling penting tentang perisian ini

Anda harus membandingkan perisian berdasarkan

  • Ketersediaan pengarang untuk memberi nasihat dan membawa ciri-ciri baharu
    • Saya tidak akan bercakap tentang pengalaman peribadi saya di sini dengan menghormati pengarang!
  • Kelajuan / penggunaan RAM
    • Saya rasa SimBit biasanya lebih pantas (dan menggunakan kurang RAM) daripada Nemo. SFS_code dan Slim sangat pantas untuk simulasi dengan kepelbagaian genetik yang rendah tetapi sangat lambat untuk simulasi dengan kepelbagaian genetik yang tinggi.
  • Fleksibiliti
    • Nemo, SLim dan SimBit sangat fleksibel (tetapi mereka melakukan perkara yang berbeza) tetapi SFS_code tidak begitu.
  • Antaramuka pengguna
    • Saya dapati laporan ralat Nemo agak lemah. Saya suka laporan ralat SimBit. Antara muka Slim sangat bagus (menggunakan eidos) dan ia juga dilengkapi dengan GUI (saya tidak pernah menggunakan GUI sendiri).
  • Bebas Pepijat
    • Beberapa orang telah menemui pepijat penting dalam SFS_code (komunikasi dan pengalaman peribadi).

Perbandingan yang lebih terperinci antara Nemo, Slim, SFS_code dan SimBit

Saya secara peribadi telah menggunakan NEMO, SFS_CODE dan Slim pada masa lalu (saya kini menggunakan SimBit sahaja). Jadi saya hanya boleh bercakap tentang 4 ini di bawah.

Keempat-empat model dikemas kini dan diselenggara dengan baik oleh pengarangnya dan sudah tentu semua orang mempunyai akses kepada kod sumber.

SFS_code dan Slim sangat pantas untuk simulasi kecil. Isu SFS_code dan Slim ialah penggunaan RAM dan masa jalan adalah fungsi eksponen kepelbagaian genetik. Ini bermakna beberapa simulasi boleh menjadi tidak terurus dengan cepat. Tetapi ia adalah alat yang hebat jika anda menjangkakan sedikit kepelbagaian genetik.

SimBit biasanya lebih pantas daripada Nemo, sekurang-kurangnya untuk genom besar. Perbezaan ini menjadi sangat jelas untuk genom besar. Seseorang mungkin berfikir "Oh, saya baik untuk menunggu beberapa hari tambahan untuk mendapatkan keputusan saya" tetapi perbezaan kelajuan antara dua perisian juga boleh menjadi perbezaan sama ada anda perlu menunggu seminggu atau 20 tahun untuk mendapatkan keputusan anda, jadi jangan mengabaikan kepentingan masa berjalan dan penggunaan RAM tanpa menganggar keperluan anda.

Nemo sangat fleksibel apabila melibatkan susunan peristiwa kitaran hayat (contohnya penghijrahan sebelum atau selepas pemilihan) dan versi terbaharu membolehkan untuk mensimulasikan populasi berstruktur umur. SimBit adalah sangat fleksibel, sangat pantas dan membolehkan untuk mensimulasikan pelbagai spesies dan interaksi ekologi mereka. SFS_code kurang fleksibel.


Satu-satunya kebimbangan saya tentang NEMO ialah setiap individu mati selepas pembiakan dan tidak boleh ada lebih daripada 256 alel pada masa yang sama.

SFS_code mengehadkan bilangan alel kepada 4. Nemo mengehadkan bilangan alel kepada 256 (tetapi anda juga boleh menggunakan fenotip dan mempunyai nombor apungan pada setiap lokus). SimBit menggunakan sama ada lokus dwi-allelik, blok di mana bilangan mutasi dikira (maks: 256 mutasi; ini berbeza daripada 256 alel setiap sebutan) atau nombor apungan berterusan pada setiap lokus untuk fenotip. Adakah anda benar-benar memerlukan lebih banyak alel? Mengapa anda tidak boleh menggunakan beberapa lokus untuk mewakili jujukan dengan berbilang alel? Biologi sebenar hanya boleh mempunyai 4 alel dalam lokus terkecilnya! SimBit menggunakan sistem bit-per-bit. Jika anda perlukan, katakan 50,000 alel, maka anda hanya perlu meminta jujukan 16 bit (2 bait) dan anda boleh mendapatkan $2^{16} = 65,536$ alel.

Jika anda memerlukan lebih banyak alel dalam satu blok (yang agak mengejutkan saya secara priori), anda mungkin boleh bertanya kepada pengarang dan dia mungkin menerima untuk membantu anda jika anda meyakinkannya adalah menarik untuk menambah ciri ini (dia mungkin juga lebih bersedia untuk membantu dalam pertukaran kepengarangan jika anda memerlukan lebih banyak sokongan).

Semoga membantu. Semoga berjaya!


Messer Lab – SLiM

SLiM ialah rangka kerja simulasi evolusi yang menggabungkan enjin berkuasa untuk simulasi genetik populasi dengan keupayaan memodelkan senario evolusi kompleks yang sewenang-wenangnya. Simulasi dikonfigurasikan melalui bahasa skrip Eidos bersepadu yang membenarkan kawalan interaktif ke atas hampir setiap aspek senario evolusi yang disimulasikan. Enjin simulasi berasaskan individu yang mendasari sangat dioptimumkan untuk membolehkan pemodelan keseluruhan kromosom dalam populasi yang besar. Kami juga menyediakan antara muka pengguna grafik pada macOS dan Linux untuk persediaan simulasi yang mudah, kawalan masa jalan interaktif dan visualisasi dinamik output simulasi.

Bengkel SLiM 4–5 hari kini boleh didapati dalam talian. Bengkel SLiM juga ditawarkan secara peribadi dari semasa ke semasa, lihat subseksyen Bengkel SLiM di bawah untuk maklumat lanjut.

Muat turun (versi 3.6)

Pemasang macOS akan memasang alat baris perintah yang tipis, persekitaran pembangunan grafik SLiMgui dan kedua-dua manual. (Jika anda menggunakan macOS dan anda ingin menjalankan aplikasi SLiMguiLegacy berasaskan Koko lama, atas sebab tertentu, anda boleh memuat turunnya daripada http://www.benhaller.com/slim/SLiMguiLegacy.app.zip atau membinanya dalam Xcode ia tidak lagi disertakan dalam pemasang.) Pada platform Un*x yang lain, anda harus mengikut arahan dalam manual SLiM (bab 2) mungkin terdapat pemasang untuk platform anda, atau anda mungkin perlu membina daripada sumber. SLiM juga boleh dijalankan pada Windows, di bawah WSL lihat manual untuk butiran.

Manual SLiM termasuk koleksi resipi untuk situasi biasa. Anda boleh memuat turun arkib zip resipi tersebut, jika anda mahu ia juga boleh didapati secara langsung melalui menu Fail SLiMgui’s. Manual Eidos merangkumi butiran bahasa Eidos, yang digunakan untuk mengawal SLiM melalui skrip. Helaian rujukan untuk kedua-dua SLiM dan Eidos menjadikannya mudah digunakan dengan penggunaan minimum dokumentasi penuh.

Ambil perhatian bahawa arkib kod sumber yang disediakan di sini tidak mengandungi kod khusus macOS, mahupun projek Xcode untuk SLiM ia bertujuan untuk pengguna di Linux (pengguna macOS amat digalakkan untuk menggunakan Pemasang macOS dan bukannya membina daripada sumber). Sumber lengkap termasuk fail macOS boleh didapati di GitHub anda boleh mendapatkan sumber untuk keluaran berteg, seperti 3.6, atau untuk ketua pembangunan semasa.

Kami juga menyediakan repositori GitHub yang dipanggil SLiM-Extras dengan maklumat tambahan berguna untuk pengguna SLiM, seperti fungsi Eidos yang ditentukan pengguna untuk melaksanakan beberapa tugas biasa, dan kami mengalu-alukan sumbangan kepada repositori itu daripada orang lain.

SLiMgui

Dengan persekitaran pemodelan grafik SLiMgui (serasi dengan macOS, Linux dan Windows di bawah WSL), anda boleh memvisualisasikan simulasi anda semasa ia berjalan dan memeriksa parameternya dalam masa nyata, membolehkan pembangunan simulasi yang lebih mudah.

Tangkapan skrin SLiMgui yang mensimulasikan dinamik populasi CRISPR/Cas9 “gene drive” dalam model pulau enam subpopulasi dengan variasi spatial dalam pemilihan pada alel pemacu. Kawasan skrip Eidos di sebelah kiri, output di sebelah kanan. Perwakilan visual struktur populasi ditunjukkan dalam subtingkap, dan semua individu dalam enam subpopulasi boleh dilihat di bahagian atas (berwarna mengikut kecergasan relatif mereka). Bar hitam tengah menunjukkan ringkasan variasi genetik yang terdapat dalam populasi mutasi neutral jarang kelihatan sebagai bar kuning pendek, dan bar merah tinggi mewakili alel pemacu yang menghampiri penetapan.

Senarai mel

Terdapat dua senarai mel. Sila langgan salah satu atau kedua-duanya menggunakan pautan di bawah:

    : Senarai mel volum rendah untuk pengumuman sahaja. Pengguna tidak boleh menghantar ke senarai ini. : Senarai mel volum lebih tinggi untuk soalan, ulasan, laporan pepijat dan perbincangan di kalangan pengguna SLiM.

Bengkel SLiM

Kami menjalankan bengkel SLiM selama 5 hari yang percuma dan terbuka kepada orang ramai (dengan pendaftaran). Pada masa ini, bagaimanapun, bengkel ini ditangguhkan kerana wabak coronavirus.

Bahan-bahan bengkel kini dalam talian, bagi mereka yang ingin melakukannya sendiri layari halaman muat turun bengkel dalam talian untuk maklumat lanjut.


Bengkel SLiM pertama: Umeå, Sweden, Ogos 2019.

Berita

2021 3 Mac: SLiM 3.6 dikeluarkan! Ini adalah keluaran utama, dengan banyak ciri baharu dan beberapa pembetulan pepijat yang penting. Peningkatan ini adalah dengan kuat disyorkan untuk semua pengguna versi 3.5 tidak boleh digunakan kerana dua pepijat yang boleh menyebabkan keputusan model yang salah. Untuk maklumat lanjut, lihat pengumuman tipis untuk pengumuman dan nota keluaran.

8 Disember 2020: SLiM 3.5 dikeluarkan! Ini adalah keluaran utama, dengan banyak ciri baharu dan beberapa pembetulan pepijat yang penting. Peningkatan ini disyorkan untuk semua pengguna, tetapi ia memecahkan keserasian/kebolehulangan ke belakang dalam beberapa cara membaca nota keluaran dengan teliti. Untuk maklumat lanjut, lihat pengumuman tipis untuk pengumuman dan nota keluaran.

12 Mei 2020: SLiM 3.4 dikeluarkan! Ini ialah keluaran utama, termasuk keluaran pertama QtSLiM, serta beberapa ciri baharu dan pembetulan lain untuk beberapa pepijat. Peningkatan ini disyorkan untuk semua pengguna. Untuk maklumat lanjut, lihat pengumuman tipis seperti biasa.

30 Januari 2020: SLiM 3.3.2 dikeluarkan! Ini adalah keluaran kecil, dengan beberapa penambahbaikan dan pembetulan kecil untuk beberapa pepijat (satu penting). Peningkatan ini disyorkan untuk semua pengguna. Untuk maklumat lanjut, lihat pengumuman tipis seperti biasa.

2020 13–17 Januari: Kami mengadakan bengkel SLiM di halaman rumah kami, di Cornell! Kami telah melakukan pasangan setakat ini (Sweden, UK, New York City) tetapi ini adalah yang pertama kami di Cornell. Kami mempunyai 28 peserta, dan ia berjalan dengan lancar, termasuk makan tengah hari yang disediakan oleh 3CPG. Kami telah menyediakan lebih banyak bengkel yang dirancang (lihat subseksyen sebelumnya) sila hubungi kami jika anda ingin menganjurkan bengkel di institusi anda!

28 September 2019: SLiM 3.3.1 dikeluarkan! Versi ini adalah keluaran kecil, kebanyakannya pembetulan pepijat (termasuk beberapa pepijat yang jarang berlaku tetapi jahat!). Peningkatan ini disyorkan untuk semua pengguna. Untuk mendapatkan maklumat lanjut, lihat manual baharu dan nota keluaran dalam pengumuman mengenai pengumuman tipis.

15 Mei 2019: SLiM 3.3 dikeluarkan! Versi ini ialah keluaran utama, dengan ciri baharu yang besar (model berasaskan nukleotida, panggilan balik mutasi(), dsb.) dan beberapa pembetulan pepijat yang besar dan penting. Peningkatan ini amat disyorkan untuk semua pengguna. Untuk mendapatkan maklumat lanjut, lihat manual baharu dan nota keluaran dalam pengumuman mengenai pengumuman tipis.

29 Januari 2019: SLiM 3.2.1 dikeluarkan! Versi ini adalah keluaran kecil, menyediakan beberapa tambahan ciri yang lebih kecil dan beberapa resipi baharu, serta pembetulan pepijat. Untuk mendapatkan maklumat lanjut, lihat manual baharu dan nota keluaran dalam pengumuman mengenai pengumuman tipis.

18 Januari 2019: Dalam beberapa hari kebelakangan ini kami mempunyai tiga (!) kertas kerja baharu yang diterbitkan berkaitan SLiM. (1) “SLiM 3: Simulasi genetik ke hadapan di luar model Wright–Fisher” menerangkan sokongan untuk model bukan Wright–Fisher dan ruang berterusan dalam SLiM 3 (DOI). (2) “Pemodelan evolusi dalam SLiM 3 untuk pemula” memandu pengguna baharu melalui pembuatan model ringkas dalam SLiM 3, dengan banyak penjelasan tentang konsep asas (DOI). (3) “Rakaman jujukan pokok dalam SLiM membuka ufuk baharu untuk simulasi masa hadapan bagi keseluruhan genom” membincangkan ciri rakaman jujukan pokok baharu dalam SLiM 3 secara terperinci, dengan beberapa contoh aplikasi praktikalnya untuk mempercepatkan pelaksanaan model, membakar- dalam simulasi, dan analisis data (DOI). Kami berharap kertas kerja ini berguna untuk mendapatkan maklumat terkini tentang semua perkara baharu yang telah kami usahakan!

6 November 2018: SLiM 3.2 dikeluarkan! Versi ini sangat meningkatkan prestasi model bukanWF yang besar, dan menyediakan banyak penambahbaikan dan pembetulan pepijat. Untuk mendapatkan maklumat lanjut, lihat manual baharu dan nota keluaran dalam pengumuman mengenai pengumuman tipis.

3 September 2018: SLiM 3.1 dikeluarkan! Versi ini sangat meningkatkan prestasi interaksi ruang dan menyediakan penambahbaikan pada rakaman jujukan pepohon, antara penambahbaikan dan pembetulan pepijat yang lain. Untuk mendapatkan maklumat lanjut, lihat manual baharu dan nota keluaran dalam pengumuman mengenai pengumuman tipis.

2018 1 Julai: SLiM 3.0 dikeluarkan! Ini merupakan peningkatan versi penuh pertama kami sejak SLiM 2.0 dikeluarkan pada awal 2016. Ia menambahkan sokongan untuk model bukan Wright-Fisher (bukanWF) dan rakaman jujukan pepohon, dua ciri yang meningkatkan kuasa dan fleksibiliti SLiM’. Banyak penambahbaikan yang lebih kecil juga telah dibuat. Untuk mendapatkan maklumat lanjut, lihat manual baharu dan nota keluaran dalam pengumuman mengenai pengumuman tipis.

2017 16 Disember: SLiM 2.6 dikeluarkan! Ini adalah keluaran utama, dengan banyak barangan baharu lihat manual baharu, dan nota keluaran dalam pengumuman pada pengumuman tipis.

27 Oktober 2017: SLiM 2.5 dikeluarkan! Ini adalah keluaran utama, dengan banyak barangan baharu dan beberapa pembetulan pepijat penting melihat manual baharu, dan nota keluaran dalam pengumuman mengenai pengumuman tipis.

2017 12 September: SLiM 2.4.2 dikeluarkan (membetulkan pepijat yang boleh menyebabkan output yang salah daripada banyak/kebanyakan model).

26 Julai 2017: SLiM 2.4.1 dikeluarkan (membetulkan pepijat yang boleh menyebabkan ranap atau keputusan yang salah dalam simulasi berbilang subpopulasi).

2017 14 Julai: SLiM 2.4 dikeluarkan! Ini adalah keluaran utama, dengan peningkatan kelajuan untuk pelbagai jenis model, sokongan baharu untuk pemprofilan masa jalan dalam SLiMgui dan banyak ciri lain. Lihat manual SLiM dan Eidos baharu untuk dokumentasi semasa. Terdapat juga nota keluaran dalam pengumuman pada slim-announce.

2017 18 April: SLiM 2.3 dikeluarkan! Ini adalah keluaran utama, terutamanya menambah sokongan untuk ruang berterusan dan interaksi spatial. Lihat manual SLiM dan Eidos baharu untuk dokumentasi semasa. Terdapat juga nota keluaran dalam pengumuman pada slim-announce.

22 Februari 2017: SLiM 2.2.1 dikeluarkan (resipi baharu, ciri kecil dan pembaikan).

2016 8 Disember: SLiM 2.2 dikeluarkan! Ini adalah keluaran utama dengan peningkatan prestasi yang besar dan beberapa ciri baharu. Lihat manual SLiM dan Eidos baharu untuk dokumentasi semasa. Terdapat juga nota keluaran dalam pengumuman pada slim-announce.

8 November 2016: SLiM 2.1.1 dikeluarkan (kebanyakannya pembetulan pepijat, sesetengahnya serius).

2016 4 Oktober: Penerbitan kami mengenai SLiM 2 dikeluarkan dalam Biologi Molekul dan Evolusi: DOI.

2016 19 September: SLiM 2.1 dikeluarkan! Ini adalah keluaran utama dengan banyak ciri ditambah. Lihat manual SLiM dan Eidos baharu untuk dokumentasi semasa. Terdapat juga nota keluaran dalam pengumuman pada slim-announce.

26 Mei 2016: SLiM 2.0.4 dikeluarkan (pembetulan pepijat kecil).

12 Mei 2016: SLiM 2.0.3 dikeluarkan (penambahbaikan kepada penyiapan kod).

6 Mei 2016: SLiM 2.0.2 dikeluarkan (penambahan ciri kecil).

27 April 2016: SLiM 2.0.1 dikeluarkan (pembetulan pepijat kecil dan penambahan ciri kecil).

1 April 2016: SLiM 2.0 dikeluarkan! Kami teruja untuk mengumumkan SLiM 2.0, keluaran utama baharu pakej SLiM. SLiM 2.0 menambah kebolehskripan dengan Eidos, dan pembangunan simulasi interaktif menggunakan aplikasi SLiMgui. Kami telah meletakkan catatan blog dengan butiran lanjut tentang keluaran SLiM 2.0.

Lesen dan petikan

SLiM ialah perisian sumber terbuka percuma, dilesenkan di bawah GNU General Public License versi 3. Jika anda menggunakan SLiM dalam penyelidikan anda, sila sebutkan kami.

Untuk SLiM 3, petik:

Haller, B.C., & Messer, P.W. (2019). SLiM 3: Simulasi genetik ke hadapan di luar model Wright-Fisher. Biologi Molekul dan Evolusi 36(3), 632–637. DOI

Untuk model menggunakan rakaman jujukan pokok, petik:

Haller, B.C., Galloway, J., Kelleher, J., Messer, P.W., & Ralph, P.L. (2019). Rakaman jujukan pokok dalam SLiM membuka ufuk baharu untuk simulasi masa hadapan bagi keseluruhan genom. Sumber Ekologi Molekul 19(2), 552–566. DOI

Jika sesuai, sebutkan kertas “protocol” kami untuk pengguna SLiM permulaan:

Haller, B.C., & Messer, P.W. (2019). Pemodelan evolusi dalam SLiM 3 untuk pemula. Biologi Molekul dan Evolusi 36(5), 1101–1109. DOI

Untuk model lama menggunakan SLiM 2, petik:

Haller, B.C., & Messer, P.W. (2017). SLiM 2: Simulasi genetik hadapan yang fleksibel dan interaktif. Biologi Molekul dan Evolusi 34(1), 230–240. DOI

Dan untuk SLiM 1, petik:

Messer, P.W. (2013). SLiM: Mensimulasikan evolusi dengan pemilihan dan kaitan. Genetik 194(4), 1037–1039. DOI

Ikon SLiM

Fail grafik untuk ikon SLiM boleh dimuat turun di sini. Imej ini ialah: Hak Cipta (c) 2016–2019 Philipp Messer, Hak Cipta Terpelihara. Kebenaran dengan ini diberikan untuk digunakan semula khusus untuk tujuan berkaitan SLiM yang menghormati dan menyokong komuniti SLiM. Jika anda mempunyai sebarang keraguan tentang perkara ini, sila hubungi kami untuk mendapatkan kebenaran. Pelbagai saiz dan format disediakan.

Versi lama

Untuk projek baharu, menggunakan versi semasa amat disyorkan. Versi lama dari SLiM 2.0 dan seterusnya boleh didapati di GitHub menggunakan teg keluaran. Versi lama ini tidak lagi disokong.

Penerbitan

Ia boleh berguna untuk melihat cara orang lain menggunakan SLiM kadangkala anda juga boleh memuat turun model SLiM sebenar yang digunakan dalam kertas. Walau bagaimanapun, mengemas kini senarai semua penerbitan yang memetik SLiM menjadi terlalu memakan masa, jadi kini kami menyediakan pautan untuk carian Google Scholar, untuk kertas yang memetik kertas SLiM kami.


Memasang PopG

Berikut ialah arahan untuk menyimpan, membongkar dan memasang PopG daripada penyemak imbas yang berbeza dan pada sistem pengendalian.Kami meliputi penyemak imbas Chrome, Firefox, Safari dan Internet Explorer pada sistem pengendalian Windows, Mac OS X dan Linux.

  1. Klik pada pautan.
  2. Anak panah animasi yang menghala ke bawah di bahagian kiri bawah tetingkap penyemak imbas akan bergerak, menghala ke tab di sana yang dipanggil PopG.zip.
  3. PopG.zip kini akan ditemui dalam folder Muat Turun anda.
  4. Klik (atau jika ini tidak berfungsi, klik dua kali) pada fail PopG.zip. Arkib Zip akan diekstrak ke dalam folder Muat Turun. Sebuah folder PopG akan dibuat dalam folder Muat Turun.
  5. Alihkan folder itu ke tempat yang anda mahukan.
  1. Klik pada pautan.
  2. Kotak dialog dibuka dan menawarkan untuk membenarkan anda Simpan fail. Pilih itu.
  3. Arkib Zip PopG.zip akan berada dalam folder Muat Turun anda.
  4. Klik dua kali padanya. Arkib akan diekstrak dan folder PopG dibuat dalam folder Muat Turun.
  5. Alihkan folder itu ke tempat yang anda mahukan.
  1. Klik pada pautan.
  2. Kotak dialog dibuka dan menawarkan untuk membenarkan anda Simpan fail. Pilih itu.
  3. Fail Zip PopG.zip akan dimuat turun ke dalam folder muat turun dan akan diekstrak secara automatik. Sebuah folder PopG akan dibuat dalam folder Muat Turun.
  4. Pindahkannya ke tempat yang anda mahukan.
  1. Klik pada pautan.
  2. Fail Zip akan dimuat turun ke dalam folder muat turun dan akan diekstrak secara automatik. Sebuah folder PopG akan dibuat dalam folder Muat Turun.
  3. Pindahkannya ke tempat yang anda mahukan.

MASALAH MAC: Pada sistem Mac OS X, apabila anda cuba mengekstrak arkib Zip, atau apabila anda cuba menjalankan Java executable, sistem mungkin mengadu bahawa ini adalah daripada pembangun yang tidak diketahui. Itu semata-mata kerana saya tidak menandatangani fail dengan ID Pembangun Apple saya. Anda sepatutnya dapat membuat operasi berfungsi dengan mengklik kawalan pada ikon dan memilih pilihan untuk membuka fail, menggunakan lalai yang dicadangkan. Sebaik sahaja ia berjaya melepasi ini, ia tidak akan mengganggu anda dengan ini lagi.

Arkib Java

Fail arkib Java PopG.jar akan wujud dalam folder PopG sebaik sahaja anda memuat turun dan memasang PopG. Jika anda telah memasang Java pada sistem anda, anda sepatutnya boleh menjalankan program Java dengan mencari folder PopG dan mengklik atau mengklik dua kali pada ikon fail PopG.jar

Halaman dokumentasi

Folder PopG juga termasuk halaman web dokumentasi semasa yang sedang anda baca. Ini boleh dibaca di sini atau anda boleh menggunakan item menu Simpan Sebagai dalam menu Fail penyemak imbas anda untuk menyimpan salinannya pada mesin anda. Versi terkini halaman ini boleh dibaca di Web menggunakan pautan ini.

Versi lama PopG

Terdapat juga versi boleh laku yang lebih lama yang disusun untuk sistem Windows, Mac OS X dan Linux, serta beberapa sistem pengendalian yang lebih lama. Ini boleh diambil daripada folder lama di tapak PopG kami. Kebanyakan pengguna tidak boleh menggunakan boleh laku yang lebih lama ini, tetapi jika anda melakukannya, anda harus mulakan dengan membaca BACA SAYA fail dalam folder itu. Salah satu versi terdapat versi 3.4, yang telah menyusun boleh laku untuk tiga sistem pengendalian utama yang tersedia serta kod sumber C. Ini mungkin berguna jika anda tidak mempunyai Java dan tidak dapat memasangnya pada sistem anda.

Di manakah versi Android dan iOS?`

Kami ingin menyediakan versi untuk tablet dan juga telefon. Malangnya, versi Java yang boleh menggunakan fungsi grafik nampaknya tidak wujud pada sistem pengendalian Android dan sistem pengendalian iOS. Kami perlu menulis semula program secara berasingan untuk setiap program tersebut. Jika anda mengetahui cara untuk menjalankan executable Java kami pada salah satu daripada sistem pengendalian tersebut dan membolehkannya berfungsi, sila beritahu kami cara anda melakukannya.

Memastikan anda mempunyai Java pada komputer anda

Jika anda telah memasang Java, anda boleh menjalankan program PopG. Secara amnya, Java sudah pun dipasang pada sistem Mac OS X dan pada sistem Linux. Jika anda tidak pasti sama ada anda telah memasang Java, anda boleh menaip versi java dalam tetingkap arahan dan, Java wujud, ia akan memberitahu anda apakah versi itu. Jika anda mendapat kembali baris kosong, anda perlu sama ada memuat turun Java atau menambahkannya ke laluan carian anda. Pada sistem Windows dan pada sistem Mac OS X atau Linux yang tidak mempunyai Java, anda boleh memasang versi terbaru Java tanpa sebarang kos dengan menggunakan pautan ini: java.com. Sistem Linux dan Mac OS X terkini biasanya mempunyai versi Java yang cukup terkini telah dipasang. Sistem Mac OS X 10.4 (Leopard) dan lebih awal mungkin tidak mempunyai Java yang cukup terkini untuk dapat menjalankan PopG. Sistem Windows tidak disertakan dengan Java yang telah dipasang, tetapi ia boleh dipasang pada mereka dari tapak web di atas.

Menjalankan program

Untuk menjalankan program Java PopG anda hanya perlu mengklik (atau klik dua kali) pada ikon fail PopG.jar (anda juga boleh menjalankannya dari tetingkap arahan dengan menavigasi ke mana PopG.jar disimpan dan ditaip java -jar PopG.jar). Skrin permulaan kelihatan seperti ini:

Terdapat dua menu, File dan Run , yang mengawal PopG. Mereka berada di kiri atas tetingkap PopG utama.

Menu Run

Menu Run mengandungi lima item: Continue w/ , Continue , New Run , Restart , dan Paparkan Keseluruhan Plot .

Kali pertama ia dipilih, ia kelihatan seperti:

dengan semua kecuali New Run dikelabukan. Sebaik sahaja anda telah melakukan larian pertama anda, semua pilihan akan aktif.

Larian Baharu Pada mulanya hanya Larian Baharu tersedia. Ia memaparkan dialog berikut:

Ia mengandungi semua parameter yang mengawal larian PopG. Ambil perhatian bahawa biasanya anda tidak memasukkan benih Nombor Rawak melainkan anda mahu melakukan dua larian yang sama. Apabila anda selesai mengedit anda boleh mengklik kotak OK untuk memulakan larian. Anda juga boleh mengklik Batal untuk tidak memulakan larian dan Lalai untuk menetapkan semula semua kotak kemasukan data kepada nilai lalainya. Teruskan w/ Pilihan ini meneruskan larian, untuk bilangan generasi yang sama seperti yang dimasukkan sebelum ini dalam menu Larian Baharu. Teruskan Ini meneruskan larian, tetapi membentangkan dialog berikut:

yang membolehkan anda menukar bilangan generasi yang dijalankan dalam kesinambungan larian seterusnya. Mulakan Semula Ini memulakan semula larian dengan nilai parameter yang sama seperti sebelumnya. Jika anda ingin menukar beberapa nilai parameter, gunakan New Run sebaliknya. Paparkan Keseluruhan Plot Ini memaparkan semua generasi pada plot yang sama. Semasa larian, plot biasanya hanya menunjukkan kumpulan generasi terakhir. Ini menunjukkan semua generasi yang telah disimulasikan setakat ini. Ini amat berguna apabila anda telah menyelesaikan simulasi dan ingin mencetak hasil keseluruhan larian.

Penjana nombor rawak

Program ini menggunakan penjana nombor rawak yang dimulakan secara automatik daripada jam sistem anda. Oleh itu, ia sepatutnya memberi anda urutan nombor rawak yang berbeza dan dengan itu hasil yang berbeza setiap kali anda menjalankan program. Dalam menu untuk larian baharu, terdapat tetapan untuk benih nombor rawak yang ditetapkan secara lalai kepada (Autogenerate) , yang akan dimulakan daripada jam sistem. Anda mungkin tidak akan mempunyai sebarang sebab untuk menukar ini, melainkan anda menyahpepijat PopG dan mahu melakukan larian yang sama, dengan hasil rawak yang sama, dua kali. Jika anda ingin melakukan larian tepat yang sama dua kali, masukkan nilai sebagai ganti rentetan (Autogenerate) dan PopG akan menggunakannya untuk memulakan penjana nombor rawak. Dengan mengandaikan anda tidak mengubah suai calcPopG rutin dalam kod Java, setiap kali anda bermula dengan nombor rawak itu, anda akan mendapat keputusan yang sama.

Menu Fail

Ini mengandungi empat item menu. Ia adalah Simpan , Cetak , Perihal dan Keluar .

Kali pertama ia dipaparkan, ia kelihatan seperti:

dengan Simpan dan Cetak dikelabukan. Sebaik sahaja anda telah melakukan larian pertama anda, mereka akan aktif.

Simpan Ini membuka dialog simpan fail standard dan membolehkan anda menyimpan graf sebagai fail JPG atau PNG. Nama lalai ialah PopG dengan sambungan yang sesuai untuk dipadankan dengan format fail. Cetak Ini membuka dialog cetakan standard dan membolehkan anda memilih pencetak dan mencetak graf. Perihal Memaparkan notis hak cipta program. Berhenti Ini adalah jelas: program berhenti.

Menyusunnya sendiri

Kebanyakan orang tidak perlu menyusun atur cara itu sendiri kerana pakej Java Jar yang dibekalkan harus dijalankan pada kebanyakan versi Java. Jadi anda mungkin perlu melangkau bahagian ini. Tetapi jika anda ingin mengubah suai kefungsian PopG atau jika anda mempunyai persekitaran Java yang luar biasa yang tidak akan menjalankan fail Jar yang dibekalkan, anda memerlukan pengkompil Java. Kami ulangi: Jika anda hanya perlu menjalankan program, anda harus menjalankan fail Jar yang terdapat dalam pengedaran kami. Anda tidak perlu menyusun apa-apa (walaupun anda mungkin perlu memasang Java).

Jika anda perlu menyusun atur cara, anda akan mendapati a src direktori dalam folder yang dimuat turun dan dinyahzip PopG yang anda dapat daripada tapak kami. Import fail PopGUserInterface.java daripada src ke dalam editor Java kegemaran anda (kami menggunakan Gerhana). Anda boleh sama ada melaksanakannya terus dari sana atau mengeksport Java Jar daripada editor dan melaksanakannya. PopGUserInterface.java tidak merujuk mana-mana perpustakaan luaran, semua yang diperlukan ada dalam JavaSE-1.6 perpustakaan sistem. Jika anda mengubah suai program kami, sebaik sahaja anda selesai melakukannya, anda sepatutnya tidak menghadapi masalah mencipta Java Jar,

Jika anda tidak boleh berbuat demikian, beritahu kami, kerana itu akan menjadi pepijat.

Simulasi dengan PopG

Program ini mensimulasikan evolusi populasi mengawan rawak dengan dua alel, kesesuaian sewenang-wenang bagi tiga genotip, kadar mutasi sewenang-wenang, kadar migrasi sewenang-wenang antara populasi replika, dan saiz populasi terhingga.

Program ini mensimulasikan populasi yang berkembang secara serentak dengan anda menyatakan saiz populasi, kesesuaian tiga genotip, kadar mutasi dalam kedua-dua arah (dari A ke a dan dari a ke A ), dan kekerapan gen awal. Mereka juga meminta kadar migrasi di kalangan semua populasi, yang akan menjadikan frekuensi gen mereka lebih serupa antara satu sama lain. Kebanyakan masa (tetapi tidak selalu!) anda akan mahu menetapkan kadar migrasi ini kepada sifar. Dalam kebanyakan aspek program ini adalah jelas.

Pada mulanya terdapat sepuluh populasi. Anda boleh menetapkan bilangan populasi yang berkembang secara serentak kepada sebarang nombor dari 0 hingga 1000. Saiz populasi untuk setiap populasi boleh menjadi sebarang nombor dari 1 hingga 10000. Ambil perhatian bahawa populasi yang lebih besar, bilangan generasi yang lebih besar dijalankan dan bilangan yang lebih besar populasi boleh membawa kepada larian yang lebih lama.

Apabila anda membuat pemilihan menu yang menyebabkan program dijalankan, graf frekuensi gen alel A dalam setiap populasi akan dilukis dalam tetingkap. Berikut ialah rupa graf apabila kita menjalankan dengan frekuensi gen awal 0.2 dan kesesuaian AA, Aa, dan aa ditetapkan kepada 1.08, 1.04 dan 1, dengan semua parameter lain dalam nilai lalainya. (Perhatikan bahawa jika anda mencuba larian ini, akan ada nombor rawak yang berbeza, jadi keputusan anda akan sedikit berbeza).

Ambil perhatian bahawa tetingkap boleh diubah saiznya, dan graf harus disesuaikan dengan ini. Terdapat juga lengkung biru yang menunjukkan kekerapan gen dalam populasi yang tidak terhingga (satu tanpa hanyut genetik). Jika bilangan populasi yang disimulasikan ditetapkan kepada sifar, lengkung ini sahaja yang anda akan lihat. Graf boleh dicetak menggunakan pilihan Cetak pada menu Fail, atau disimpan ke fail Postscript menggunakan pilihan Simpan dalam menu itu.

Ambil perhatian bahawa sebaik sahaja plot lengkung frekuensi gen mencapai bahagian kanan graf, program mencetak di sana bilangan populasi yang ditetapkan untuk alel A (berakhir dengan frekuensi 1.0) dan nombor yang kehilangan alel ini. .

Cadangan

  • Cuba kes tanpa mutasi, tiada migrasi dan semua kecergasan 1.0 supaya tiada pilihan. Adakah hanyutan genetik dalam populasi bersaiz 1000 mencapai perubahan yang hampir sama dalam 1000 generasi seperti hanyutan genetik dalam populasi bersaiz 100 dalam 100 generasi? Dengan menjalankan bilangan populasi yang besar, bolehkah anda menyemak sama ada kebarangkalian alel ditetapkan oleh hanyutan genetik adalah sama dengan kekerapan awalnya dalam populasi?
  • Cuba kes tanpa mutasi atau penghijrahan, dengan alel A digemari oleh pemilihan semula jadi (dengan kesesuaian set genotip AA tertinggi dan kesesuaian set genotip aa terendah). Mulakan dengan frekuensi kecil A . Adakah ia sentiasa diperbaiki? Jika seseorang bermula dengan satu salinan alel, bagaimanakah kebarangkalian bahawa A adalah tetap berbanding dengan pekali pemilihan yang menyokongnya dalam heterozigot (pecahan yang mana Aa genotip adalah lebih tinggi berbanding dengan kecergasan genotip aa)? Adakah kebarangkalian penetapan ini lebih besar daripada yang anda akan dapat dengan kekerapan awal yang sama tetapi tanpa pilihan?
  • Cuba penguasaan berlebihan ( Aa mempunyai kecergasan tertinggi). Adakah kekerapan gen menumpu ke arah keseimbangan? Mengapakah ia berbeza daripada kekerapan keseimbangan ini? Seberapa besar pekali pemilihan perlu menyebabkan kekerapan gen menjauhkan diri daripada penetapan atau kehilangan untuk jumlah masa yang banyak?
  • Cuba underdominance ( Aa mempunyai kecergasan paling rendah). Adakah terdapat kekerapan gen permulaan yang akan mengakibatkan sesetengah populasi menuju ke arah penetapan, dan yang lain menuju ke arah kerugian? Jika anda menambah sedikit migrasi, apakah yang akan berlaku dalam jangka masa panjang? Apa yang akan berlaku jika sebaliknya anda menambah sejumlah kecil mutasi dalam kedua-dua arah?
  • Dengan penghijrahan tetapi tiada pemilihan atau mutasi, berapa banyak penghijrahan yang diperlukan untuk menjadikan lengkung frekuensi gen menjadi agak serupa antara satu sama lain? Berapa banyak yang diperlukan untuk membuat mereka semua berakhir pada frekuensi gen yang sama dalam jangka masa panjang? Bagaimanakah kadar migrasi itu dipengaruhi oleh saiz populasi?
  • Dengan mutasi tetapi tiada penghijrahan atau pemilihan, berapa banyak mutasi yang diperlukan untuk menyebabkan frekuensi gen menumpu kepada frekuensi gen keseimbangan mutasi? Bagaimanakah nilai ini berkaitan dengan saiz populasi?
  • Jika alel dipilih menentang, bolehkah anda menyediakan kadar mutasi yang akan mengekalkannya pada frekuensi rendah dalam populasi?

Kredit

Versi 4.0 PopG, versi Java pertama, ditulis oleh Ben Zawadzki. Pengaturcaraan beliau yang sangat berkesan menggunakan bimbingan dan nasihat daripada ahli sihir Java makmal kami, Jim McGill.

Versi asal PopG telah ditulis pada tahun 1970-an di FORTRAN oleh Joe Felsenstein. Versi interaktif kemudiannya ditulis dalam C dengan banyak kerja oleh Hisashi Horino, Sean Lamont, Bill Alford, Mark Wells, Mike Palczewski, Doug Buxton, Elizabeth Walkup, Ben Zawadzki dan Jim McGill. Hisashi dan Sean menulis versi C, dan grafik skrin untuk IBM PC dan bahagian pertama sistem percetakan Postscript. Bill telah menambah baik dan mengembangkan pencetakan Postscript dan grafik tingkap X. Mark Wells melakukan versi Macintosh asal. Mike Palczewski telah menambah baik antara muka pengguna grafik Windows, Macintosh dan X Windows, dan Doug Buxton mengubah suai program kepada versi 3.0 dan menyediakan boleh laku untuk sistem pengendalian yang berbeza. Elizabeth Walkup menambah baik interaksi tetingkap X dan menyediakan versi 3.3. Perubahan dokumentasi kecil selepas versi 4.0 dibuat oleh saya.


BEAST: Analisis evolusi Bayesian dengan pensampelan pokok

latar belakang: Analisis evolusi variasi jujukan molekul ialah perusahaan statistik. Ini dicerminkan dalam peningkatan penggunaan model kebarangkalian untuk inferens filogenetik, penjajaran jujukan berbilang, dan genetik populasi molekul. Di sini kami mempersembahkan BEAST: seni bina perisian yang pantas dan fleksibel untuk analisis Bayesian bagi jujukan molekul yang berkaitan dengan pokok evolusi. Sebilangan besar model stokastik popular evolusi jujukan disediakan dan model berasaskan pokok yang sesuai untuk kedua-dua data jujukan dalam dan antara spesies dilaksanakan.

Keputusan: BEAST versi 1.4.6 terdiri daripada 81000 baris kod sumber Java, 779 kelas dan 81 pakej. Ia menyediakan model untuk evolusi jujukan DNA dan protein, analisis koalesen sangat parametrik, filogenetik jam santai, data jujukan bukan kontemporari, penjajaran statistik dan pelbagai pilihan untuk pengedaran terdahulu. Kod sumber BEAST adalah berorientasikan objek, reka bentuk modular dan tersedia secara percuma di http://beast-mcmc.googlecode.com/ di bawah lesen GNU LGPL.

Kesimpulan: BEAST ialah pakej analisis evolusi yang berkuasa dan fleksibel untuk variasi jujukan molekul. Ia juga menyediakan sumber untuk pembangunan selanjutnya model baharu dan kaedah statistik analisis evolusi.


Keputusan dan perbincangan

Ujian 1: Sisipan Sendiri atau Pemadaman Sendiri

Ujian pertama kami adalah untuk menjalankan simulasi sisipan sahaja dan pemadaman sahaja. Panjang indel telah ditetapkan dengan 1, 2, 4, dan 8 sisa atau tapak. Kami mengukur prestasi setiap kaedah dengan 1) panjang penjajaran berbilang sebenar untuk sisipan, dengan bilangan tapak yang dimasukkan adalah sama dengan panjang penjajaran tolak 1,000 dan 2) bilangan aksara yang tinggal dalam jujukan output untuk pemadaman.

Rajah 5 dan angka tambahan S3, Bahan Tambahan dalam talian, menunjukkan keputusan ujian. Bilangan nod dalaman dalam pepohon panduan mempunyai kesan buruk pada prestasi SIMPROT, iSGv1.0, ROSE dan MySSP (hanya dalam kes sisipan). Sebagai kesan sampingan daripada pemodelan berterusan indel mereka, terlalu tinggi anggaran pemadaman (rajah 5A dan B ) dan meremehkan sisipan (rajah 5C dan D ) ditunjukkan dengan jelas dengan bilangan nod dalaman yang lebih sedikit. Kaedah ini mengira bilangan jangkaan peristiwa indel tanpa melaraskan panjang jujukan apabila sesuatu peristiwa berlaku. DAWG, iSGv2.0 dan EvolveAGene3 tidak menunjukkan kesan atau sangat sedikit kesan dalam nombor indel. Untuk DAWG dan iSGv2.0, ini kerana panjang jujukan dilaraskan secara dinamik di sepanjang cawangan. Keputusan yang tidak terjejas oleh EvolveAGene3 mungkin disebabkan oleh fakta bahawa kaedah ini menganggap panjang cawangan sebagai bilangan ujian peristiwa mutasi yang berlaku di sepanjang cawangan. Untuk tujuan kami, kami menetapkan panjang cawangan kepada 8,000 ujian peristiwa mutasi (jujukan 1,000 aksara dengan setiap tapak menjalani lapan penggantian). EvolveAGene3 juga melarang sisipan dan pemadaman bertindih, dengan berkesan mengurangkan kadar pemadaman dengan pemadaman yang lebih besar. Kesan ini boleh dilihat dalam angka tambahan S3 (I), Bahan Tambahan dalam talian, di mana “more” aksara ditinggalkan selepas simulasi dengan saiz pemadaman yang lebih besar. Oleh kerana kebarangkalian pemasukan dan pemadaman berterusan yang ditetapkan dalam EvolveAGene3 dan penyingkiran kekangan kodon kami dalam EvolveAGene3, panjang penjajaran selalunya lebih pendek daripada kaedah simulasi lain.

Perbandingan prestasi simulasi indel (Ujian 1) antara tujuh kaedah. Simulasi yang betul dijangka menghasilkan plot dengan garisan melintang. Saiz indel yang digunakan ialah (A) pemadaman saiz-1, (B) pemadaman saiz-4, (C) sisipan saiz-1, dan (D) bersaiz-4 sisipan. The y-paksi menunjukkan bilangan aksara yang tinggal dalam jujukan daun (A,B) dan panjang penjajaran sebenar (C, D). Nilai purata yang diperoleh daripada 100 simulasi diplotkan. Jadual di bawah meringkaskan sisihan piawai untuk setiap titik data. Angka tambahan S4, Bahan Tambahan dalam talian, menunjukkan semua keputusan ujian dalam warna.

Keputusan ini menunjukkan bahawa iSGv2.0 dan DAWG berfungsi dengan sewajarnya, menghasilkan keputusan yang konsisten tanpa mengira bilangan nod dalaman. EvolveAGene3 juga berkelakuan sewajarnya mengikut model indelnya sendiri. iSGv1.0, ROSE, SIMPROT dan MySSP semuanya dipengaruhi oleh bilangan nod dalaman, masing-masing menghasilkan kadar buatan yang tinggi atau rendah untuk pemadaman atau sisipan.

Ujian 2: Termasuk Kedua-dua Sisipan dan Pemadaman dengan Pelbagai Pdalam dan Pdel

Untuk mengkaji lebih lanjut kesan model indel, kami mensimulasikan kedua-dua sisipan dan pemadaman menggunakan pengedaran Zipfian (Chang dan Benner 2004) dengan lima kaedah: DAWG, ROSE, SIMPROT, iSGv1.0 dan iSGv2.0. Kami mensimulasikan tiga senario: 1) Pdalam = 0.01 dan Pdel = 0.03, 2) Pdalam = 0.02 dan Pdel = 0.02, dan 3) Pdalam = 0.03 dan Pdel = 0.01, di mana Pdalam dan Pdel ialah bilangan sisipan dan pemadaman setiap penggantian, masing-masing. Kami memilih untuk menggunakan pengedaran Zipfian kerana ia merupakan pengedaran panjang yang ditentukan secara empirik untuk acara sisipan dan pemadaman. Untuk MySSP, yang melaksanakan taburan panjang yang diedarkan secara normal berdasarkan purata panjang indel yang diberikan oleh pengguna, kami menggunakan jangkaan panjang indel 2.082, yang berdasarkan taburan Zipfian dengan saiz indel maksimum 10. EvolveAGene3 dikecualikan daripada ujian ini kerana berubah Pdalam dan Pdel secara asasnya mengubah kaedah penciptaan indel dalam EvolveAGene3. Dalam ujian ini, kaunter peristiwa yang melaporkan bilangan sisipan dan pemadaman yang berlaku semasa simulasi telah ditambahkan pada setiap kaedah. Oleh kerana kami tidak dapat memperoleh kod sumber untuk MySSP, kami mengira bilangan peristiwa seperti berikut: Setiap jurang dalam jujukan akar dalam penjajaran berbilang sebenar ialah kesan sisipan dalam jujukan keturunan, dan begitu juga, setiap jurang dalam jujukan hujung adalah hasil pemadaman dalam jujukan nenek moyang. Untuk mendapatkan bilangan peristiwa pemasukan dan pemadaman, kami mengira jumlah bilangan jurang dalam urutan akar dan hujung, masing-masing, dan membahagikan nombor itu dengan saiz indel min. Kami mengukur kualiti simulasi indel dengan membandingkan bilangan sisipan dan pemadaman yang dihasilkan. Kami mengira pekali variasi (σ 2 /μ), yang tidak berdimensi dan membuat hasil daripada kaedah simulasi berbeza setanding. Jika σ 2 /μ ≈ 0, ini bermakna kaedah simulasi berkelakuan sama antara pepohon panduan (tiada kesan bilangan nod yang berbeza). Yang lebih besar σ 2 /μ mencadangkan bahawa kaedah simulasi dilakukan secara berbeza antara pepohon panduan dengan bilangan nod yang berbeza.

Rajah 6 dan jadual 2 menunjukkan keputusan ujian ini. Seperti yang dijangkakan, bilangan sisipan dan pemadaman yang dijana dipengaruhi oleh kebarangkalian sisipan dan pemadaman. Untuk iSGv1.0 dan ROSE, apabila PdalamPdel, bilangan nod dalaman mempengaruhi kedua-dua bilangan sisipan dan pemadaman. SIMPROT, hasil daripada ciri pembetulan berbilang hit mereka, menunjukkan kesan yang lebih drastik dengan nombor nod dalaman daripada iSGv1.0 dan ROSE apabila kadar sisipan lebih besar daripada kadar pemadaman (Pdalam = 0.03 dan Pdel = 0.01). Kesan sedemikian tidak ditunjukkan apabila kadar pemadaman lebih besar (Pdalam = 0.01 dan Pdel = 0.03). MySSP menunjukkan peningkatan bilangan indel untuk setiap ujian, dengan perubahan paling drastik berlaku apabila Pdalam = 0.03 dan Pdel = 0.01. Tingkah laku ini boleh difahami dengan lebih baik menggunakan keputusan Ujian 1, di mana dalam kes sisipan, panjang jujukan bertambah apabila lebih banyak nod dalaman ditambah, tetapi panjang jujukan adalah stabil untuk pemadaman di bawah keadaan yang sama.

Jadual 2

Kesan Nombor Nod Dalaman dengan Kadar Sisipan dan Pemadaman yang Berbeza antara Kaedah a

σ 2 /μ
MySSP SIMPROT DAWG iSGv1.0 iSGv2.0 MAWAR
dalamdeldalamdeldalamdeldalamdeldalamdeldalamdel
(A) Pdalam = 0.01, Pdel = 0.030.1450.4330.0030.0120.0150.0040.2160.7260.0210.0020.2260.734
(B) Pdalam = 0.02, Pdel = 0.020.5070.4170.3800.4350.0140.0020.0040.0010.0220.0070.0030.000
(C) Pdalam = 0.03, Pdel = 0.014.8711.6752.7360.7570.0060.0030.7340.2950.0050.0310.8160.265

Ujian 2 keputusan dengan nisbah kebarangkalian indel yang berbeza. Bagi setiap kaedah, jumlah bilangan sisipan (bar gelap) dan pemadaman (bar cahaya) yang dihasilkan ditunjukkan untuk eksperimen simulasi menggunakan pepohon panduan dengan bilangan segmen yang berbeza (lihat rajah 4). Ambil perhatian bahawa untuk MySSP, kami menggunakan purata nilai jangkaan taburan Zipfian untuk mendapatkan keputusan. Untuk semua kaedah, nilai purata yang diperoleh daripada 100 simulasi digunakan.

Jadual 2 meringkaskan darjah variasi (σ 2 /μ) dalam bilangan sisipan dan pemadaman antara percubaan Ujian 2. Untuk iSGv1.0 dan ROSE, kami perhatikan bahawa variasi dalam bilangan acara pemasukan dan pemadaman adalah arah aliran yang lebih tinggi ke arah kebarangkalian peristiwa dominan seperti yang ditunjukkan dalam rajah 6, manakala MySSP menunjukkan kebolehubahan yang tinggi dalam semua ujian, walaupun ia paling ketara apabila kadar pemasukan relatif adalah tinggi. SIMPROT juga menunjukkan variasi yang tinggi apabila Pdalam = 0.03 dan Pdel = 0.01 atau Pdalam = Pdel, walaupun ia setanding dengan iSGv2.0 dan DAWG apabila Pdalam = 0.01 dan Pdel = 0.03. Bila Pdalam = Pdel, model indel iSGv1.0 dan ROSE kelihatan sangat sedikit terjejas oleh nombor nod dalaman. Perhatikan bahawa apabila Pdalam = Pdel, iSGv2.0 dan DAWG menunjukkan lebih besar sedikit σ 2 /μ nilai daripada iSGv1.0 dan ROSE. Ini adalah akibat daripada bilangan langkah yang lebih besar dengan peristiwa indel dan penilaian panjang jujukan yang dilakukan oleh kaedah ini. Simulasi sebagai jalan rawak meningkatkan varians dalam panjang jujukan pada setiap langkah. DAWG dan iSGv2.0 mengambil bilangan langkah yang lebih besar (masing-masing 600 dan 1,024) berbanding dengan paling banyak lapan langkah yang diambil oleh semua simulator lain. Kami mengesahkan keputusan ini dengan mengubah bilangan langkah yang diambil oleh iSGv2 (data tidak ditunjukkan).

Contoh Aplikasi untuk Simulasi Superfamily Protein

Rajah 7 menunjukkan contoh output “true alignment” yang diperoleh daripada ROSE dan iSGv2.0 (lihat rajah tambahan S5, Bahan Tambahan dalam talian, untuk output termasuk iSGv1.0). Seperti yang ditunjukkan dalam jadual 3, iSGv2.0 memulihara 80.98% kedudukan jujukan dengan betul, manakala iSGv1.0 dan ROSE, yang kedua-duanya tidak dapat memulihara set aksara, dimodelkan dengan betul hanya 61.82% dan 61.88% daripada kedudukan, masing-masing. Daripada motif yang berbeza, iSGv2.0 memulihara semua tapak SCR1 dengan sempurna (lihat rajah 7). Ini kerana motif ini terdapat dalam penjajaran akar dan dipelihara dari awal simulasi dijalankan sepanjang garis keturunan lipocalin. Untuk motif lain, semua penggantian diterima sehingga motif menjadi berkesan kemudian dalam pokok, selepas itu hanya penggantian yang mematuhi kekangan khusus kedudukan diterima.

Jadual 3

Perbandingan Prestasi antara iSGv1.0, ROSE dan iSGv2.0 untuk Simulasi Superfamily Calycin a

iSGv1.0MAWARiSGv2.0Penjajaran Input
Identiti jujukan peratus19.7817.7214.6215.65
Kedudukan motif peratus dipelihara61.8261.8880.98
Bilangan templat yang melanggar indel b 13.1819.91 d 0
Bilangan indel yang ditolak c NANA0.38

Kami melihat pelbagai kesan sampingan disebabkan oleh sekatan yang dikenakan oleh invariable kuaternari dan saya + γ tatasusunan iSGv1.0 dan ROSE, masing-masing. Seperti yang dilihat dalam rajah 7 dan rajah tambahan S5, Bahan Tambahan dalam talian, motif yang dipelihara dalam jajaran berbilang muncul sebagai “islands” di mana indels tiada. Selain itu, tapak invariable seperti rantau GXW SCR1 telah dipelihara untuk keseluruhan lajur penjajaran, walaupun pada hakikatnya ia hanya perlu dipelihara di kalangan lipocalin kernel dan keluarga lipocalin terluar bagi protein pengikat bau. iSGv1.0 juga mensimulasikan lebih sedikit indel, yang merupakan kesan sampingan bilangan kedudukan penjajaran yang mengandungi kedudukan motif, mengurangkan bilangan kedudukan penerimaan untuk indel. Nampaknya ROSE menggunakan bilangan mutlak sisa dalam jujukan untuk mengira kebarangkalian keseluruhan indel bagi cawangan, tanpa mengira bilangan tapak yang tidak menerima indel. Perbezaan dalam peletakan indel antara iSGv1.0 dan ROSE berbanding iSGv2.0 juga jelas. Seperti yang ditunjukkan dalam rajah 7, iSGv2.0 mempunyai bilangan indel yang jauh lebih tinggi di sepanjang kawasan terminal N dan C bagi penjajaran. Ini kerana kawasan ini hanya mempunyai kekangan yang lemah pada saiznya: Terminal-N dihadkan kepada 10� residu dan terminal-C 10 hingga 30 residu. Semasa proses simulasi, iSGv2.0 menentukan saiz indel, dan berdasarkan kedua-dua templat dan kekangan motif mencari jujukan untuk mencari kawasan yang boleh menerima indel. Kebanyakan indel yang lebih besar cenderung jatuh di kawasan yang paling kurang terhad. Oleh kerana iSGv1.0 mahupun ROSE tidak mempunyai keupayaan kekangan sedemikian, indel diletakkan di mana-mana sahaja ia tidak dilarang oleh invariable kuaternari dan saya + γ tatasusunan. Tambahan pula, lipatan superfamili tidak boleh dimodelkan oleh iSGv1.0 atau ROSE. Mereka meletakkan purata 13.18 dan 19.91 indel pemecah templat, masing-masing (jadual 3). iSGv2.0 mengekalkan sekatan templat. Secara purata, 0.35 indel setiap larian simulasi telah ditolak menggunakan iSGv2.0 kerana terdapat kedudukan terhad yang boleh diterima untuk indel kerana kekangan templat.

Penjajaran berbilang input (rajah tambahan S1, Bahan Tambahan dalam talian) mempunyai identiti jujukan berpasangan purata sebanyak 15.65% (jadual 3). Julat 20�% identiti jujukan atau lebih rendah ialah apa yang dipanggil “twilight zone” identiti jujukan (Rost 1999), yang sering dilihat dalam kalangan protein yang dimiliki oleh keluarga yang sangat berbeza. Set data simulasi iSGv1.0, ROSE dan iSGv2.0 dalam julat ini, dengan nilai purata melebihi 100 larian masing-masing sebanyak 19.78%, 17.72% dan 14.62%. Perbezaan dalam identiti jujukan antara iSGv1.0 dan ROSE berbanding iSGv2.0 dijelaskan oleh pemuliharaan global tapak invariable oleh iSGv1.0 dan ROSE, walaupun untuk jujukan tanpa motif khusus keturunan. iSGv1.0 dan ROSE kedua-duanya menunjukkan kedudukan motif “peratus yang lebih rendah terpelihara” (jadual 3) menunjukkan bahawa beberapa kedudukan telah dipelihara oleh mereka walaupun mereka tidak mematuhi kekangan sisa untuk keluarga protein yang berbeza.


Bahan

Berikut ialah templat untuk beberapa kepingan kadbod yang anda perlukan untuk makmal ini.

  • Jalur kadbod kira-kira 6.5 cm lebar (mewakili tulang)
  • Prapotong jalur kadbod ini mengikut panjang yang ditetapkan untuk setiap kumpulan makmal
    • 4x 20.5cm
    • 4x 12.5cm
    • 4x7.5cm
    • 4x5cm
    • 4x3.5cm
    • Bulatan dengan diameter 5.5cm "X"
    • Bulatan dengan diameter 15cm “W”
    • Segi empat dengan panjang 5.5cm "Y"
    • Segi empat sama dengan panjang 2.5cm "Z"

    Ketersediaan dan keperluan

    Nama Projek:πBAS Laman utama projek:http://www.rega.kuleuven.be/cev/ecv/software/pibuss Sistem operasi): Platform bebas Bahasa pengaturcaraan: Jawa Keperluan lain: Java 1.5 atau lebih tinggi, perpustakaan BEAGLE Lesen: GNU GPL Kecil Sebarang sekatan untuk digunakan oleh bukan akademik: tiada.

    Kod sumber utiliti BEAST/BEAGLE selari untuk simulasi jujukan tersedia secara percuma sebagai sebahagian daripada repositori Kod Google BEAST: http://www.code.google.com/p/beast-mcmc/.

    Pustaka Penilai Kemungkinan Am (BEAGLE) Analisis Evolusi platform meluas mempunyai kedua-dua kod sumber dan pemasang binari yang tersedia daripada http://www.code.google.com/p/beagle-lib.

    Skrip dan fail input diperlukan untuk mengulang kajian simulasi yang dibentangkan dalam Contoh aplikasi dihoskan di http://www.github.com/phylogeography/DeepRoot.


    MEGA 10.0

    MEGA (Analisis Genetik Evolusi Molekul) ialah alat bersepadu untuk penjajaran jujukan automatik dan manual, membuat kesimpulan pokok filogenetik, pangkalan data berasaskan web melombong, menganggar kadar evolusi molekul dan menguji hipotesis evolusi.

    :: SCREENSHOT

    :: KEPERLUAN

    :: MAKLUMAT LANJUT

    Mol Biol Evol. 2013 Dis30(12):2725-9. doi: 10.1093/molbev/mst197. Epub 2013 16 Okt.
    MEGA6: Analisis Genetik Evolusi Molekul versi 6.0.
    Tamura K, Stecher G, Peterson D, Filipski A, Kumar S.

    Tamura K, Peterson D, Peterson N, Stecher G, Nei M, dan Kumar S (2011)
    MEGA5: Analisis Genetik Evolusi Molekul menggunakan Kaedah Kemungkinan Maksimum, Jarak Evolusi dan Kaedah Parsimony Maksimum.
    Molecular Biology and Evolution (2011)doi: 10.1093/molbev/msr121 Pertama diterbitkan dalam talian: 4 Mei 2011

    Tinggalkan pesanan Batalkan balasan

    Laman web ini menggunakan Akismet untuk mengurangkan spam. Ketahui cara data ulasan anda diproses.


    Alat simulasi evolusi jujukan - Biologi

    NGSphy: simulasi filogenomik data penjujukan generasi akan datang

    © 2017 Merly Escalona ([email protected]), Sara Rocha, David Posada

    NGSphy ialah alat sumber terbuka Python untuk simulasi genom seluruh data NGS (kiraan bacaan atau bacaan Illumina) yang diperoleh daripada beribu-ribu keluarga gen yang berkembang di bawah pokok spesies biasa, dengan berbilang individu haploid dan/atau diploid bagi setiap spesies, di mana penjujukan heterogeniti liputan (kedalaman) boleh berbeza-beza antara spesies, individu dan lokus, termasuk lokus luar sasaran dan tidak ditangkap.

    NGSphy mensimulasikan bacaan (atau kiraan bacaan) daripada penjajaran yang berasal daripada pokok gen tunggal atau taburan pokok gen (berasal daripada taburan spesies-pokok). Ia direka untuk membaca terus daripada SimPhy (simulator evolusi keluarga gen) dalam kes pengagihan pokok gen, tetapi ia juga boleh diberi makan pokok gen secara langsung. Pokok-pokok ini boleh mengandungi ortolog, paralog dan xenolog. Penjajaran disimulasikan menggunakan INDELible dan boleh mewakili berbilang individu haploid dan/atau diploid bagi setiap spesies. Kemudian, sama ada bacaan Illumina (menggunakan ART) atau kiraan bacaan disimulasikan untuk setiap individu, dengan kedalaman liputan dibenarkan berbeza antara spesies, individu dan lokus. Fleksibiliti ini membolehkan simulasi kedua-dua lokus di luar sasaran (ditawan tetapi tidak disasarkan) dan tidak ditangkap (disasarkan tetapi tidak ditangkap).

    Anda memerlukan fail tetapan NGSphy dan fail yang diperlukan mengikut mod input yang dipilih (lihat di bawah).


    Alat simulasi evolusi jujukan - Biologi

    Trevolver ialah program Perl untuk mensimulasikan evolusi jujukan DNA tidak boleh balik pada pokok bifurcating tetap menggunakan konteks trinukleotida. Ia tidak bergantung pada kebergantungan luaran, memudahkan kemudahalihan maksimum. Muat turun dan jalankan sahaja.

    Untuk menguji simulasi dengan data contoh, laksanakan program di baris arahan Unix atau Terminal Mac seperti berikut:

    Cari beberapa contoh sebenar di bawah. Lihat pracetak kami di bioRxiv.

    Data mutasi baharu, termasuk de novo mutasi yang dikesan dalam penjujukan genom keseluruhan 'trio' bapa/ibu-anak, boleh digunakan untuk menganggarkan kadar mutasi bergantung konteks secara empirik. Konteks yang paling biasa digunakan ialah trinukleotida, di mana nukleotida mengapit pada kedua-dua belah kedudukan dipertimbangkan (satu 5', satu 3'). Malangnya, alat kekurangan untuk simulasi tidak boleh balik (i.e., kadar asimetri) evolusi DNA pada pokok gen bifurcating tetap (binari diselesaikan sepenuhnya), seperti yang dihasilkan oleh simulasi penggabungan. Trevolver telah dibuat untuk mengisi jurang ini. Pengguna mesti menyediakan pokok bercabang, jujukan benih, matriks kadar 64 × 4 (trinukleotida × nukleotida) dan unit cawangan (lihat pilihan). Trevolver mengeluarkan laporan SNP Format Panggilan Varian (VCF) untuk semua petua pokok (taksa daun), serta sejarah mutasi dan motif untuk setiap keturunan (lihat output).

    Trevolver bermula dengan meletakkan jujukan benih pada akar pokok. Ia kemudiannya meneruskan untuk melintasi pokok secara rekursif dari akar ke hujung sebagai struktur pokok binari yang teratur. Dalam erti kata lain, pada setiap nod dalaman, ia memproses anak kiri (dan anak kirinya, dan seterusnya) sebelum memproses anak kanan, di mana nod keturunan kiri (pertama) dianggap sebagai yang datang dahulu menggunakan abjad ( bukan numerik) fungsi sort(). ID nod unik ditetapkan sebagai huruf 'n' diikuti oleh integer (cth., n5), di mana punca dianggap n=0.

    Apabila satu cawangan (berbanding dengan gugusan) ditemui, Trevolver mula mengembangkan urutan di sepanjang cawangan. Jika nod induk cawangan juga menjadi punca, jujukan benih (nenek moyang) digunakan sebagai titik permulaan. Jika tidak, salinan jujukan benih baharu dan sementara dibuat, di mana alel terbaharu di setiap tapak bermutasi akan dikira. Ini menjimatkan memori komputer, kerana setiap nod hanya perlu mewarisi sejarah mutasinya, bukan keseluruhan jujukan, daripada pendahulunya.

    Selepas jujukan baharu dimulakan pada cawangan, ia mula berkembang di bawah kadar mutasi yang bergantung kepada konteks trinukleotida yang ditentukan oleh input pengguna. Matriks kadar mutasi dalam Trevolver mengikut format simulasi masa hadapan Nipis (Haller dan Messer 2019): 4 3 = 64 baris sepadan dengan keadaan awal 64 trinukleotida tersusun mengikut abjad, manakala 4 lajur sepadan dengan kemungkinan keadaan terbitan nukleotida pusat. Sebagai contoh, lajur ketiga baris pertama harus mengandungi kadar mutasi AAA➞AGA. Kadar mutasi untuk identiti (cth., AAA➞AAA) hendaklah 0.

    Apabila evolusi bermula pada cabang, Trevolver mula-mula mengira kadar mutasi keseluruhan jujukan panjang L dengan menjumlahkan L - 2 trinukleotida dalam urutan (i.e., nukleotida pertama dan terakhir, tanpa konteks trinukleotida, diabaikan). Kadar mutasi keseluruhan jujukan (u) kemudian digunakan untuk mengira masa menunggu teragih eksponen secara rawak kepada mutasi seterusnya sebagai gw = -(1 / u) × ln(x1) generasi, di mana x ialah nombor rawak antara 0 (inklusif) dan 1 (eksklusif) (Yang 2014). Jika jangka masa menunggu (gw) kurang daripada panjang cawangan, mutasi berlaku. Urutan itu kemudiannya diperiksa satu trinukleotida pada satu masa, sehingga kadar mutasi kumulatif sepanjang jujukan melebihi nilai kedua yang dipilih secara rawak antara 0 (inklusif) dan u (eksklusif).Mutasi kemudiannya berlaku pada kedudukan tengah trinukleotida pertama yang mana keadaan ini dipegang dan yang kadar mutasinya lebih besar daripada 0. Disebabkan pergantungan konteks ini, trinukleotida yang sangat boleh berubah boleh 'terhakis' dari semasa ke semasa, dan kadar mutasi keseluruhan jujukan ialah nilai yang muncul (bukannya yang telah ditetapkan) bergantung pada matriks kadar. Sesungguhnya, kadar mutasi keseluruhan mungkin berkurangan (atau meningkat) sehingga komposisi triunkleotida keseimbangan dicapai.

    Panggil Trevolver menggunakan pilihan berikut:

    --pokok (DIPERLUKAN): fail yang mengandungi pokok evolusi bercabang dalam format newick dengan panjang cawangan. TIADA NAMA NOD ATAU NILAI SOKONGAN PADA MASA INI. Hanya pokok yang pertama ditemui digunakan, i.e., analisis selari yang memalukan mesti dilaksanakan satu tahap ke atas.

    --seed_sequence (DIPERLUKAN): Fail FASTA yang mengandungi jujukan permulaan (benih) pada akar pokok, untuk dikembangkan. Hanya urutan pertama yang ditemui digunakan.

    --rate_matrix (DIPERLUKAN): fail yang mengandungi matriks kadar trinukleotida yang dipisahkan tab 64 × 4 dengan baris dan lajur dalam susunan abjad. Sebagai contoh, nilai dalam baris pertama sepadan dengan AAA➞AAA, AAA➞ACA, AAA➞AGA dan AAA➞ATA.

    --unit_cawangan (DIPERLUKAN): faktor penskalaan, sama dengan 2N0 atau 4N0 dalam kebanyakan simulasi gabungan (cth., Cik Hudson 2002), yang boleh didarab dengan panjang cabang untuk mendapatkan panjang keturunan dalam generasi. Panjang cawangan akan didarab dengan nilai ini dan dibundarkan kepada integer terdekat untuk menentukan bilangan generasi. Sebagai contoh, memandangkan nilai 144740, panjang cawangan 0.228826612 dalam pokok filogenetik akan sepadan dengan 144740 × 0.228826612 = 33,120.364 generasi.

    --random_seed (PILIHAN): integer yang digunakan untuk menyemai penjana nombor rawak. Jika tidak dibekalkan, satu akan dipilih dan dilaporkan. Lebih khusus lagi, kami melaksanakan pendekatan semak yang diberikan dalam Pengaturcaraan Perl:

    --tracked_motif (PILIHAN): motif untuk dikesan selepas setiap mutasi. Sebagai contoh, untuk melaporkan bilangan tapak CpG sepanjang larian, nyatakan CG seperti: --tracked_motif=CG .

    --track_mutation (PILIHAN): melaporkan kadar mutasi dan kiraan dari semasa ke semasa.

    --excluded_taxa (PILIHAN): laluan daripada fail yang mengandungi senarai nama takson (dipisahkan koma) untuk dianggap sebagai kumpulan luar, i.e., dikecualikan daripada fail VCF dan jujukan konsensus. Ini mungkin wajar jika sebilangan kecil taksa mewakili kumpulan luar, yang polimorfisme dalam kumpulan dalam dibandingkan.

    --kumpulan luar (PILIHAN): bilangan kumpulan luar untuk dikecualikan untuk mengenal pasti moyang sepunya terbaharu (MRCA) dalam kumpulan dan untuk pengiraan frekuensi varian dalam kumpulan dalam fail VCF. Kumpulan luar dianggap sebagai taksa terminal yang paling dalam bercabang (nod luaran). Sebagai contoh, jika --outgroups=2 ditentukan, pokok tetap dilayari bermula pada akar. Pada setiap nod dalaman, cawangan yang mengandungi taksa terminal paling sedikit dianggap mengandungi kumpulan keluar. Setelah bilangan kumpulan luar yang ditentukan pengguna dikenal pasti, nod moyang sepunya (MRCA) terbaharu bagi taksa (dalam kumpulan) yang tinggal dikenal pasti dan dilaporkan. Jika satu set taksa kumpulan luar bukan sewenang-wenangnya tidak wujud untuk nombor yang ditentukan pengguna (cth., jika --outgroups=2 dipanggil, tetapi dua pemisahan terdalam mengandungi tiga daripada dua taksa), amaran dicetak dan tiada kumpulan luar digunakan.

    --burn_in (PILIHAN): bilangan generasi untuk 'membakar dalam' urutan evolusi sebelum memulakan evolusi pada akar pokok. Ambil perhatian bahawa ini diukur dalam bilangan generasi mutlak, bukan dalam unit cawangan. Amalan standard ialah 10N atau 20N generasi, di mana N ialah saiz populasi (berkesan).

    --vcf_output (PILIHAN): nama fail output format VCF yang akan dijana dalam direktori kerja, melainkan nama laluan penuh diberikan. Jika tidak dinyatakan, fail akan dicetak dalam direktori kerja dengan sambungan .vcf menggunakan nama fail pokok sebagai awalan.

    --suppress_seed_seq (PILIHAN): menyekat pencetakan urutan (benih) nenek moyang dalam output. Ini mungkin wajar jika jujukan benih adalah sangat besar dan kemasukannya dalam output menggunakan terlalu banyak ruang cakera.

    --suppress_MRCA_seq (PILIHAN): menghalang jujukan MRCA (ingroup most recent common ancestor) daripada dicetak.

    --suppress_consensus_seq (PILIHAN): menghalang jujukan konsensus (mengandungi alel REF, di sini ditakrifkan sebagai alel utama, di setiap tapak) daripada dicetak.

    --supress_MUTATION (PILIHAN): menghalang data //MUTATION daripada dicetak.

    --verbose (PILIHAN): beritahu Trevolver untuk melaporkan SEMUA yang berlaku. Tidak disyorkan kecuali untuk tujuan pembangunan dan penyahpepijatan.

    Contoh fail input dan output tersedia dalam direktori EXAMPLE_INPUT dan EXAMPLE_OUTPUT di halaman GitHub ini, di mana contoh yang boleh dihasilkan bernombor (cth., output_example1.txt). Apabila benih rawak belum ditentukan, hasil yang tepat boleh dihasilkan semula dengan menggunakan benih nombor rawak yang sama yang dilaporkan dalam fail output yang terdapat dalam EXAMPLE_OUTPUT . Ambil perhatian bahawa, jika fail input anda (s) (cth., tree_6taxa.txt) tiada dalam direktori kerja (i.e., di mana Terminal anda sedang beroperasi), anda perlu menentukan laluan penuh nama fail (cth., /Users/ohta/Desktop/trevolver_practice/tree_6taxa.txt). Juga ambil perhatian bahawa, dalam contoh di bawah, a digunakan semata-mata untuk meneruskan arahan sebelumnya pada baris.

    CONTOH 1: SIMULASI MUDAH

    CONTOH 2: SIMULASI MUDAH DENGAN 1,000 GENERASI BUR-IN

    CONTOH 3: PENGGUNAAN TYPICAL (program memutuskan benih rawak bukan verbose)

    CONTOH 4: SIMULASI DENGAN DUA KUMPULAN KELUAR

    CONTOH 5: EVOLVE SATU URUTAN UNTUK 1 JUTA GENERASI

    Untuk mensimulasikan evolusi satu jujukan, sediakan pokok dengan hanya satu takson dan panjang cawangan. Sebagai contoh, untuk mensimulasikan evolusi satu jujukan bernama "my_creature" selama 1 juta generasi, fail pokok akan mengandungi, secara ringkasnya, (my_creature:1000000) . Sediakan faktor penskalaan ( --branch_unit ) daripada 1, dan anda boleh pergi:

    CONTOH 6: BANYAK PILIHAN YANG DIGUNAKAN

    CONTOH 7: PILIHAN MINIMUM DENGAN OUTPUT KE SKRIN

    Ini secara automatik akan menjana fail VCF bernama tree_7taxa.vcf dalam direktori kerja.

    Bergantung pada pilihan yang ditentukan, Trevolver akan mengeluarkan data berikut:

    Permulaan output akan melaporkan:

    • COMMAND : bagaimana Trevolver dipanggil.
    • RANDOM_SEED : benih rawak yang digunakan.
    • INPT_SEQUENCE : jujukan nukleotida yang digunakan sebagai input.
    • SEED_SEQUENCE : jujukan nukleotida yang digunakan untuk menyemai simulasi. Jika tiada masa terbakar, ini adalah sama dengan INPT_SEQUENCE .
    • MRCA_SEQUENCE : jujukan nukleotida bagi kumpulan MRCA (nenek moyang yang paling terkini).
    • CONS_SEQUENCE : jujukan nukleotida konsensus bagi kumpulan pada penghujung simulasi (i.e., petua pokok).
    • POKOK : pokok tetap tempat simulasi berlaku.
    • MRCA_GENERATION : generasi (dari masa 0 pada akar) di mana nenek moyang biasa (MRCA) dalam kumpulan yang paling terkini tinggal.
    • MRCA_SUBTREE : subpokok yang mana MRCA ialah akarnya.
    • KUMPULAN KELUAR : nama kumpulan luar, jika berkenaan.
    • MRCA_NODE_ID : ID nod MRCA.
    • VCF_OUTPUT_FILE : nama fail output VCF.

    Selain itu, mengikuti ringkasan RINGKASAN KEPUTUSAN, bendera berikut menunjukkan bahagian berasingan bagi keluaran yang lebih terperinci:

    • //MUTASI : baris berikut mengandungi sejarah mutasi penuh dengan tiga lajur: takson, tapak dan mutasi. Data lajur mutasi adalah dalam format [generasi]-[alel nenek moyang]>[alel terbitan] . Contohnya, mutasi C>T yang berlaku pada generasi 1,988 akan disenaraikan sebagai 1988-C>T .
    • //TRACKED : baris berikut mengandungi kadar mutasi yang dijejaki dan/atau data motif dengan lima lajur: keturunan, penjanaan, kadar_mutasi, kiraan_mutasi dan kiraan_motif.

    Output Format Panggilan Varian (VCF) mematuhi format VCFv4.1, seperti yang digunakan oleh keluaran 1000 Genomes Project GRCh38/hg38, dengan beberapa pengecualian yang ketara. Untuk kemudahan dan kebolehulangan, pengepala metadata tambahan (baris bermula dengan ## ) digunakan untuk menunjukkan hujah yang digunakan sebagai Trevolver input, keputusan utama dan spesifikasi percubaan, termasuk yang diterangkan dalam Output Standard serta:

    • burn_in_mutation : jumlah bilangan mutasi semasa tempoh burn-in.
    • total_mutation : jumlah bilangan mutasi pada semua cabang (tidak termasuk burn-in).
    • tree_length : jumlah panjang cawangan (generasi).
    • panjang_percubaan : ketinggian pokok, i.e., panjang akar ke hujung (generasi). Pada masa ini diperlukan bahawa semua panjang akar ke hujung, diukur dalam generasi, adalah sama.
    • simulasi_masa : panjang larian (saat).

    Tajuk yang tidak berkaitan (cth., deskriptor varian nukleotida bukan tunggal) telah dialih keluar. Urutan input, benih, konsensus (dalam kumpulan) dan MRCA (dalam kumpulan) dicetak dalam metadata pengepala untuk kemudahan melainkan --suppress_input_seq , --suppress_seed_seq , --suppress_consensus_seq , atau --suppress_MRCA_seq dipanggil. Selain itu, banyak jenis data (banyak yang tidak dapat diketahui dalam analisis evolusi kehidupan sebenar) telah ditambahkan pada lajur INFO:

    • REF / REF_OG : alel konsensus (utama) bagi kumpulan dalam/kumpulan luar, yang mungkin sepadan atau tidak sepadan dengan AA (alel nenek moyang).
    • AA : alel nenek moyang seluruh pokok (alel jujukan benih).
    • MRCA : Alel Common Ancestor (MRCA) Terkini berkenaan dengan ingroup, jika --outgroups digunakan.
    • MUTATIONS / MUTATIONS_OG : semua mutasi unik yang telah berlaku di tapak ini, cth., G>A . Mutasi berbilang dipisahkan koma (cth., G>A,A>G ) dalam susunan kronologi, untuk kemudahan dalam analisis hiliran. Jika kumpulan keluar atau taksa terkecuali ditentukan, MUTATIONS merujuk kepada kumpulan dalam sahaja, manakala MUTATIONS_OG merujuk kepada kumpulan keluar sahaja.
    • GENERATIONS / GENERATIONS_OG : masa (generasi) di mana mutasi unik berlaku, dipisahkan koma dalam susunan yang sama (kronologi). Jika kumpulan keluar atau taksa terkecuali ditentukan, GENERATIONS merujuk kepada kumpulan dalam sahaja, manakala GENERATIONS_OG merujuk kepada kumpulan keluar sahaja.
    • TAXA / TAXA_OG : bilangan taksa yang berkongsi mutasi unik, dipisahkan koma dalam susunan yang sama (kronologi). Jika kumpulan keluar atau cukai terkecuali ditentukan, TAXA merujuk kepada kumpulan dalam sahaja, manakala TAXA_OG merujuk kepada kumpulan luar sahaja.
    • ARBITRARY_REF : bendera yang menunjukkan terdapat seri untuk alel utama/konsensus/paling biasa di tapak ini. Jika kekerapan alel tertinggi dikongsi oleh dua alel, yang didahulukan mengikut abjad dilaporkan.
    • MULTIHIT / MULTIH_OG : bendera yang menunjukkan tapak telah mengalami lebih daripada satu mutasi, sama ada dalam keturunan yang sama atau berbeza, dalam kumpulan dalam/luar.
    • MULTIALLELIC / MULTIA_OG : bendera yang menunjukkan tapak mempunyai berbilang alel kecil (bukan rujukan) (i.e., >2 alel) dalam kumpulan dalam/kumpulan luar. Semua tapak multiallelic adalah multihit, tetapi sebaliknya tidak benar.
    • BACK_MUTATION / BACK_M_OG : bendera yang menunjukkan tapak telah mengalami mutasi belakang, kembali ke keadaan/alel sebelumnya, dalam kumpulan dalam/luar. Semua tapak dengan mutasi belakang telah mengalami berbilang hits, tetapi sebaliknya adalah tidak benar.
    • RECURRENT_MUTATION / RECURRENT_M_OG : bendera yang menunjukkan tapak telah mengalami mutasi berulang, iaitu, perubahan yang sama berlaku berbilang kali secara berasingan, dalam kumpulan dalam/luar.
    • INVARIANT_ANCESTRAL : bendera yang menunjukkan tapak tidak mempunyai polimorfisme dalam daun kumpulan (taksa yang masih ada), dan keadaan tetap sepadan dengan alel nenek moyang (AA). Oleh itu, walaupun mutasi berlaku dalam sejarah tapak, alel yang diperolehi telah hilang melalui mutasi belakang.
    • INVARIANT_DERIVED : bendera yang menunjukkan tapak tidak mempunyai polimorfisme dalam daun kumpulan (taksa yang masih ada), dan keadaan tetap sepadan dengan alel terbitan yang terhasil daripada mutasi. Ini menunjukkan bahawa semua jujukan dalam kumpulan yang masih ada adalah turunan daripada moyang yang bermutasi.
    • NO_ANCESTRAL : bendera yang menunjukkan bahawa tiada alel nenek moyang (benih) kekal dalam individu yang masih ada dalam kumpulan. Ambil perhatian bahawa ini serasi dengan kehadiran polimorfisme, selagi tiada alel sepadan dengan alel nenek moyang.
    • REF_OG : alel konsensus (utama) kumpulan luar, yang mungkin sepadan atau mungkin tidak sepadan dengan AA.
    • REF_OG_COUNT : kiraan alel kumpulan luar yang sepadan dengan konsensus kumpulan luar.
    • REF_OG_AF : kekerapan alel kumpulan luar sepadan dengan konsensus kumpulan luar.
    • ALLELES_OG : senarai dipisahkan koma bagi semua alel yang terdapat dalam kumpulan luar.
    • ALLELE_COUNTS_OG : senarai semua kiraan alel yang dipisahkan koma untuk alel yang terdapat dalam kumpulan luar, dalam susunan yang sama seperti ALLELES_OG .
    • OG_FIXED : bendera yang menunjukkan tapak ditetapkan untuk satu alel (i.e., tidak mempunyai variasi) dalam kumpulan luar. Ini akan menjadi benar mengikut takrifan jika terdapat hanya kumpulan luar. Ambil perhatian bahawa kekerapan alel kumpulan luar boleh diambil daripada data ALLELE_COUNTS_OG.
    • OG_DIVERGED : bendera yang menunjukkan satu atau lebih alel kumpulan luar berbeza daripada satu atau lebih alel dalam kumpulan. Kumpulan luar mungkin terpesong daripada kumpulan dalam tetapi tidak tetap.
    • OG_SHARE : bendera yang menunjukkan satu atau lebih alel kumpulan luar perlawanan satu atau lebih alel dalam kumpulan. Kumpulan luar mungkin berkongsi alel dengan kumpulan dalam tetapi tidak diperbaiki.

    Jika anda mempunyai soalan tentang Trevolver, sila klik pada tab Isu di bahagian atas halaman ini dan mulakan urutan baharu, supaya orang lain boleh mendapat manfaat daripada perbincangan. Soalan lazim akan dibincangkan dalam bahagian ini.

    Trevolver telah ditulis dengan sokongan daripada Gerstner Scholars Fellowship dari Yayasan Keluarga Gerstner di Muzium Sejarah Alam Amerika kepada C.W.N. (2016-2019), dan dikekalkan dengan sokongan daripada 中央研究院 Academia Sinica Postdoctoral Research Fellowship (2019-2021). Imej logo itu direka oleh Mitch Lin (2019) heliks DNA bebas hak cipta yang diperoleh daripada Pixabay. Terima kasih kepada Reed A. Cartwright, Michael Dean, Dan Graur, Ming-Hsueh Lin, Lisa Mirabello, Sergios Orestis-Kolokotronis, Michael Tessler dan Meredith Yeager untuk perbincangan.

    Apabila menggunakan perisian ini, sila rujuk dan petik:

    Nelson CW, Fu Y, Li W-H. Trevolver: mensimulasikan evolusi jujukan DNA tidak boleh balik dalam konteks trinukleotida pada pokok bercabang. bioRxiv doi: https://doi.org/10.1101/672717

    Jika anda mempunyai soalan tentang Trevolver, sila klik pada tab Isu di bahagian atas halaman ini dan mulakan urutan baharu, supaya orang lain boleh mendapat manfaat daripada perbincangan.

    Surat-menyurat lain hendaklah dialamatkan kepada Chase W. Nelson:

    • Haller BC, Messer PW. 2019. SLiM 3: simulasi genetik ke hadapan di luar model Wright-Fisher. Biologi Molekul dan Evolusi36:632–637.
    • Hudson RR. 2002. Menjana sampel di bawah model neutral variasi genetik Wright-Fisher. Bioinformatik18:337–338.
    • Yang Z. 2014. Evolusi Molekul: Satu Pendekatan Statistik. New York, NY: Oxford University Press.


    Tonton video: Bab 1 Tingkatan 2: Pola u0026 Jujukan (November 2022).