kľúčový rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií je to podobnosť je podobnosť (podobnosť) medzi dvoma sekvenciami v porovnaní, zatiaľ čo identita je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami.
Bioinformatika je interdisciplinárna oblasť vedy, ktorá sa týka najmä molekulárnej biológie a genetiky, informatiky, matematiky a štatistiky. Zarovnanie sekvencií je hlavným výrazom v bioinformatike. Je to postup, v ktorom sú sekvencie DNA, RNA alebo proteínu usporiadané tak, aby identifikovali oblasti podobnosti, ktoré sú dôsledkom funkčného, štrukturálneho alebo vývojového vzťahu medzi sekvenciami. Na konci zarovnania sa zobrazia ako riadky v matici. Aby sa zarovnali rovnaké znaky v následných kolónoch, sú medzi zvyškami vložené medzery.
1. Prehľad a kľúčový rozdiel
2. Aká je podobnosť v postupnosti sekvencií
3. Čo je identita v sekvenčnom zarovnaní
4. Podobnosti medzi podobnosťou a identitou pri postupnom zarovnávaní
5. Porovnanie vedľa seba - podobnosť verzus identita v sekvenčnom zarovnaní v tabuľkovej forme
6. Zhrnutie
Podobnosť v usporiadaní sekvencií je podobnosťou medzi dvoma sekvenciami pri porovnaní. Táto skutočnosť závisí od identity sekvencií. Podobnosť ukazuje, do akej miery sú zvyšky zarovnané. Preto podobné sekvencie obsahujú podobné vlastnosti. V bioinformatike je podobnosť nástrojom na posúdenie podobnosti medzi dvoma proteínmi.
Obrázok 01: Podobnosť v usporiadaní sekvencií
Proces zoradenia sekvencií sú dva hlavné kroky. Prvým krokom je párové zarovnanie, ktoré pomáha nájsť optimálne zarovnanie medzi dvoma sekvenciami (vrátane medzier) pomocou algoritmov ako BLAST, FastA a LALIGN. Algoritmus párovania nájde minimálny počet operácií úprav; in-dely a substitúcie, aby sa jedna sekvencia zarovnala s druhou sekvenciou. Po párovom zarovnaní je potrebné získať dva kvantitatívne parametre z každého párového porovnania. Sú to identita a podobnosť.
Identita pri zarovnávaní sekvencií je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Pri posudzovaní identity sa preto medzery nezapočítavajú. Meranie sa považuje za vzťah k kratšej sekvencii medzi dvoma sekvenciami. Výrazne to znamená, že má účinok, keď sekvenčná identita nie je tranzitívna. Ak X = Y a Y = Z, potom X sa nemusí nevyhnutne rovnať Z. Toto sa odvodí z hľadiska miery identity.
Obrázok 02: Identita v usporiadaní sekvencií
Napríklad X má sekvenciu AAGGCTT, Y má sekvenciu AAGGC a Z má sekvenciu AAGGCAT. Identita medzi X a Y je 100% 5 identických nukleotidov / min [dĺžka (X), dĺžka (Y)]. Identita medzi Y a Z je tiež 100%. Identita medzi X a Z je však iba 85% (6 identických nukleotidov / 7).
Podobnosť pri zarovnávaní povie podobnosť medzi dvoma sekvenciami pri porovnaní, zatiaľ čo identita pri porovnávaní sekvencií povie množstvo znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Preto je to kľúčový rozdiel medzi podobnosťou a identitou pri porovnávaní sekvencií.
Zarovnanie sekvencií pomáha identifikovať oblasti podobnosti v DNA, RNA alebo proteíne, ktoré sú výsledkom funkčného, štrukturálneho alebo vývojového vzťahu medzi sekvenciami. Podobnosť a identita sú teda dva kľúčové pojmy v kontexte zoradenia sekvencií. Kľúčový rozdiel medzi týmito dvoma pojmami je, že podobnosť je podobnosť medzi dvoma sekvenciami v porovnaní, zatiaľ čo identita je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Toto je zhrnutie rozdielu medzi podobnosťou a identitou v sekvenčnom zarovnaní.
1. „Identita a podobnosť - kvantitatívne opatrenie.“ Identita a podobnosť - kvantitatívne opatrenie, dostupné tu.
2. „Poradie sekvencií“. Sequence Alignment - Bioinformatics.Org Wiki, dostupné tu.
1. „Fylogénia založená na zarovnávaní a zarovnávaní“ Kolekar Pandurang - vlastná práca (CC BY 3.0) prostredníctvom Commons Wikimedia
2. „Vzorový výstup BLAST“ od Fdardela - Vlastné dielo (CC BY-SA 3.0) prostredníctvom Commons Wikimedia