Rozdiel medzi podobnosťou a identitou v usporiadaní sekvencií

kľúčový rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií je to podobnosť je podobnosť (podobnosť) medzi dvoma sekvenciami v porovnaní, zatiaľ čo identita je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami.

Bioinformatika je interdisciplinárna oblasť vedy, ktorá sa týka najmä molekulárnej biológie a genetiky, informatiky, matematiky a štatistiky. Zarovnanie sekvencií je hlavným výrazom v bioinformatike. Je to postup, v ktorom sú sekvencie DNA, RNA alebo proteínu usporiadané tak, aby identifikovali oblasti podobnosti, ktoré sú dôsledkom funkčného, ​​štrukturálneho alebo vývojového vzťahu medzi sekvenciami. Na konci zarovnania sa zobrazia ako riadky v matici. Aby sa zarovnali rovnaké znaky v následných kolónoch, sú medzi zvyškami vložené medzery.

OBSAH

1. Prehľad a kľúčový rozdiel
2. Aká je podobnosť v postupnosti sekvencií
3. Čo je identita v sekvenčnom zarovnaní
4. Podobnosti medzi podobnosťou a identitou pri postupnom zarovnávaní
5. Porovnanie vedľa seba - podobnosť verzus identita v sekvenčnom zarovnaní v tabuľkovej forme
6. Zhrnutie

Čo je podobnosť?

Podobnosť v usporiadaní sekvencií je podobnosťou medzi dvoma sekvenciami pri porovnaní. Táto skutočnosť závisí od identity sekvencií. Podobnosť ukazuje, do akej miery sú zvyšky zarovnané. Preto podobné sekvencie obsahujú podobné vlastnosti. V bioinformatike je podobnosť nástrojom na posúdenie podobnosti medzi dvoma proteínmi.

Obrázok 01: Podobnosť v usporiadaní sekvencií

Proces zoradenia sekvencií sú dva hlavné kroky. Prvým krokom je párové zarovnanie, ktoré pomáha nájsť optimálne zarovnanie medzi dvoma sekvenciami (vrátane medzier) pomocou algoritmov ako BLAST, FastA a LALIGN. Algoritmus párovania nájde minimálny počet operácií úprav; in-dely a substitúcie, aby sa jedna sekvencia zarovnala s druhou sekvenciou. Po párovom zarovnaní je potrebné získať dva kvantitatívne parametre z každého párového porovnania. Sú to identita a podobnosť.

Čo je to identita?

Identita pri zarovnávaní sekvencií je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Pri posudzovaní identity sa preto medzery nezapočítavajú. Meranie sa považuje za vzťah k kratšej sekvencii medzi dvoma sekvenciami. Výrazne to znamená, že má účinok, keď sekvenčná identita nie je tranzitívna. Ak X = Y a Y = Z, potom X sa nemusí nevyhnutne rovnať Z. Toto sa odvodí z hľadiska miery identity.

Obrázok 02: Identita v usporiadaní sekvencií

Napríklad X má sekvenciu AAGGCTT, Y má sekvenciu AAGGC a Z má sekvenciu AAGGCAT. Identita medzi X a Y je 100% 5 identických nukleotidov / min [dĺžka (X), dĺžka (Y)]. Identita medzi Y a Z je tiež 100%. Identita medzi X a Z je však iba 85% (6 identických nukleotidov / 7).

Aké sú podobnosti medzi podobnosťou a identitou pri postupnom zarovnávaní?

  • Podobnosť aj identita sú dva pojmy, ktoré používame pri postupnom zarovnávaní.
  • Poukazujú tiež na podobnosť medzi týmito dvoma sekvenciami.
  • Ďalej ich vyjadrujeme ako percentuálnu hodnotu.

Aký je rozdiel medzi podobnosťou a identitou v usporiadaní sekvencií?

Podobnosť pri zarovnávaní povie podobnosť medzi dvoma sekvenciami pri porovnaní, zatiaľ čo identita pri porovnávaní sekvencií povie množstvo znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Preto je to kľúčový rozdiel medzi podobnosťou a identitou pri porovnávaní sekvencií.

Zhrnutie - podobnosť verzus identita v postupnosti

Zarovnanie sekvencií pomáha identifikovať oblasti podobnosti v DNA, RNA alebo proteíne, ktoré sú výsledkom funkčného, ​​štrukturálneho alebo vývojového vzťahu medzi sekvenciami. Podobnosť a identita sú teda dva kľúčové pojmy v kontexte zoradenia sekvencií. Kľúčový rozdiel medzi týmito dvoma pojmami je, že podobnosť je podobnosť medzi dvoma sekvenciami v porovnaní, zatiaľ čo identita je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Toto je zhrnutie rozdielu medzi podobnosťou a identitou v sekvenčnom zarovnaní.

referencie:

1. „Identita a podobnosť - kvantitatívne opatrenie.“ Identita a podobnosť - kvantitatívne opatrenie, dostupné tu.
2. „Poradie sekvencií“. Sequence Alignment - Bioinformatics.Org Wiki, dostupné tu.

S láskavým dovolením:

1. „Fylogénia založená na zarovnávaní a zarovnávaní“ Kolekar Pandurang - vlastná práca (CC BY 3.0) prostredníctvom Commons Wikimedia
2. „Vzorový výstup BLAST“ od Fdardela - Vlastné dielo (CC BY-SA 3.0) prostredníctvom Commons Wikimedia