Den viktigaste skillnaden mellan likhet och identitet i sekvensanpassning är att likhet är likheten (likheten) mellan två sekvenser i jämförelse medan identitet är antalet tecken som matchar exakt mellan två olika sekvenser.
Bioinformatik är ett tvärvetenskapligt vetenskapsområde som huvudsakligen involverar molekylärbiologi och genetik, datavetenskap, matematik och statistik. Sekvensanpassning är en viktig term inom bioinformatik. Det är förfarandet i vilket sekvenserna av DNA, RNA eller protein är arrangerade för att identifiera regioner av likhet som är en konsekvens av funktionellt, strukturellt eller evolutionärt förhållande mellan sekvenserna. I slutet av justeringen kommer de att presenteras som rader i en matris. För att justera de identiska tecknen i på varandra följande kolumner finns det infogade luckor mellan resterna.
Vad är likhet?
Likhet i sekvensanpassning är likheten mellan två sekvenser när de jämförs. Detta faktum är beroende av sekvensernas identitet. Likhet skildrar i vilken utsträckning resterna är inriktade. Följaktligen innehåller liknande sekvenser liknande egenskaper. Inom bioinformatik är likhet ett verktyg för att bedöma likheten mellan två proteiner.
Figur 01: Likhet i sekvensjustering
Det finns två huvudsteg för sekvensjusteringsprocessen. Det första steget är parvis anpassning, vilket hjälper till att hitta den optimala anpassningen mellan två sekvenser (inklusive luckor) med hjälp av algoritmer som BLAST, FastA och LALIGN. Matchningsalgoritmen hittar det minsta antalet redigeringsoperationer; in-dels och substitutioner för att anpassa en sekvens till den andra sekvensen. Efter parvis anpassning är det nödvändigt att erhålla två kvantitativa parametrar från varje parvis jämförelse. De är identitet och likhet.
Vad är identitet?
Identitet i sekvensjustering är antalet tecken som matchar exakt mellan två olika sekvenser. Därför räknas inte luckor vid bedömning av identitet. Mätningen anses vara relaterad till den kortare sekvensen bland de två sekvenserna. Det antyder väsentligt att det har effekten där sekvensidentiteten inte är transitiv. Om X=Y och Y=Z, så är X inte nödvändigtvis lika med Z. Detta härleds i termer av identitetsavståndsmåttet.
Figur 02: Identitet i sekvensjustering
Till exempel har X sekvensen AAGGCTT, Y har sekvensen AAGGC och Z har sekvensen AAGGCAT. Identiteten mellan X och Y är 100 % {5 identiska nukleotider/min[längd(X), längd(Y)]}. Identiteten mellan Y och Z är också 100 %. Men identiteten mellan X och Z är bara 85 % {(6 identiska nukleotider / 7)}.
Vilka är likheterna mellan likhet och identitet i sekvensanpassning?
- Både likhet och identitet är två termer vi använder i sekvensanpassning.
- De hänvisar också till likheten mellan de två sekvenserna.
- Dessutom uttrycker vi dem som ett procentuellt värde.
Vad är skillnaden mellan likhet och identitet i sekvensanpassning?
Similarity in alignment berättar likheten mellan två sekvenser när de jämförs medan identitet i sekvensalignment berättar hur många tecken som matchar exakt mellan två olika sekvenser. Därför är detta den viktigaste skillnaden mellan likhet och identitet i sekvensanpassning.
Sammanfattning – Likhet vs identitet i sekvensanpassning
Sekvensanpassning hjälper till att identifiera regioner av likhet i DNA, RNA eller protein som är resultatet på grund av funktionellt, strukturellt eller evolutionärt förhållande mellan sekvenserna. Därför är likhet och identitet två nyckeltermer i samband med sekvensanpassning. Den viktigaste skillnaden mellan dessa två termer är att likhet är likheten mellan två sekvenser i jämförelse medan identitet är antalet tecken som matchar exakt mellan två olika sekvenser. Detta är alltså sammanfattningen av skillnaden mellan likhet och identitet i sekvensanpassning.