FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4271, 1137 aa
1>>>pF1KE4271 1137 - 1137 aa - 1137 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.6200+/-0.00107; mu= 9.2120+/- 0.066
mean_var=177.9129+/-35.929, 0's: 0 Z-trim(109.8): 10 B-trim: 6 in 1/52
Lambda= 0.096155
statistics sampled from 11152 (11162) to 11152 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.343), width: 16
Scan time: 4.630
The best scores are: opt bits E(32554)
CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137) 7323 1028.8 0
CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 ( 868) 778 120.8 1.3e-26
CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 ( 934) 778 120.9 1.4e-26
CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 ( 936) 611 97.7 1.3e-19
CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058) 599 96.1 4.7e-19
CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230) 599 96.1 5.4e-19
CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360) 599 96.1 5.8e-19
CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 ( 834) 587 94.3 1.2e-18
CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 ( 822) 575 92.7 3.9e-18
CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 ( 835) 575 92.7 3.9e-18
>>CCDS34195.1 MSH3 gene_id:4437|Hs108|chr5 (1137 aa)
initn: 7323 init1: 7323 opt: 7323 Z-score: 5496.1 bits: 1028.8 E(32554): 0
Smith-Waterman score: 7323; 99.7% identity (100.0% similar) in 1137 aa overlap (1-1137:1-1137)
10 20 30 40 50 60
pF1KE4 MSRRKPASGGLAASSSAPARQAVLSRFFQSTGSLKSTSSSTGAADQVDPGAAAAAAAAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MSRRKPASGGLAASSSAPARQAVLSRFFQSTGSLKSTSSSTGAADQVDPGAAAAAAAAAA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 AAPPAPPAPAFPPQLPPHVATEIDRRKKRPLENDGPVKKKVKKVQQKEGGSDLGMSGNSE
::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::
CCDS34 AAPPAPPAPAFPPQLPPHIATEIDRRKKRPLENDGPVKKKVKKVQQKEGGSDLGMSGNSE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 PKKCLRTRNVSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLPKCTDFDDISLLHAKNA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 PKKCLRTRNVSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLPKCTDFDDISLLHAKNA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 VSSEDSKRQINQKDTTLFDLSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VSSEDSKRQINQKDTTLFDLSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 QQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 GYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTLIGEDVNPLIKLDDAVNVDEIM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTLIGEDVNPLIKLDDAVNVDEIM
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 TDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 LQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYAKDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYAKDT
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 VDIKGSQIISGIVNLEKPVICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKMEFMTINGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VDIKGSQIISGIVNLEKPVICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKMEFMTINGT
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 TLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 LHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKSEFQAIIPAVN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKSEFQAIIPAVN
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE4 SHIQSDLLRTVILEIPELLSPVEHYLKILNEQAAKVGDKTELFKDLSDFPLIKKRKDEIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 SHIQSDLLRTVILEIPELLSPVEHYLKILNEQAAKVGDKTELFKDLSDFPLIKKRKDEIQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE4 GVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRF
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE4 HSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 HSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE4 AKQGDYCRPTVQEERKIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 AKQGDYCRPTVQEERKIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMG
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE4 GKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTA
::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::
CCDS34 GKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGQSTFMEELTDTA
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE4 EIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKN
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE4 YSHQVGNYHMGFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPG
::::::::::::::::::::::::.:::::::::::::::::::::::::::::::::::
CCDS34 YSHQVGNYHMGFLVSEDESKLDPGAAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPG
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130
pF1KE4 EILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 EILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
1090 1100 1110 1120 1130
>>CCDS58709.1 MSH2 gene_id:4436|Hs108|chr2 (868 aa)
initn: 711 init1: 476 opt: 778 Z-score: 591.0 bits: 120.8 E(32554): 1.3e-26
Smith-Waterman score: 871; 28.0% identity (61.0% similar) in 735 aa overlap (388-1094:95-786)
360 370 380 390 400 410
pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
.:. :. .. . : :. . :.::.
CCDS58 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL
70 80 90 100 110 120
420 430 440 450 460 470
pF1KE4 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA
. .. : : .::.. .: . . . .. .: : . . . : . .: ....
CCDS58 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK
130 140 150 160 170 180
480 490 500 510 520 530
pF1KE4 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKM---
:: :. :... ..:. : . ::.:.::.:. .:: :: :.
CCDS58 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF
190 200 210 220 230
540 550 560 570 580 590
pF1KE4 -EFMTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI
..: .. ...: :...:... : . :: .:.. :: :.: ...:. :::. .:
CCDS58 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI
240 250 260 270 280 290
600 610 620 630 640 650
pF1KE4 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS
. ::. : ... :. ::..::..: .. .. . :. . . . . .: .
CCDS58 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN
300 310 320 330 340 350
660 670 680 690 700
pF1KE4 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK----
.::. ..: :. :: . . . .: : .. .... . .: .. : :
CCDS58 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD
360 370 380 390 400
710 720 730 740 750
pF1KE4 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE
.::.. ... . ..:. .:. : . :. ..: . :::. :: . .. . .
CCDS58 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN
410 420 430 440 450 460
760 770 780 790 800 810
pF1KE4 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS
:: .. : . :: ..: .: .. . ..: . .. .. .: : ... .
CCDS58 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV
470 480 490 500 510 520
820 830 840 850 860 870
pF1KE4 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL
: ...: . :: .: . :.:.:.. . : ::.. : . .:..: .:: ..:
CCDS58 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV--
530 540 550 560 570
880 890 900 910 920
pF1KE4 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI
::. ..::.. . .:.. :::::::::::.::.:...:..::::: .:: : : .
CCDS58 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV
580 590 600 610 620 630
930 940 950 960 970 980
pF1KE4 GIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI
.::: :..:.::.:. :: :::: :. .:: :.:.::..::.:.:::::::::.::...
CCDS58 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL
640 650 660 670 680 690
990 1000 1010 1020 1030 1040
pF1KE4 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQV
:.: ::. . .. .:.::. . : : :.: :. :..:.
CCDS58 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET-----------
700 710 720 730 740
1050 1060 1070 1080 1090 1100
pF1KE4 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK
.:.:::. .:. .:.:..::.::. : .... : .:. :::
CCDS58 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME
750 760 770 780 790 800
1110 1120 1130
pF1KE4 LWTMHNAQDLQKWTEEFNMEETQTSLLH
CCDS58 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII
810 820 830 840 850 860
>>CCDS1834.1 MSH2 gene_id:4436|Hs108|chr2 (934 aa)
initn: 747 init1: 476 opt: 778 Z-score: 590.5 bits: 120.9 E(32554): 1.4e-26
Smith-Waterman score: 871; 28.0% identity (61.0% similar) in 735 aa overlap (388-1094:161-852)
360 370 380 390 400 410
pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
.:. :. .. . : :. . :.::.
CCDS18 FEDILFGNNDMSASIGVVGVKMSAVDGQRQVGVGYVDSIQRKLGLCEFPDNDQFSNLEAL
140 150 160 170 180 190
420 430 440 450 460 470
pF1KE4 MSSLQPVELLLPSALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTEFYA
. .. : : .::.. .: . . . .. .: : . . . : . .: ....
CCDS18 LIQIGPKECVLPGG---ETAGDMGKLRQI-IQRGGILITERKKADFSTKDIYQDLNRLLK
200 210 220 230 240
480 490 500 510 520 530
pF1KE4 KDTVDIKGSQIISGIV-NLEKPV-ICSLAAIIKYLKEFNLEKMLSKPENFKQLSSKM---
:: :. :... ..:. : . ::.:.::.:. .:: :: :.
CCDS18 GK----KGEQMNSAVLPEMENQVAVSSLSAVIKFLE------LLSDDSNFGQFELTTFDF
250 260 270 280 290
540 550 560 570 580 590
pF1KE4 -EFMTINGTTLRNLEILQNQT-DMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREI
..: .. ...: :...:... : . :: .:.. :: :.: ...:. :::. .:
CCDS18 SQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCKTPQGQRLVNQWIKQPLMDKNRI
300 310 320 330 340 350
600 610 620 630 640 650
pF1KE4 NARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYHKKCSTQEFFLIVKTLYHLKS
. ::. : ... :. ::..::..: .. .. . :. . . . . .: .
CCDS18 EERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAKKFQRQAANLQDCYRLYQGINQLPN
360 370 380 390 400 410
660 670 680 690 700
pF1KE4 EFQAIIPAVNSHIQSDLLRTVILEIPELLSPVEHYLKILNE--QAAKVGDKTELFK----
.::. ..: :. :: . . . .: : .. .... . .: .. : :
CCDS18 VIQALEKHEGKH-QKLLLAVFVTPLTDLRSDFSKFQEMIETTLDMDQVENHEFLVKPSFD
420 430 440 450 460 470
710 720 730 740 750
pF1KE4 -DLSDF-PLIKKRKDEIQG-VIDEIR-MHLQEIRKILKNPSAQY-----VTVSGQEFMIE
.::.. ... . ..:. .:. : . :. ..: . :::. :: . .. . .
CCDS18 PNLSELREIMNDLEKKMQSTLISAARDLGLDPGKQIKLDSSAQFGYYFRVTCKEEKVLRN
480 490 500 510 520 530
760 770 780 790 800 810
pF1KE4 IKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLVLDCSAEWLDFLEKFS
:: .. : . :: ..: .: .. . ..: . .. .. .: : ... .
CCDS18 NKNFSTVDIQKNGVKFTNSKLTS-LNEEY-TKNKTEYEEAQDAIV----KEIVNISSGYV
540 550 560 570 580
820 830 840 850 860 870
pF1KE4 EHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTVQE--ERKIVIKNGRHPVIDVLL
: ...: . :: .: . :.:.:.. . : ::.. : . .:..: .:: ..:
CCDS18 EPMQTLNDV---LAQLDAVVSFAHVSNGAPVPYVRPAILEKGQGRIILKASRHACVEV--
590 600 610 620 630 640
880 890 900 910 920
pF1KE4 GEQDQ--YVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATI
::. ..::.. . .:.. :::::::::::.::.:...:..::::: .:: : : .
CCDS18 --QDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQTGVIVLMAQIGCFVPCESAEV
650 660 670 680 690 700
930 940 950 960 970 980
pF1KE4 GIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAI
.::: :..:.::.:. :: :::: :. .:: :.:.::..::.:.:::::::::.::...
CCDS18 SIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSATKDSLIIIDELGRGTSTYDGFGL
710 720 730 740 750 760
990 1000 1010 1020 1030 1040
pF1KE4 AYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQV
:.: ::. . .. .:.::. . : : :.: :. :..:.
CCDS18 AWAISEYIATKIGAFCMFATHFHELTALA-NQIPTVNNLHVTALTTEET-----------
770 780 790 800 810
1050 1060 1070 1080 1090 1100
pF1KE4 PDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAK
.:.:::. .:. .:.:..::.::. : .... : .:. :::
CCDS18 ---LTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQYIGESQGYDIME
820 830 840 850 860
1110 1120 1130
pF1KE4 LWTMHNAQDLQKWTEEFNMEETQTSLLH
CCDS18 PAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAEVIAKNNSFVNEII
870 880 890 900 910 920
>>CCDS670.1 MSH4 gene_id:4438|Hs108|chr1 (936 aa)
initn: 619 init1: 384 opt: 611 Z-score: 465.3 bits: 97.7 E(32554): 1.3e-19
Smith-Waterman score: 869; 26.5% identity (63.9% similar) in 739 aa overlap (388-1093:171-868)
360 370 380 390 400 410
pF1KE4 EIMTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETR
::..... . ......: :... ... :.
CCDS67 YSASSSSAISAHSPSVIVAVVEGRGLARGEIGMASIDLKNPQIILSQFADNTTYAKVITK
150 160 170 180 190 200
420 430 440 450 460 470
pF1KE4 MSSLQPVELLLPS---ALSEQTEALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE
.. :.:.:... . :....:. . : .. . . .. ::. ..... . .
CCDS67 LKILSPLEIIMSNTACAVGNSTKLF----TLITENFKNVNFTTIQRKYFNETKGLEYIEQ
210 220 230 240 250
480 490 500 510 520 530
pF1KE4 FYAKDTVDIKGSQIISGIVNLEKPVIC--SLAAIIKYLKEFNLEKMLSKPENFKQ-LSSK
. . . ...... : ..::..::. :: ... . :...: ....
CCDS67 LCIAEFSTV--------LMEVQSKYYCLAAVAALLKYV-EF-IQNSVYAPKSLKICFQGS
260 270 280 290 300
540 550 560 570 580 590
pF1KE4 MEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREIN
. :.... .:::.: :. :.... .:. ::..::: : :.:.. . .::. .. ::
CCDS67 EQTAMIDSSSAQNLELLINNQDYRNNHTLFGVLNYTKTPGGSRRLRSNILEPLVDIETIN
310 320 330 340 350 360
600 610 620 630 640
pF1KE4 ARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEFFLIVKTLYHLK
::: :.:.:..: :: ... . .. : :. : . . :. ... . .: .::
CCDS67 MRLDCVQELLQDEELFFG-LQSVISRFLDTEQLLSVLVQIPKQDTVNAAESKITNLIYLK
370 380 390 400 410 420
650 660 670 680 690
pF1KE4 SEFQAIIP--AVNSHIQSDLLRT-----------VILE-IPELLSPVEHYLK-ILNEQAA
.. . : . .. .. :::. .::: : ... .:.: :: ..
CCDS67 HTLELVDPLKIAMKNCNTPLLRAYYGSLEDKRFGIILEKIKTVINDDARYMKGCLNMRTQ
430 440 450 460 470 480
700 710 720 730 740 750
pF1KE4 KVGDKTELFKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQEFMI
: . .....: : .: ..:.: .... . . : . :.. :.:
CCDS67 KC---YAVRSNINEFLDIARR--TYTEIVDDIAGMISQLGEKYSLPLRTSFS-SARGFFI
490 500 510 520 530
760 770 780 790 800
pF1KE4 EIKNSAVSC----IPTDWVKVGSTKAVSRFHSPFIVE-NYRHLNQLRE----QLVLDCSA
.. .. .. .:....:....: : : ... : : ..::: .. :.
CCDS67 QMTTDCIALPSDQLPSEFIKISKVKNSYSFTSADLIKMNERCQESLREIYHMTYMIVCK-
540 550 560 570 580 590
810 820 830 840 850 860
pF1KE4 EWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGDYCRPTVQEERKIVIKNGRHP
.: .. :: : : : .. .: ..:.:.. .:: :: . ..::.: ::
CCDS67 ----LLSEIYEHIHCLYKLSDTVSMLDMLLSFAHACTLSDYVRPEFTD--TLAIKQGWHP
600 610 620 630 640 650
870 880 890 900 910 920
pF1KE4 VIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALITIMAQIGSYVPAE
... . .:. . ::: ..: :. .:::::::.:::.:.::.:: ::::::::::::
CCDS67 ILEKISAEKP--IANNTYVTEGSN-FLIITGPNMSGKSTYLKQIALCQIMAQIGSYVPAE
660 670 680 690 700
930 940 950 960 970 980
pF1KE4 EATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVILDELGRGTSTHD
... :. ::::... :.: . ::::.:. . : :...:...::...:::::::.:..
CCDS67 YSSFRIAKQIFTRISTDDDIETNSSTFMKEMKEIAYILHNANDKSLILIDELGRGTNTEE
710 720 730 740 750 760
990 1000 1010 1020 1030 1040
pF1KE4 GIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGFLVSEDESKLDPGT
::.: ::. ::.. ..:..:::.::. .:... : . : :.: : :.. ..
CCDS67 GIGICYAVCEYLL-SLKAFTLFATHFLELCHIDALYPN-VENMH--FEVQHVKN------
770 780 790 800 810
1050 1060 1070 1080 1090 1100
pF1KE4 AEQVPDFVTFLYQITRGIAA-RSYGLNVAKLADVPGEILKKAAHKSKELEGLINTKRKRL
. . . . . :....:.. ..:::..:.....: :. : . . ..
CCDS67 TSRNKEAILYTYKLSKGLTEEKNYGLKAAEVSSLPPSIVLDAKEITTQITRQILQNQRST
820 830 840 850 860 870
1110 1120 1130
pF1KE4 KYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
CCDS67 PEMERQRAVYHLATRLVQTARNSQLDPDSLRIYLSNLKKKYKEDFPRTEQVPEKTEE
880 890 900 910 920 930
>>CCDS62907.1 MSH6 gene_id:2956|Hs108|chr2 (1058 aa)
initn: 814 init1: 425 opt: 599 Z-score: 455.5 bits: 96.1 E(32554): 4.7e-19
Smith-Waterman score: 1047; 27.8% identity (61.1% similar) in 960 aa overlap (230-1101:105-1029)
200 210 220 230 240 250
pF1KE4 LSQFGSSNTSHENLQKTASKSANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFF
:: .. ..:.:. : :.: . : :...
CCDS62 KRRDEHRRRPDHPDFDASTLYVPEDFLNSCTPGMRKWWQIKSQNFDLVICYKVGKFYELY
80 90 100 110 120 130
260 270 280 290 300 310
pF1KE4 GEDAEIAARELNIYCHLDHNFMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIG
:: :.. ::.. . :. ...: . . :: :::::. :.:::: .
CCDS62 HMDALIGVSELGLV-FMKGNWAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---
140 150 160 170 180 190
320 330 340 350 360 370
pF1KE4 DNRSSLFSRKLTALYTKSTLIGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKEN
. : ::.. . . .. ... .: : .. .: : ... ..::: ..:..:.
CCDS62 EARC----RKMAHISKYDRVVRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEED
200 210 220 230 240
380 390 400 410 420 430
pF1KE4 VRDKKKGNIFIGIVGVQPATGEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQT
. .. :. :. . :. . .:.:. :...: .. ::..:. .. ::..:
CCDS62 SSGHTRA---YGVCFVDTSLGKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKET
250 260 270 280 290 300
440 450 460 470 480 490
pF1KE4 EALIHRATSVSVQDDRIRVERMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISG
..... . : :.:. : . ... :...... : : : : . . :...:
CCDS62 KTILKSSLSCSLQEGLIP----GSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKG
310 320 330 340 350
500 510 520
pF1KE4 I------VNL---EKP--VICSLAAIIKYLKEFNLEKMLSKPENFKQ-------------
. ..: :: .. .:.. . :::. ... : . ::..
CCDS62 MTSESDSIGLTPGEKSELALSALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTR
360 370 380 390 400 410
530 540 550 560 570 580
pF1KE4 ----LSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQP
... .. :.....:: ::::. : :. .:.:.:: .: .: ::.: ::.:. :
CCDS62 SGAIFTKAYQRMVLDAVTLNNLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAP
420 430 440 450 460 470
590 600 610 620 630
pF1KE4 LLKLREINARLDAVSEVLHSESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF---
: . :: ::::. ... ... ... . :.::::.:: : .:.. . ..:.
CCDS62 LCNHYAINDRLDAIEDLMVVPDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDS
480 490 500 510 520 530
640 650 660 670
pF1KE4 --FLIVKTLYHLKS--EFQA-------------IIPAVNSHIQSDLLRTVI-LE------
.. .: : :. .: . :. : . ..: .:. :: :.
CCDS62 RAIMYEETTYSKKKIIDFLSALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEG
540 550 560 570 580 590
680 690 700 710 720 730
pF1KE4 -IPELLSPVEHYLKILN-EQAAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHL
.:.: .... .. :.: :.: : : . : : :..: :.... .:
CCDS62 RFPDLTVELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YL
600 610 620 630 640 650
740 750 760 770 780
pF1KE4 QEIRKILKNPSAQYVTVSGQEFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENY
.. :. . . : .. .....:: .: .. .: .. .. :. .:. . : ..
CCDS62 EKQRNRIGCRTIVYWGIGRNRYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKL
660 670 680 690 700 710
790 800 810 820 830 840
pF1KE4 RHL---NQLREQLVLDCSAEWLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD-
.: .. :. . :: . .. .:...:.. .::. .:..: .. ::. .. ::
CCDS62 ANLINAEERRDVSLKDCMRR---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDG
720 730 740 750 760 770
850 860 870 880 890
pF1KE4 -YCRPTV--QEERK--IVIKNGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VM
.:::.. :. . .:..::: : ...: :...::. .. . :. .
CCDS62 PMCRPVILLPEDTPPFLELKGSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCV
780 790 800 810 820
900 910 920 930 940 950
pF1KE4 IITGPNMGGKSSYIKQVALITIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTF
..:::::::::. ..:..:...:::.: ::::: . .: .:::.::.: :..:.:::
CCDS62 LVTGPNMGGKSTLMRQAGLLAVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTF
830 840 850 860 870 880
960 970 980 990 1000 1010
pF1KE4 MEELTDTAEIIRKATSQSLVILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYP
. ::..:: :. .::..:::..:::::::.: :: ::: :... . . .: ::: :::
CCDS62 FVELSETASILMHATAHSLVLVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYH
890 900 910 920 930 940
1020 1030 1040 1050 1060 1070
pF1KE4 PVCE-LEKNYSHQVGNYHMGFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLN
. : .: . ..: ::. .: :.: . ::. . .::::.. .: .:::.:
CCDS62 SLVEDYSQNVAVRLG--HMACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFN
950 960 970 980 990
1080 1090 1100 1110 1120 1130
pF1KE4 VAKLADVPGEILKKAAHKSKELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEET
.:.::..: :...:. .:..:.: . .. :
CCDS62 AARLANLPEEVIQKGHRKAREFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1000 1010 1020 1030 1040 1050
>>CCDS62906.1 MSH6 gene_id:2956|Hs108|chr2 (1230 aa)
initn: 814 init1: 425 opt: 599 Z-score: 454.5 bits: 96.1 E(32554): 5.4e-19
Smith-Waterman score: 1051; 26.8% identity (58.8% similar) in 1121 aa overlap (85-1101:118-1201)
60 70 80 90 100 110
pF1KE4 AAAAAAAAPPAPPAPAFPPQLPPHVATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL
:: :.: : . : ..::.::
CCDS62 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE
90 100 110 120 130 140
120 130 140 150 160
pF1KE4 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP
:: .:: : : : :. . . .::. . :.. :. :.. .
CCDS62 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL
150 160 170 180 190 200
170 180 190 200 210
pF1KE4 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK
. . . : .:. . ...::.: :: :.. . .: ... ..
CCDS62 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE4 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN
. .: :: .. ..:.:. : :.: . : :... :: :.. ::.. . :
CCDS62 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE4 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL
. ...: . . :: :::::. :.:::: . . : ::.. . . .
CCDS62 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EAR----CRKMAHISKYDRV
330 340 350 360 370
340 350 360 370 380 390
pF1KE4 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT
. ... .: : .. .: : ... ..::: ..:..:. . .. :. :. .
CCDS62 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL
380 390 400 410 420 430
400 410 420 430 440 450
pF1KE4 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE
:. . .:.:. :...: .. ::..:. .. ::..:..... . : :.:. :
CCDS62 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLI---
440 450 460 470 480 490
460 470 480 490 500
pF1KE4 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI
. ... :...... : : : : . . :...:. ..: :: ..
CCDS62 -PGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL
500 510 520 530 540 550
510 520 530 540
pF1KE4 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR
.:.. . :::. ... : . ::.. ... .. :.....::
CCDS62 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN
560 570 580 590 600 610
550 560 570 580 590 600
pF1KE4 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS
::::. : :. .:.:.:: .: .: ::.: ::.:. :: . :: ::::. ...
CCDS62 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV
620 630 640 650 660 670
610 620 630 640 650
pF1KE4 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA
... ... . :.::::.:: : .:.. . ..:. .. .: : :. .: .
CCDS62 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS
680 690 700 710 720 730
660 670 680 690
pF1KE4 -------------IIPAVNSHIQSDLLRTVIL--------EIPELLSPVEHYLKILN-EQ
:. : . ..: .:. :: ..:.: .... .. :.
CCDS62 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK
740 750 760 770 780 790
700 710 720 730 740 750
pF1KE4 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ
: :.: : : . : : :..: :.... .:.. :. . . : .. .
CCDS62 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN
800 810 820 830 840
760 770 780 790 800
pF1KE4 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHL---NQLREQLVLDCSAE
....:: .: .. .: .. .. :. .:. . : .. .: .. :. . :: .
CCDS62 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR
850 860 870 880 890 900
810 820 830 840 850 860
pF1KE4 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK
.. .:...:.. .::. .:..: .. ::. .. :: .:::.. :. . .:
CCDS62 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK
910 920 930 940 950 960
870 880 890 900 910
pF1KE4 NGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VMIITGPNMGGKSSYIKQVALI
..::: : ...: :...::. .. . :. ...:::::::::. ..:..:.
CCDS62 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL
970 980 990 1000 1010 1020
920 930 940 950 960 970
pF1KE4 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLV
..:::.: ::::: . .: .:::.::.: :..:.:::. ::..:: :. .::..:::
CCDS62 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV
1030 1040 1050 1060 1070 1080
980 990 1000 1010 1020 1030
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM
..:::::::.: :: ::: :... . . .: ::: ::: . : .::..:. ::
CCDS62 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM
1090 1100 1110 1120 1130
1040 1050 1060 1070 1080 1090
pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS
. .: :.: . ::. . .::::.. .: .:::.:.:.::..: :...:. .:.
CCDS62 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
1140 1150 1160 1170 1180 1190
1100 1110 1120 1130
pF1KE4 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
.:.: . .. :
CCDS62 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1200 1210 1220 1230
>>CCDS1836.1 MSH6 gene_id:2956|Hs108|chr2 (1360 aa)
initn: 814 init1: 425 opt: 599 Z-score: 453.9 bits: 96.1 E(32554): 5.8e-19
Smith-Waterman score: 1051; 26.8% identity (58.8% similar) in 1121 aa overlap (85-1101:248-1331)
60 70 80 90 100 110
pF1KE4 AAAAAAAAPPAPPAPAFPPQLPPHVATEIDRRKKRPLEND-GPVKKKVKKVQQKEGGSDL
:: :.: : . : ..::.::
CCDS18 KSEEDNEIESEEEVQPKTQGSRRSSRQIKKRRVISDSESDIGGSDVEFKPDTKEEGSSDE
220 230 240 250 260 270
120 130 140 150 160
pF1KE4 GMSG--NSE------PKKCLRTRN-VSKSLEKLKEFCCDSALPQSRVQTESLQERFAVLP
:: .:: : : : :. . . .::. . :.. :. :.. .
CCDS18 ISSGVGDSESEGLNSPVKVARKRKRMVTGNGSLKRKSSRKETPSATKQATSISSETKNTL
280 290 300 310 320 330
170 180 190 200 210
pF1KE4 KCTDFDDISLLHAKNAVSSEDSKRQINQKDTTLFDLSQFGSSNT-----SHENLQKTASK
. . . : .:. . ...::.: :: :.. . .: ... ..
CCDS18 RAFSAPQNSESQAHVSGGGDDSSRPTVWYHETLEWLKEEKRRDEHRRRPDHPDFDASTLY
340 350 360 370 380 390
220 230 240 250 260 270
pF1KE4 SANKRSKSIYTPLELQYIEMKQQHKDAVLCVECGYKYRFFGEDAEIAARELNIYCHLDHN
. .: :: .. ..:.:. : :.: . : :... :: :.. ::.. . :
CCDS18 VPEDFLNSC-TPGMRKWWQIKSQNFDLVICYKVGKFYELYHMDALIGVSELGLV-FMKGN
400 410 420 430 440 450
280 290 300 310 320 330
pF1KE4 FMTASIPTHRLFVHVRRLVAKGYKVGVVKQTETAALKAIGDNRSSLFSRKLTALYTKSTL
. ...: . . :: :::::. :.:::: . . : ::.. . . .
CCDS18 WAHSGFPEIAFGRYSDSLVQKGYKVARVEQTETPEMM---EAR----CRKMAHISKYDRV
460 470 480 490 500
340 350 360 370 380 390
pF1KE4 IGEDVNPLI-KLDDAVNVDEI-MTDTSTSYLLCISENKENVRDKKKGNIFIGIVGVQPAT
. ... .: : .. .: : ... ..::: ..:..:. . .. :. :. .
CCDS18 VRREICRIITKGTQTYSVLEGDPSENYSKYLLSLKEKEEDSSGHTRA---YGVCFVDTSL
510 520 530 540 550 560
400 410 420 430 440 450
pF1KE4 GEVVFDSFQDSASRSELETRMSSLQPVELLLPSA-LSEQTEALIHRATSVSVQDDRIRVE
:. . .:.:. :...: .. ::..:. .. ::..:..... . : :.:. :
CCDS18 GKFFIGQFSDDRHCSRFRTLVAHYPPVQVLFEKGNLSKETKTILKSSLSCSLQEGLI---
570 580 590 600 610 620
460 470 480 490 500
pF1KE4 RMDNIYFEYSHAFQAVTE---FYAK--DTVDIKGSQIISGI------VNL---EKP--VI
. ... :...... : : : : . . :...:. ..: :: ..
CCDS18 -PGSQFWDASKTLRTLLEEEYFREKLSDGIGVMLPQVLKGMTSESDSIGLTPGEKSELAL
630 640 650 660 670 680
510 520 530 540
pF1KE4 CSLAAIIKYLKEFNLEKMLSKPENFKQ-----------------LSSKMEFMTINGTTLR
.:.. . :::. ... : . ::.. ... .. :.....::
CCDS18 SALGGCVFYLKKCLIDQELLSMANFEEYIPLDSDTVSTTRSGAIFTKAYQRMVLDAVTLN
690 700 710 720 730 740
550 560 570 580 590 600
pF1KE4 NLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKLKKWVTQPLLKLREINARLDAVSEVLHS
::::. : :. .:.:.:: .: .: ::.: ::.:. :: . :: ::::. ...
CCDS18 NLEIFLNGTNGSTEGTLLERVDTCHTPFGKRLLKQWLCAPLCNHYAINDRLDAIEDLMVV
750 760 770 780 790 800
610 620 630 640 650
pF1KE4 ESSVFGQIENHLRKLPDIERGLCSIYH--KKCSTQEF-----FLIVKTLYHLKS--EFQA
... ... . :.::::.:: : .:.. . ..:. .. .: : :. .: .
CCDS18 PDKI-SEVVELLKKLPDLERLLSKIHNVGSPLKSQNHPDSRAIMYEETTYSKKKIIDFLS
810 820 830 840 850 860
660 670 680 690
pF1KE4 -------------IIPAVNSHIQSDLLRTVIL--------EIPELLSPVEHYLKILN-EQ
:. : . ..: .:. :: ..:.: .... .. :.
CCDS18 ALEGFKVMCKIIGIMEEVADGFKSKILKQVISLQTKNPEGRFPDLTVELNRWDTAFDHEK
870 880 890 900 910 920
700 710 720 730 740 750
pF1KE4 AAKVGDKTEL--FKDLSDFPLIKKRKDEIQGVIDEIRMHLQEIRKILKNPSAQYVTVSGQ
: :.: : : . : : :..: :.... .:.. :. . . : .. .
CCDS18 ARKTGLITPKAGFDSDYDQALADIRENE-QSLLE----YLEKQRNRIGCRTIVYWGIGRN
930 940 950 960 970
760 770 780 790 800
pF1KE4 EFMIEI-KNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHL---NQLREQLVLDCSAE
....:: .: .. .: .. .. :. .:. . : .. .: .. :. . :: .
CCDS18 RYQLEIPENFTTRNLPEEYELKSTKKGCKRYWTKTIEKKLANLINAEERRDVSLKDCMRR
980 990 1000 1010 1020 1030
810 820 830 840 850 860
pF1KE4 WLDFLEKFSEHYHSLCKAVHHLATVDCIFSLAKVAKQGD--YCRPTV--QEERK--IVIK
.. .:...:.. .::. .:..: .. ::. .. :: .:::.. :. . .:
CCDS18 ---LFYNFDKNYKDWQSAVECIAVLDVLLCLANYSRGGDGPMCRPVILLPEDTPPFLELK
1040 1050 1060 1070 1080 1090
870 880 890 900 910
pF1KE4 NGRHPVID-VLLGEQDQYVPNNTDLSEDSER-------VMIITGPNMGGKSSYIKQVALI
..::: : ...: :...::. .. . :. ...:::::::::. ..:..:.
CCDS18 GSRHPCITKTFFG--DDFIPNDILIGCEEEEQENGKAYCVLVTGPNMGGKSTLMRQAGLL
1100 1110 1120 1130 1140 1150
920 930 940 950 960 970
pF1KE4 TIMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLV
..:::.: ::::: . .: .:::.::.: :..:.:::. ::..:: :. .::..:::
CCDS18 AVMAQMGCYVPAEVCRLTPIDRVFTRLGASDRIMSGESTFFVELSETASILMHATAHSLV
1160 1170 1180 1190 1200 1210
980 990 1000 1010 1020 1030
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNY--HM
..:::::::.: :: ::: :... . . .: ::: ::: . : .::..:. ::
CCDS18 LVDELGRGTATFDGTAIANAVVKELAETIKCRTLFSTHYHSLVE---DYSQNVAVRLGHM
1220 1230 1240 1250 1260
1040 1050 1060 1070 1080 1090
pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS
. .: :.: . ::. . .::::.. .: .:::.:.:.::..: :...:. .:.
CCDS18 ACMV-ENECE-DPSQ-----ETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKA
1270 1280 1290 1300 1310 1320
1100 1110 1120 1130
pF1KE4 KELEGLINTKRKRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
.:.: . .. :
CCDS18 REFEKMNQSLRLFREVCLASERSTVDAEAVHKLLTLIKEL
1330 1340 1350 1360
>>CCDS4720.1 MSH5 gene_id:4439|Hs108|chr6 (834 aa)
initn: 484 init1: 415 opt: 587 Z-score: 448.1 bits: 94.3 E(32554): 1.2e-18
Smith-Waterman score: 653; 28.2% identity (60.1% similar) in 616 aa overlap (547-1135:241-818)
520 530 540 550 560 570
pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL
. . . .: ::. .:.. . ..:.. :
CCDS47 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL
220 230 240 250 260 270
580 590 600 610 620 630
pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK
. : :.: : :...:::... : .. ..:. . :....: : . . .. : :
CCDS47 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK
280 290 300 310 320
640 650 660 670 680 690
pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN
: . .. ::.: : . .. : : :: .:.: . :. . : . . :...
CCDS47 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD
330 340 350 360 370 380
700 710 720 730 740
pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT
... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :.
CCDS47 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP
390 400 410 420 430 440
750 760 770 780 790 800
pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------
. : :.. : .:. :.... . .. . :. :. : . : . .
CCDS47 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD
450 460 470 480 490
810 820 830 840 850
pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE
: : . . : .. . . : .: : ::. .: ...::..:.. : :: . .
CCDS47 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ
500 510 520 530 540 550
860 870 880 890 900 910
pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT
. :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.:::
CCDS47 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT
560 570 580 590 600
920 930 940 950 960 970
pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTDTAEIIRKATSQSLVI
.:: .::.:::::: :: ::.::::. . ..: : :::: .:...:. . .::.::::.
CCDS47 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQVAKAVNNATAQSLVL
610 620 630 640 650 660
980 990 1000 1010 1020 1030
pF1KE4 LDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHMG
.::.:.::.: ::.:. :.:.... : .:: :.. . .:. .:
CCDS47 IDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQG
670 680 690 700 710 720
1040 1050 1060 1070 1080 1090
pF1KE4 FLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKSK
:: . : : :. :.: :.::. .:.: :.. ..: : .: ... ..:
CCDS47 PLV----QYLTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVA----RGK
730 740 750 760 770
1100 1110 1120 1130
pF1KE4 ELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
:. :: . . : .: . : :.: : : ....:. . .:
CCDS47 EVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAATS
780 790 800 810 820 830
CCDS47 IL
>>CCDS34409.2 MSH5 gene_id:4439|Hs108|chr6 (822 aa)
initn: 462 init1: 293 opt: 575 Z-score: 439.2 bits: 92.7 E(32554): 3.9e-18
Smith-Waterman score: 581; 29.2% identity (62.0% similar) in 476 aa overlap (547-998:258-712)
520 530 540 550 560 570
pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL
. . . .: ::. .:.. . ..:.. :
CCDS34 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL
230 240 250 260 270 280
580 590 600 610 620 630
pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK
. : :.: : :...:::... : .. ..:. . :....: : . . .. : :
CCDS34 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK
290 300 310 320 330 340
640 650 660 670 680 690
pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN
: . .. ::.: : . .. : : :: .:.: . :. . : . . :...
CCDS34 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD
350 360 370 380 390 400
700 710 720 730 740
pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT
... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :.
CCDS34 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP
410 420 430 440 450
750 760 770 780 790 800
pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------
. : :.. : .:. . .: .. . :. :. : . : . .
CCDS34 LIG--FLLSIPR-----LPS--MVEASDFEINGLDFMFLSEEKLHYRSARTKELDALLGD
460 470 480 490 500
810 820 830 840 850
pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE
: : . . : .. . . : .: : ::. .: ...::..:.. : :: . .
CCDS34 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ
510 520 530 540 550 560
860 870 880 890 900 910
pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT
. :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.:::
CCDS34 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT
570 580 590 600 610 620
920 930 940 950 960 970
pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTD-TAEIIRKATSQSLV
.:: .::.:::::: :: ::.::::. . ..: : :::: .:.. .:. . .::.::::
CCDS34 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLV
630 640 650 660 670 680
980 990 1000 1010 1020 1030
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFIRDVKSLTLFVTHYPPVCELEKNYSHQVGNYHMGF
..::.:.::.: ::.:. :.:....
CCDS34 LIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQLLPQGPLVQYLT
690 700 710 720 730 740
>>CCDS34410.1 MSH5 gene_id:4439|Hs108|chr6 (835 aa)
initn: 470 init1: 293 opt: 575 Z-score: 439.0 bits: 92.7 E(32554): 3.9e-18
Smith-Waterman score: 641; 28.2% identity (60.0% similar) in 617 aa overlap (547-1135:241-819)
520 530 540 550 560 570
pF1KE4 KMLSKPENFKQLSSKMEFMTINGTTLRNLEILQNQTDMKTKGSLLWVLDHTKTSFGRRKL
. . . .: ::. .:.. . ..:.. :
CCDS34 FKKFMLTHLVNIDQDTYSVLQIFKSESHPSVYKVASGLKEGLSLFGILNRCHCKWGEKLL
220 230 240 250 260 270
580 590 600 610 620 630
pF1KE4 KKWVTQPLLKLREINARLDAVSEVLHSESSVFGQIEN----HLRKLPDIERGLCSIYHKK
. : :.: : :...:::... : .. ..:. . :....: : . . .. : :
CCDS34 RLWFTRPTHDLGELSSRLDVIQFFLLPQNLDMAQMLHRLLGHIKNVPLILKRM-KLSHTK
280 290 300 310 320
640 650 660 670 680 690
pF1KE4 CSTQEFFLIVKTLYHLKSEFQAIIPAVNSHIQS-DLLRTVILEIPELLSPVEHYL-KILN
: . .. ::.: : . .. : : :: .:.: . :. . : . . :...
CCDS34 VSDWQ--VLYKTVY---SAL-GLRDACRSLPQSIQLFRDIAQEFSDDLHHIASLIGKVVD
330 340 350 360 370 380
700 710 720 730 740
pF1KE4 EQAAKVGDKTELFKDLSDFPLIKKRKDEIQGV---IDEI-RMHLQEIRKILKNPSAQYVT
... . .. .. ... : : ..: ...:. . :. : .:... . . . :. :.
CCDS34 FEGSLAENRFTVLPNID--PEIDEKKRRLMGLPSFLTEVARKELENLDSRIPSCSVIYIP
390 400 410 420 430 440
750 760 770 780 790 800
pF1KE4 VSGQEFMIEIKNSAVSCIPTDWVKVGSTKAVSRFHSPFIVENYRHLNQLREQLV------
. : :.. : .:. :.... . .. . :. :. : . : . .
CCDS34 LIG--FLLSIPR-----LPS-MVEASDFE-INGLDFMFLSEEKLHYRSARTKELDALLGD
450 460 470 480 490
810 820 830 840 850
pF1KE4 LDCSAEWLDFLEKFSEHYHSLCKA-----VHHLAT-VDCIFSLAKVAKQGDYCRPTVQEE
: : . . : .. . . : .: : ::. .: ...::..:.. : :: . .
CCDS34 LHCEIRDQETLLMYQLQCQVLARAAVLTRVLDLASRLDVLLALASAARDYGYSRPRYSPQ
500 510 520 530 540 550
860 870 880 890 900 910
pF1KE4 R-KIVIKNGRHPVIDVLLGEQDQYVPNNTDLSEDSERVMIITGPNMGGKSSYIKQVALIT
. :.:::::.... .:::.:. . :. :: .::::: .::: :.:::.:::
CCDS34 VLGVRIQNGRHPLMELC---ARTFVPNSTECGGDKGRVKVITGPNSSGKSIYLKQVGLIT
560 570 580 590 600
920 930 940 950 960 970
pF1KE4 IMAQIGSYVPAEEATIGIVDGIFTRMGAADNIYKGRSTFMEELTD-TAEIIRKATSQSLV
.:: .::.:::::: :: ::.::::. . ..: : :::: .:.. .:. . .::.::::
CCDS34 FMALVGSFVPAEEAEIGAVDAIFTRIHSCESISLGLSTFMIDLNQQVAKAVNNATAQSLV
610 620 630 640 650 660
980 990 1000 1010 1020 1030
pF1KE4 ILDELGRGTSTHDGIAIAYATLEYFI-RDVKSLTLFV-THYPPVCELEKNYSHQVGNYHM
..::.:.::.: ::.:. :.:.... : .:: :.. . .:. .
CCDS34 LIDEFGKGTNTVDGLALLAAVLRHWLARGPTCPHIFVATNFLSLVQLQL--------LPQ
670 680 690 700 710 720
1040 1050 1060 1070 1080 1090
pF1KE4 GFLVSEDESKLDPGTAEQVPDFVTFLYQITRGIAARSYGLNVAKLADVPGEILKKAAHKS
: :: . : : :. :.: :.::. .:.: :.. ..: : .: ... ..
CCDS34 GPLV----QYLTMETCEDGNDLV-FFYQVCEGVAKASHASHTAAQAGLPDKLVA----RG
730 740 750 760 770
1100 1110 1120 1130
pF1KE4 KELEGLINTKR--KRLKYFAKLWTMHNAQDLQKWTEEFNMEETQTSLLH
::. :: . . : .: . : :.: : : ....:. . .:
CCDS34 KEVSDLIRSGKPIKPVKDLLKKNQMENCQTLVDKFMKLDLEDPNLDLNVFMSQEVLPAAT
780 790 800 810 820 830
CCDS34 SIL
1137 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 18:16:43 2016 done: Mon Nov 7 18:16:43 2016
Total Scan time: 4.630 Total Display time: 0.400
Function used was FASTA [36.3.4 Apr, 2011]