FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5764, 756 aa
1>>>pF1KB5764 756 - 756 aa - 756 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7410+/-0.00112; mu= 13.0605+/- 0.068
mean_var=94.6601+/-18.473, 0's: 0 Z-trim(104.3): 31 B-trim: 0 in 0/50
Lambda= 0.131823
statistics sampled from 7805 (7819) to 7805 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.24), width: 16
Scan time: 3.110
The best scores are: opt bits E(32554)
CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 ( 756) 4894 941.8 0
CCDS54562.1 MLH1 gene_id:4292|Hs108|chr3 ( 658) 4261 821.4 0
CCDS54563.1 MLH1 gene_id:4292|Hs108|chr3 ( 515) 3368 651.5 9.6e-187
CCDS5343.1 PMS2 gene_id:5395|Hs108|chr7 ( 862) 450 96.6 1.7e-19
CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429) 391 85.5 6.4e-16
CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453) 391 85.5 6.5e-16
CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 ( 770) 381 83.5 1.4e-15
CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 ( 932) 381 83.5 1.6e-15
CCDS46474.1 PMS1 gene_id:5378|Hs108|chr2 ( 893) 351 77.8 8.3e-14
CCDS82544.1 PMS1 gene_id:5378|Hs108|chr2 ( 181) 314 70.5 2.6e-12
CCDS82543.1 PMS1 gene_id:5378|Hs108|chr2 ( 165) 309 69.6 4.7e-12
>>CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 (756 aa)
initn: 4894 init1: 4894 opt: 4894 Z-score: 5031.9 bits: 941.8 E(32554): 0
Smith-Waterman score: 4894; 99.9% identity (100.0% similar) in 756 aa overlap (1-756:1-756)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 GRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDKTLAF
::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::::
CCDS26 GRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 KMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 KMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 QNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 QNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 KSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 KSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDIS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 SGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 SGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 MVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 MVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWAL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 AQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 AQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB5 DGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 DGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB5 ATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 ATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIV
670 680 690 700 710 720
730 740 750
pF1KB5 YKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
::::::::::::::::::::::::::::::::::::
CCDS26 YKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
730 740 750
>>CCDS54562.1 MLH1 gene_id:4292|Hs108|chr3 (658 aa)
initn: 4261 init1: 4261 opt: 4261 Z-score: 4382.3 bits: 821.4 E(32554): 0
Smith-Waterman score: 4261; 99.8% identity (100.0% similar) in 655 aa overlap (102-756:4-658)
80 90 100 110 120 130
pF1KB5 DLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTADGKCAYRASYS
::::::::::::::::::::::::::::::
CCDS54 MAFEALASISHVAHVTITTKTADGKCAYRASYS
10 20 30
140 150 160 170 180 190
pF1KB5 DGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 DGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGIS
40 50 60 70 80 90
200 210 220 230 240 250
pF1KB5 FSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDKTLAFKMNGYISNANY
:::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::
CCDS54 FSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANY
100 110 120 130 140 150
260 270 280 290 300 310
pF1KB5 SVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTK
160 170 180 190 200 210
320 330 340 350 360 370
pF1KB5 HEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 HEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSST
220 230 240 250 260 270
380 390 400 410 420 430
pF1KB5 SGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEM
280 290 300 310 320 330
440 450 460 470 480 490
pF1KB5 LELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMT
340 350 360 370 380 390
500 510 520 530 540 550
pF1KB5 AACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 AACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLN
400 410 420 430 440 450
560 570 580 590 600 610
pF1KB5 TTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYI
460 470 480 490 500 510
620 630 640 650 660 670
pF1KB5 VEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 VEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKE
520 530 540 550 560 570
680 690 700 710 720 730
pF1KB5 CFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 CFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPP
580 590 600 610 620 630
740 750
pF1KB5 KHFTEDGNILQLANLPDLYKVFERC
:::::::::::::::::::::::::
CCDS54 KHFTEDGNILQLANLPDLYKVFERC
640 650
>>CCDS54563.1 MLH1 gene_id:4292|Hs108|chr3 (515 aa)
initn: 3368 init1: 3368 opt: 3368 Z-score: 3466.1 bits: 651.5 E(32554): 9.6e-187
Smith-Waterman score: 3368; 100.0% identity (100.0% similar) in 515 aa overlap (242-756:1-515)
220 230 240 250 260 270
pF1KB5 TVDNIRSVFGNAVSRELIEIGCEDKTLAFKMNGYISNANYSVKKCIFLLFINHRLVESTS
::::::::::::::::::::::::::::::
CCDS54 MNGYISNANYSVKKCIFLLFINHRLVESTS
10 20 30
280 290 300 310 320 330
pF1KB5 LRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIE
40 50 60 70 80 90
340 350 360 370 380 390
pF1KB5 SKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQ
100 110 120 130 140 150
400 410 420 430 440 450
pF1KB5 KLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDT
160 170 180 190 200 210
460 470 480 490 500 510
pF1KB5 TKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQE
220 230 240 250 260 270
520 530 540 550 560 570
pF1KB5 EINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANF
280 290 300 310 320 330
580 590 600 610 620 630
pF1KB5 GVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEID
340 350 360 370 380 390
640 650 660 670 680 690
pF1KB5 EEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYI
400 410 420 430 440 450
700 710 720 730 740 750
pF1KB5 SEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYK
460 470 480 490 500 510
pF1KB5 VFERC
:::::
CCDS54 VFERC
>>CCDS5343.1 PMS2 gene_id:5395|Hs108|chr7 (862 aa)
initn: 441 init1: 308 opt: 450 Z-score: 463.4 bits: 96.6 E(32554): 1.7e-19
Smith-Waterman score: 570; 28.1% identity (59.5% similar) in 506 aa overlap (5-477:12-494)
10 20 30 40 50
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKE
: .:. .:. :..: .:.:. ..:.::..:: ::: .:.:.. .:.
CCDS53 MERAESSSTEPAKAIKPIDRKSVHQICSGQVVLSLSTAVKELVENSLDAGATNIDLKLKD
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 GGLKLIQIQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHV
:. ::...::: :...:... . . :::.: : ::... :.:::::::.:. .. :
CCDS53 YGVDLIEVSDNGCGVEEENFEGLTLKHHTSKIQEFADLTQVETFGFRGEALSSLCALSDV
70 80 90 100 110 120
120 130 140 150 160
pF1KB5 TITTKTADGKCAYRASYS-DGKL--KAP-PKPCAGNQGTQITVEDLFYNIATRRKAL-KN
::.: :..: . : .. .::. :.: :.: .:: ..:..:: .. .:.: . .:
CCDS53 TISTCHASAKVGTRLMFDHNGKIIQKTPYPRP----RGTTVSVQQLFSTLPVRHKEFQRN
130 140 150 160 170
170 180 190 200 210 220
pF1KB5 PSEEYGKILEVVGRYSVHNAGISFSVKKQ---GETVADVRTLPNASTVDNIRSVFGNAVS
..::.:...:. : . .::: : .: :. : : . : .:: ::::.
CCDS53 IKKEYAKMVQVLHAYCIISAGIRVSCTNQLGQGKRQPVVCTGGSPSIKENIGSVFGQKQL
180 190 200 210 220 230
230 240 250 260
pF1KB5 RELIEIG--------CEDKTLA--------FKMNGYISNANYSVKKCIF---LLFINHRL
. :: . ::. :. : ..:.::. ...: . ..:::.:
CCDS53 QSLIPFVQLPPSDSVCEEYGLSCSDALHNLFYISGFISQCTHGVGRSSTDRQFFFINRRP
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB5 VESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERV
. ... . .. :: : .. .::. :.. .. . ::.:: : :... .:.::..: :
CCDS53 CDPAKVCRLVNEVYHMY-NRHQYPFVVLNISVDSECVDINVTPDKRQI-LLQEEKLLLAV
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB5 QQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRT
. .. :. ... .: : : :...: .. . ..:. . .::
CCDS53 LKTSLIGMFDSDVNKLNVSQQ--P-LLDVEGNLIKMHAADLEKPMVEKQDQSPS---LRT
360 370 380 390 400
390 400 410 420 430 440
pF1KB5 DSREQKLDAFLQPLSKPLS------SQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEV
:.: :. .. : . .: ..:.. : . :. : :: . . .
CCDS53 G--EEKKDVSISRLREAFSLRHTTENKPHSPKTPEPRRSPLGQKRG----MLSSSTSGAI
410 420 430 440 450 460
450 460 470 480 490 500
pF1KB5 AAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRI
. : : .: ..::.. . : . ..::
CCDS53 SDK-----GVLRPQKEAVSSSHGPSDPTDRAEVEKDSGHGSTSVDSEGFSIPDTGSHCSS
470 480 490 500 510
510 520 530 540 550 560
pF1KB5 INLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELF
CCDS53 EYAASSPGDRGSQEHVDSQEKAPKTDDSFSDVDCHSNQEDTGCKFRVLPQPTNLATPNTK
520 530 540 550 560 570
>>CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429 aa)
initn: 217 init1: 161 opt: 391 Z-score: 399.2 bits: 85.5 E(32554): 6.4e-16
Smith-Waterman score: 413; 26.2% identity (57.1% similar) in 508 aa overlap (7-475:1-489)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
.:. :. : .. .: .:. .. ..:. : .::.. . : :. .. .:
CCDS98 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQ-VQ
10 20 30 40 50
70 80 90 100 110
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAH-VTITTKT
. ::: :. ..:.. : .:. ::: .: .:: . :::::::::.:. .: : :..:
CCDS98 VIDNGFGMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 ADGKCAYRASYSDGK-LKAPPKPCA-GNQGTQITVEDLFYNIATRRKALKNPSEEYGKIL
.. ...:: ::: . .. :: .:: .:::.. .::: . .: :. :.
CCDS98 NRTMKTFVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCM-DPRLEFEKVR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 EVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTV-DNIRSVFGNAVSRELIEIGCEDK
. . :. . .::::.... . . : ::... : . . ...: . :..: ::. . :
CCDS98 QRIEALSLMHPSISFSLRND-VSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYK
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYISN-ANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYL----PKN----
:...::::. :.:. : . .::.:.::: :.:.: :. . :::
CCDS98 --EFELSGYISSEAHYN--KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTS
240 250 260 270 280
290 300 310 320 330
pF1KB5 ----------THPFLYLSLEISPQ----NVDVNVHPTKHEVHFLHEESILERVQQHIESK
. : :: :. : . :: ..:.: ..: . ...: .:. .
CCDS98 RQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGV---
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB5 LLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSRE---
.:.. : : .. ::: .: . .. : .. . . . :.. .:
CCDS98 -------KMFLKQEKL--FVELSGEDIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACN
350 360 370 380 390
400 410 420 430 440
pF1KB5 QKLDAF----LQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEML--ELPAPAEVAAKN
. ::.. :: . .. . . :... : . : .: . : .:.. .
CCDS98 NILDSYEMFNLQSKAVKRKTTAENVNTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTE
400 410 420 430 440 450
450 460 470 480 490 500
pF1KB5 QSLEG-DTTKGTSEMSEKRGPTSSNP--RKRHREDSDVEMVEDDSRKEMTAACTPRRRII
::.. :.. . :.: :.. ..:. ..:..
CCDS98 PSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTP
460 470 480 490 500 510
510 520 530 540 550 560
pF1KB5 NLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFY
CCDS98 CHFEESGQDLEIWKESTTVNGMAANILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVH
520 530 540 550 560 570
>>CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453 aa)
initn: 217 init1: 161 opt: 391 Z-score: 399.1 bits: 85.5 E(32554): 6.5e-16
Smith-Waterman score: 413; 26.2% identity (57.1% similar) in 508 aa overlap (7-475:1-489)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
.:. :. : .. .: .:. .. ..:. : .::.. . : :. .. .:
CCDS32 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQ-VQ
10 20 30 40 50
70 80 90 100 110
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAH-VTITTKT
. ::: :. ..:.. : .:. ::: .: .:: . :::::::::.:. .: : :..:
CCDS32 VIDNGFGMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 ADGKCAYRASYSDGK-LKAPPKPCA-GNQGTQITVEDLFYNIATRRKALKNPSEEYGKIL
.. ...:: ::: . .. :: .:: .:::.. .::: . .: :. :.
CCDS32 NRTMKTFVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCM-DPRLEFEKVR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 EVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTV-DNIRSVFGNAVSRELIEIGCEDK
. . :. . .::::.... . . : ::... : . . ...: . :..: ::. . :
CCDS32 QRIEALSLMHPSISFSLRND-VSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYK
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYISN-ANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYL----PKN----
:...::::. :.:. : . .::.:.::: :.:.: :. . :::
CCDS32 --EFELSGYISSEAHYN--KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTS
240 250 260 270 280
290 300 310 320 330
pF1KB5 ----------THPFLYLSLEISPQ----NVDVNVHPTKHEVHFLHEESILERVQQHIESK
. : :: :. : . :: ..:.: ..: . ...: .:. .
CCDS32 RQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGV---
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB5 LLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSRE---
.:.. : : .. ::: .: . .. : .. . . . :.. .:
CCDS32 -------KMFLKQEKL--FVELSGEDIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACN
350 360 370 380 390
400 410 420 430 440
pF1KB5 QKLDAF----LQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEML--ELPAPAEVAAKN
. ::.. :: . .. . . :... : . : .: . : .:.. .
CCDS32 NILDSYEMFNLQSKAVKRKTTAENVNTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTE
400 410 420 430 440 450
450 460 470 480 490 500
pF1KB5 QSLEG-DTTKGTSEMSEKRGPTSSNP--RKRHREDSDVEMVEDDSRKEMTAACTPRRRII
::.. :.. . :.: :.. ..:. ..:..
CCDS32 PSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTP
460 470 480 490 500 510
510 520 530 540 550 560
pF1KB5 NLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFY
CCDS32 CHFEESGQDLEIWKESTTVNGMAANILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVH
520 530 540 550 560 570
>>CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 (770 aa)
initn: 373 init1: 324 opt: 381 Z-score: 393.2 bits: 83.5 E(32554): 1.4e-15
Smith-Waterman score: 435; 28.0% identity (63.8% similar) in 329 aa overlap (8-323:1-326)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS46 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS46 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI
:. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: ::
CCDS46 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDK
... ... . . . .. .. . . . . . . ::.:.:: .. . ...
CCDS46 QDLLMSFGILKPDLRIVFVHNKAVIWQKSRVSDHKMA--LMSVLGTAVMNNMESFQYHSE
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYIS--NANYSVKKCIF----LLFINHRLVESTSLRKAIETVYAAYLPKNT--
. ..:.. .:..: . ..::: : :.. .. : :. : :..
CCDS46 ESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIRHHYNLKCLKESTR
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB5 -HPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQT
.: ..:.... .::::. : : .: . ..::.:
CCDS46 LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVLIALENLMTTCYGPLPSTNSYENNK
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB5 LLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQ
CCDS46 TDVSAADIVLSKTAETDVLFNKVESSGKNYSNVDTSVIPFQNDMHNDESGKNTDDCLNHQ
360 370 380 390 400 410
>>CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 (932 aa)
initn: 373 init1: 324 opt: 381 Z-score: 391.9 bits: 83.5 E(32554): 1.6e-15
Smith-Waterman score: 440; 21.8% identity (55.2% similar) in 737 aa overlap (8-727:1-675)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS23 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS23 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI
:. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: ::
CCDS23 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDK
... ... . . . .. .. . . . . . . ::.:.:: .. . ...
CCDS23 QDLLMSFGILKPDLRIVFVHNKAVIWQKSRVSDHKMA--LMSVLGTAVMNNMESFQYHSE
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYIS--NANYSVKKCIF----LLFINHRLVESTSLRKAIETVYAAYLPKNT--
. ..:.. .:..: . ..::: : :.. .. : :. : :..
CCDS23 ESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIRHHYNLKCLKESTR
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB5 -HPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQT
.: ..:.... .::::. : : .: . ..::.: ..
CCDS23 LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVL-------------------IALEN
300 310 320 330
350 360 370 380 390 400
pF1KB5 LLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQ
:. :: . ::.: ...:. :. . . ..:: .:... .: :.
CCDS23 LMTTCYGP----LPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESS----GKNYSNV
340 350 360 370 380
410 420 430 440 450 460
pF1KB5 PQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKG--TSEMSEKRGPT
... ..:. . .. .. .. :. .: :: : .::.:.
CCDS23 DTSVIPF-QNDMHNDESGKNTDDCLN----------HQISIGDFGYGHCSSEISN----I
390 400 410 420
470 480 490 500 510 520
pF1KB5 SSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREML
..: .. .. : .. ..:. :.. .: ..:: : : ... : . :
CCDS23 DKNTKNAFQDISMSNVSWENSQTEYSKTCF-------ISSVKHTQSENGNKDH--IDESG
430 440 450 460 470
530 540 550 560 570 580
pF1KB5 HNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDL
.:. .: : . :.. .. .:... ..:.. .. .. .. :. .
CCDS23 ENEEEAGLENSSEISADEWSRGNILKNS-VGENIEPVKILVPEKSLPCKVSNNNYPIPEQ
480 490 500 510 520 530
590 600 610 620 630 640
pF1KB5 AMLALDS--PESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLI
: :: .:. .. . : . . . . :: : :. . .. :.. .. ::
CCDS23 MNLNEDSCNKKSNVIDNKSGKVTAYDLLSNRVIKKP-MSASALFVQ-DHRPQF-----LI
540 550 560 570 580 590
650 660 670 680 690 700
pF1KB5 DNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSE
.: :: . : .: .. .:. . :. .:. . : :. : .:: .: ....
CCDS23 ENPKTSLEDATLQIEELWKTLSEEEKLKYEEKATKDLERYNSQMKRAIEQESQMSLKDGR
600 610 620 630 640 650
710 720 730 740 750
pF1KB5 VPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
. ..:. . .: . .: ..
CCDS23 KKIKPTSAWNLAQKHKLKTSLSNQPKLDELLQSQIEKRRSQNIKMVQIPFSMKNLKINFK
660 670 680 690 700 710
>>CCDS46474.1 PMS1 gene_id:5378|Hs108|chr2 (893 aa)
initn: 373 init1: 324 opt: 351 Z-score: 361.4 bits: 77.8 E(32554): 8.3e-14
Smith-Waterman score: 398; 22.7% identity (53.4% similar) in 731 aa overlap (8-727:1-636)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS46 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS46 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI
:. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: ::
CCDS46 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDK
... .::.. : :. .: :: : .. : :
CCDS46 QDLL---------MSFGILK-----------PD------LRIVF---VHNKIYLSGFLPK
180 190 200
240 250 260 270 280 290
pF1KB5 TLAFKMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNT---HPFLY
: . .:. . : ..::: : :.. .. : :. : :.. .: ..
CCDS46 CDADHSFTSLSTPERS------FIFINSRPVHQKDILKLIRHHYNLKCLKESTRLYPVFF
210 220 230 240 250
300 310 320 330 340 350
pF1KB5 LSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLA
:.... .::::. : : .: . ..::.: ..:.
CCDS46 LKIDVPTADVDVNLTPDKSQVLLQNKESVL-------------------IALENLMTTCY
260 270 280 290
360 370 380 390 400 410
pF1KB5 GPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVT
:: . ::.: ...:. :. . . ..:: .:... .: :. ...
CCDS46 GP----LPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESS----GKNYSNVDTSVIP
300 310 320 330 340 350
420 430 440 450 460 470
pF1KB5 EDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKG--TSEMSEKRGPTSSNPRK
..:. . .. .. .. :. .: :: : .::.:. ..: ..
CCDS46 F-QNDMHNDESGKNTDDCLN----------HQISIGDFGYGHCSSEISN----IDKNTKN
360 370 380 390
480 490 500 510 520 530
pF1KB5 RHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFV
.. : .. ..:. :.. .: ..:: : : ... : . : .:. .
CCDS46 AFQDISMSNVSWENSQTEYSKTCF-------ISSVKHTQSENGNKDH--IDESGENEEEA
400 410 420 430 440
540 550 560 570 580 590
pF1KB5 GCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALD
: : . :.. .. .:... ..:.. .. .. .. :. . : :
CCDS46 GLENSSEISADEWSRGNILKNS-VGENIEPVKILVPEKSLPCKVSNNNYPIPEQMNLNED
450 460 470 480 490 500
600 610 620 630 640
pF1KB5 S--PESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPP
: .:. .. . : . . . . :: : :. . .. :.. .. ::.:
CCDS46 SCNKKSNVIDNKSGKVTAYDLLSNRVIKKP-MSASALFVQ-DHRPQF-----LIENPKTS
510 520 530 540 550
650 660 670 680 690 700
pF1KB5 LEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIP
:: . : .: .. .:. . :. .:. . : :. : .:: .: .... .
CCDS46 LEDATLQIEELWKTLSEEEKLKYEEKATKDLERYNSQMKRAIEQESQMSLKDGRKKIKPT
560 570 580 590 600 610
710 720 730 740 750
pF1KB5 NSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
..:. . .: . .: ..
CCDS46 SAWNLAQKHKLKTSLSNQPKLDELLQSQIEKRRSQNIKMVQIPFSMKNLKINFKKQNKVD
620 630 640 650 660 670
>>CCDS82544.1 PMS1 gene_id:5378|Hs108|chr2 (181 aa)
initn: 286 init1: 286 opt: 314 Z-score: 334.4 bits: 70.5 E(32554): 2.6e-12
Smith-Waterman score: 314; 36.6% identity (71.2% similar) in 153 aa overlap (8-159:1-149)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS82 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS82 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEV
:. . . ..:.. . :: .:: ... :. ::
CCDS82 ADNFSTQYVLDGSGHILSQ-KPSHLGQGKKVA---LYTNILYLFCLNCWFKKKKLLGEYK
120 130 140 150 160
180 190 200 210 220 230
pF1KB5 VGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSVFGNAVSRELIEIGCEDKTLA
CCDS82 YIALGLVLIKAS
170 180
756 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 16:17:51 2016 done: Sat Nov 5 16:17:51 2016
Total Scan time: 3.110 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]