FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5502, 756 aa
1>>>pF1KB5502 756 - 756 aa - 756 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7197+/-0.00112; mu= 13.1741+/- 0.068
mean_var=93.8094+/-18.305, 0's: 0 Z-trim(104.3): 32 B-trim: 0 in 0/50
Lambda= 0.132419
statistics sampled from 7798 (7812) to 7798 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.599), E-opt: 0.2 (0.24), width: 16
Scan time: 3.650
The best scores are: opt bits E(32554)
CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 ( 756) 4895 946.1 0
CCDS54562.1 MLH1 gene_id:4292|Hs108|chr3 ( 658) 4262 825.2 0
CCDS54563.1 MLH1 gene_id:4292|Hs108|chr3 ( 515) 3368 654.4 1.3e-187
CCDS5343.1 PMS2 gene_id:5395|Hs108|chr7 ( 862) 449 96.8 1.5e-19
CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429) 392 86.0 4.6e-16
CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453) 392 86.0 4.7e-16
CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 ( 770) 380 83.6 1.3e-15
CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 ( 932) 380 83.6 1.5e-15
CCDS46474.1 PMS1 gene_id:5378|Hs108|chr2 ( 893) 351 78.1 6.9e-14
CCDS82544.1 PMS1 gene_id:5378|Hs108|chr2 ( 181) 314 70.8 2.2e-12
CCDS82543.1 PMS1 gene_id:5378|Hs108|chr2 ( 165) 309 69.8 4e-12
>>CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 (756 aa)
initn: 4895 init1: 4895 opt: 4895 Z-score: 5055.5 bits: 946.1 E(32554): 0
Smith-Waterman score: 4895; 100.0% identity (100.0% similar) in 756 aa overlap (1-756:1-756)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 GRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 GRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 KMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 KMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 QNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 QNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 KSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 KSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDIS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 SGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 SGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 MVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 MVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWAL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 AQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 AQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB5 DGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 DGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB5 ATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS26 ATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIV
670 680 690 700 710 720
730 740 750
pF1KB5 YKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
::::::::::::::::::::::::::::::::::::
CCDS26 YKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
730 740 750
>>CCDS54562.1 MLH1 gene_id:4292|Hs108|chr3 (658 aa)
initn: 4262 init1: 4262 opt: 4262 Z-score: 4402.9 bits: 825.2 E(32554): 0
Smith-Waterman score: 4262; 100.0% identity (100.0% similar) in 655 aa overlap (102-756:4-658)
80 90 100 110 120 130
pF1KB5 DLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTADGKCAYRASYS
::::::::::::::::::::::::::::::
CCDS54 MAFEALASISHVAHVTITTKTADGKCAYRASYS
10 20 30
140 150 160 170 180 190
pF1KB5 DGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 DGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEVVGRYSVHNAGIS
40 50 60 70 80 90
200 210 220 230 240 250
pF1KB5 FSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 FSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANY
100 110 120 130 140 150
260 270 280 290 300 310
pF1KB5 SVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTK
160 170 180 190 200 210
320 330 340 350 360 370
pF1KB5 HEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 HEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSST
220 230 240 250 260 270
380 390 400 410 420 430
pF1KB5 SGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEM
280 290 300 310 320 330
440 450 460 470 480 490
pF1KB5 LELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LELPAPAEVAAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMT
340 350 360 370 380 390
500 510 520 530 540 550
pF1KB5 AACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 AACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLN
400 410 420 430 440 450
560 570 580 590 600 610
pF1KB5 TTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYI
460 470 480 490 500 510
620 630 640 650 660 670
pF1KB5 VEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 VEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKE
520 530 540 550 560 570
680 690 700 710 720 730
pF1KB5 CFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 CFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPP
580 590 600 610 620 630
740 750
pF1KB5 KHFTEDGNILQLANLPDLYKVFERC
:::::::::::::::::::::::::
CCDS54 KHFTEDGNILQLANLPDLYKVFERC
640 650
>>CCDS54563.1 MLH1 gene_id:4292|Hs108|chr3 (515 aa)
initn: 3368 init1: 3368 opt: 3368 Z-score: 3481.6 bits: 654.4 E(32554): 1.3e-187
Smith-Waterman score: 3368; 100.0% identity (100.0% similar) in 515 aa overlap (242-756:1-515)
220 230 240 250 260 270
pF1KB5 TVDNIRSIFGNAVSRELIEIGCEDKTLAFKMNGYISNANYSVKKCIFLLFINHRLVESTS
::::::::::::::::::::::::::::::
CCDS54 MNGYISNANYSVKKCIFLLFINHRLVESTS
10 20 30
280 290 300 310 320 330
pF1KB5 LRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIE
40 50 60 70 80 90
340 350 360 370 380 390
pF1KB5 SKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQ
100 110 120 130 140 150
400 410 420 430 440 450
pF1KB5 KLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 KLDAFLQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDT
160 170 180 190 200 210
460 470 480 490 500 510
pF1KB5 TKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 TKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQE
220 230 240 250 260 270
520 530 540 550 560 570
pF1KB5 EINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANF
280 290 300 310 320 330
580 590 600 610 620 630
pF1KB5 GVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 GVLRLSEPAPLFDLAMLALDSPESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEID
340 350 360 370 380 390
640 650 660 670 680 690
pF1KB5 EEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EEGNLIGLPLLIDNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYI
400 410 420 430 440 450
700 710 720 730 740 750
pF1KB5 SEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 SEESTLSGQQSEVPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYK
460 470 480 490 500 510
pF1KB5 VFERC
:::::
CCDS54 VFERC
>>CCDS5343.1 PMS2 gene_id:5395|Hs108|chr7 (862 aa)
initn: 440 init1: 308 opt: 449 Z-score: 464.2 bits: 96.8 E(32554): 1.5e-19
Smith-Waterman score: 569; 27.9% identity (59.5% similar) in 506 aa overlap (5-477:12-494)
10 20 30 40 50
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKE
: .:. .:. :..: .:.:. ..:.::..:: ::: .:.:.. .:.
CCDS53 MERAESSSTEPAKAIKPIDRKSVHQICSGQVVLSLSTAVKELVENSLDAGATNIDLKLKD
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 GGLKLIQIQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHV
:. ::...::: :...:... . . :::.: : ::... :.:::::::.:. .. :
CCDS53 YGVDLIEVSDNGCGVEEENFEGLTLKHHTSKIQEFADLTQVETFGFRGEALSSLCALSDV
70 80 90 100 110 120
120 130 140 150 160
pF1KB5 TITTKTADGKCAYRASYS-DGKL--KAP-PKPCAGNQGTQITVEDLFYNIATRRKAL-KN
::.: :..: . : .. .::. :.: :.: .:: ..:..:: .. .:.: . .:
CCDS53 TISTCHASAKVGTRLMFDHNGKIIQKTPYPRP----RGTTVSVQQLFSTLPVRHKEFQRN
130 140 150 160 170
170 180 190 200 210 220
pF1KB5 PSEEYGKILEVVGRYSVHNAGISFSVKKQ---GETVADVRTLPNASTVDNIRSIFGNAVS
..::.:...:. : . .::: : .: :. : : . : .:: :.::.
CCDS53 IKKEYAKMVQVLHAYCIISAGIRVSCTNQLGQGKRQPVVCTGGSPSIKENIGSVFGQKQL
180 190 200 210 220 230
230 240 250 260
pF1KB5 RELIEIG--------CEDKTLA--------FKMNGYISNANYSVKKCIF---LLFINHRL
. :: . ::. :. : ..:.::. ...: . ..:::.:
CCDS53 QSLIPFVQLPPSDSVCEEYGLSCSDALHNLFYISGFISQCTHGVGRSSTDRQFFFINRRP
240 250 260 270 280 290
270 280 290 300 310 320
pF1KB5 VESTSLRKAIETVYAAYLPKNTHPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERV
. ... . .. :: : .. .::. :.. .. . ::.:: : :... .:.::..: :
CCDS53 CDPAKVCRLVNEVYHMY-NRHQYPFVVLNISVDSECVDINVTPDKRQI-LLQEEKLLLAV
300 310 320 330 340 350
330 340 350 360 370 380
pF1KB5 QQHIESKLLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRT
. .. :. ... .: : : :...: .. . ..:. . .::
CCDS53 LKTSLIGMFDSDVNKLNVSQQ--P-LLDVEGNLIKMHAADLEKPMVEKQDQSPS---LRT
360 370 380 390 400
390 400 410 420 430 440
pF1KB5 DSREQKLDAFLQPLSKPLS------SQPQAIVTEDKTDISSGRARQQDEEMLELPAPAEV
:.: :. .. : . .: ..:.. : . :. : :: . . .
CCDS53 G--EEKKDVSISRLREAFSLRHTTENKPHSPKTPEPRRSPLGQKRG----MLSSSTSGAI
410 420 430 440 450 460
450 460 470 480 490 500
pF1KB5 AAKNQSLEGDTTKGTSEMSEKRGPTSSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRI
. : : .: ..::.. . : . ..::
CCDS53 SDK-----GVLRPQKEAVSSSHGPSDPTDRAEVEKDSGHGSTSVDSEGFSIPDTGSHCSS
470 480 490 500 510
510 520 530 540 550 560
pF1KB5 INLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELF
CCDS53 EYAASSPGDRGSQEHVDSQEKAPKTDDSFSDVDCHSNQEDTGCKFRVLPQPTNLATPNTK
520 530 540 550 560 570
>>CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429 aa)
initn: 217 init1: 161 opt: 392 Z-score: 401.9 bits: 86.0 E(32554): 4.6e-16
Smith-Waterman score: 414; 26.4% identity (57.1% similar) in 508 aa overlap (7-475:1-489)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
.:. :. : .. .: .:. .. ..:. : .::.. . : :. .. .:
CCDS98 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQ-VQ
10 20 30 40 50
70 80 90 100 110
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAH-VTITTKT
. ::: :. ..:.. : .:. ::: .: .:: . :::::::::.:. .: : :..:
CCDS98 VIDNGFGMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 ADGKCAYRASYSDGK-LKAPPKPCA-GNQGTQITVEDLFYNIATRRKALKNPSEEYGKIL
.. ...:: ::: . .. :: .:: .:::.. .::: . .: :. :.
CCDS98 NRTMKTFVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCM-DPRLEFEKVR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 EVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTV-DNIRSIFGNAVSRELIEIGCEDK
. . :. . .::::.... . . : ::... : . . .:.: . :..: ::. . :
CCDS98 QRIEALSLMHPSISFSLRND-VSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYK
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYISN-ANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYL----PKN----
:...::::. :.:. : . .::.:.::: :.:.: :. . :::
CCDS98 --EFELSGYISSEAHYN--KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTS
240 250 260 270 280
290 300 310 320 330
pF1KB5 ----------THPFLYLSLEISPQ----NVDVNVHPTKHEVHFLHEESILERVQQHIESK
. : :: :. : . :: ..:.: ..: . ...: .:. .
CCDS98 RQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGV---
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB5 LLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSRE---
.:.. : : .. ::: .: . .. : .. . . . :.. .:
CCDS98 -------KMFLKQEKL--FVELSGEDIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACN
350 360 370 380 390
400 410 420 430 440
pF1KB5 QKLDAF----LQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEML--ELPAPAEVAAKN
. ::.. :: . .. . . :... : . : .: . : .:.. .
CCDS98 NILDSYEMFNLQSKAVKRKTTAENVNTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTE
400 410 420 430 440 450
450 460 470 480 490 500
pF1KB5 QSLEG-DTTKGTSEMSEKRGPTSSNP--RKRHREDSDVEMVEDDSRKEMTAACTPRRRII
::.. :.. . :.: :.. ..:. ..:..
CCDS98 PSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTP
460 470 480 490 500 510
510 520 530 540 550 560
pF1KB5 NLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFY
CCDS98 CHFEESGQDLEIWKESTTVNGMAANILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVH
520 530 540 550 560 570
>>CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453 aa)
initn: 217 init1: 161 opt: 392 Z-score: 401.7 bits: 86.0 E(32554): 4.7e-16
Smith-Waterman score: 414; 26.4% identity (57.1% similar) in 508 aa overlap (7-475:1-489)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
.:. :. : .. .: .:. .. ..:. : .::.. . : :. .. .:
CCDS32 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQ-VQ
10 20 30 40 50
70 80 90 100 110
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAH-VTITTKT
. ::: :. ..:.. : .:. ::: .: .:: . :::::::::.:. .: : :..:
CCDS32 VIDNGFGMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 ADGKCAYRASYSDGK-LKAPPKPCA-GNQGTQITVEDLFYNIATRRKALKNPSEEYGKIL
.. ...:: ::: . .. :: .:: .:::.. .::: . .: :. :.
CCDS32 NRTMKTFVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCM-DPRLEFEKVR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 EVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTV-DNIRSIFGNAVSRELIEIGCEDK
. . :. . .::::.... . . : ::... : . . .:.: . :..: ::. . :
CCDS32 QRIEALSLMHPSISFSLRND-VSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYK
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYISN-ANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYL----PKN----
:...::::. :.:. : . .::.:.::: :.:.: :. . :::
CCDS32 --EFELSGYISSEAHYN--KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTS
240 250 260 270 280
290 300 310 320 330
pF1KB5 ----------THPFLYLSLEISPQ----NVDVNVHPTKHEVHFLHEESILERVQQHIESK
. : :: :. : . :: ..:.: ..: . ...: .:. .
CCDS32 RQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGV---
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB5 LLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSRE---
.:.. : : .. ::: .: . .. : .. . . . :.. .:
CCDS32 -------KMFLKQEKL--FVELSGEDIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACN
350 360 370 380 390
400 410 420 430 440
pF1KB5 QKLDAF----LQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEML--ELPAPAEVAAKN
. ::.. :: . .. . . :... : . : .: . : .:.. .
CCDS32 NILDSYEMFNLQSKAVKRKTTAENVNTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTE
400 410 420 430 440 450
450 460 470 480 490 500
pF1KB5 QSLEG-DTTKGTSEMSEKRGPTSSNP--RKRHREDSDVEMVEDDSRKEMTAACTPRRRII
::.. :.. . :.: :.. ..:. ..:..
CCDS32 PSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTP
460 470 480 490 500 510
510 520 530 540 550 560
pF1KB5 NLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFY
CCDS32 CHFEESGQDLEIWKESTTVNGMAANILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVH
520 530 540 550 560 570
>>CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 (770 aa)
initn: 373 init1: 324 opt: 380 Z-score: 393.8 bits: 83.6 E(32554): 1.3e-15
Smith-Waterman score: 434; 27.7% identity (63.8% similar) in 329 aa overlap (8-323:1-326)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS46 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS46 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI
:. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: ::
CCDS46 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDK
... ... . . . .. .. . . . . . . :..:.:: .. . ...
CCDS46 QDLLMSFGILKPDLRIVFVHNKAVIWQKSRVSDHKMA--LMSVLGTAVMNNMESFQYHSE
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYIS--NANYSVKKCIF----LLFINHRLVESTSLRKAIETVYAAYLPKNT--
. ..:.. .:..: . ..::: : :.. .. : :. : :..
CCDS46 ESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIRHHYNLKCLKESTR
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB5 -HPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQT
.: ..:.... .::::. : : .: . ..::.:
CCDS46 LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVLIALENLMTTCYGPLPSTNSYENNK
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB5 LLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQ
CCDS46 TDVSAADIVLSKTAETDVLFNKVESSGKNYSNVDTSVIPFQNDMHNDESGKNTDDCLNHQ
360 370 380 390 400 410
>>CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 (932 aa)
initn: 373 init1: 324 opt: 380 Z-score: 392.4 bits: 83.6 E(32554): 1.5e-15
Smith-Waterman score: 439; 21.7% identity (55.2% similar) in 737 aa overlap (8-727:1-675)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS23 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS23 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI
:. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: ::
CCDS23 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDK
... ... . . . .. .. . . . . . . :..:.:: .. . ...
CCDS23 QDLLMSFGILKPDLRIVFVHNKAVIWQKSRVSDHKMA--LMSVLGTAVMNNMESFQYHSE
180 190 200 210 220 230
240 250 260 270 280
pF1KB5 TLAFKMNGYIS--NANYSVKKCIF----LLFINHRLVESTSLRKAIETVYAAYLPKNT--
. ..:.. .:..: . ..::: : :.. .. : :. : :..
CCDS23 ESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIRHHYNLKCLKESTR
240 250 260 270 280 290
290 300 310 320 330 340
pF1KB5 -HPFLYLSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQT
.: ..:.... .::::. : : .: . ..::.: ..
CCDS23 LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVL-------------------IALEN
300 310 320 330
350 360 370 380 390 400
pF1KB5 LLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQ
:. :: . ::.: ...:. :. . . ..:: .:... .: :.
CCDS23 LMTTCYGP----LPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESS----GKNYSNV
340 350 360 370 380
410 420 430 440 450 460
pF1KB5 PQAIVTEDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKG--TSEMSEKRGPT
... ..:. . .. .. .. :. .: :: : .::.:.
CCDS23 DTSVIPF-QNDMHNDESGKNTDDCLN----------HQISIGDFGYGHCSSEISN----I
390 400 410 420
470 480 490 500 510 520
pF1KB5 SSNPRKRHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREML
..: .. .. : .. ..:. :.. .: ..:: : : ... : . :
CCDS23 DKNTKNAFQDISMSNVSWENSQTEYSKTCF-------ISSVKHTQSENGNKDH--IDESG
430 440 450 460 470
530 540 550 560 570 580
pF1KB5 HNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDL
.:. .: : . :.. .. .:... ..:.. .. .. .. :. .
CCDS23 ENEEEAGLENSSEISADEWSRGNILKNS-VGENIEPVKILVPEKSLPCKVSNNNYPIPEQ
480 490 500 510 520 530
590 600 610 620 630 640
pF1KB5 AMLALDS--PESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLI
: :: .:. .. . : . . . . :: : :. . .. :.. .. ::
CCDS23 MNLNEDSCNKKSNVIDNKSGKVTAYDLLSNRVIKKP-MSASALFVQ-DHRPQF-----LI
540 550 560 570 580 590
650 660 670 680 690 700
pF1KB5 DNYVPPLEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSE
.: :: . : .: .. .:. . :. .:. . : :. : .:: .: ....
CCDS23 ENPKTSLEDATLQIEELWKTLSEEEKLKYEEKATKDLERYNSQMKRAIEQESQMSLKDGR
600 610 620 630 640 650
710 720 730 740 750
pF1KB5 VPGSIPNSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
. ..:. . .: . .: ..
CCDS23 KKIKPTSAWNLAQKHKLKTSLSNQPKLDELLQSQIEKRRSQNIKMVQIPFSMKNLKINFK
660 670 680 690 700 710
>>CCDS46474.1 PMS1 gene_id:5378|Hs108|chr2 (893 aa)
initn: 373 init1: 324 opt: 351 Z-score: 362.8 bits: 78.1 E(32554): 6.9e-14
Smith-Waterman score: 397; 22.6% identity (53.4% similar) in 731 aa overlap (8-727:1-636)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS46 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS46 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRK---ALKNPSEEYGKI
:. . . ..:.. . :: .::: .:. :: :. .:.. . :. ..: ::
CCDS46 ADNFSTQYVLDGSGHILSQ-KPSHLGQGTTVTALRLFKNLPVRKQFYSTAKKCKDEIKKI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 LEVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDK
... .::.. : :. .: .: : .. : :
CCDS46 QDLL---------MSFGILK-----------PD------LRIVF---VHNKIYLSGFLPK
180 190 200
240 250 260 270 280 290
pF1KB5 TLAFKMNGYISNANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYLPKNT---HPFLY
: . .:. . : ..::: : :.. .. : :. : :.. .: ..
CCDS46 CDADHSFTSLSTPERS------FIFINSRPVHQKDILKLIRHHYNLKCLKESTRLYPVFF
210 220 230 240 250
300 310 320 330 340 350
pF1KB5 LSLEISPQNVDVNVHPTKHEVHFLHEESILERVQQHIESKLLGSNSSRMYFTQTLLPGLA
:.... .::::. : : .: . ..::.: ..:.
CCDS46 LKIDVPTADVDVNLTPDKSQVLLQNKESVL-------------------IALENLMTTCY
260 270 280 290
360 370 380 390 400 410
pF1KB5 GPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSREQKLDAFLQPLSKPLSSQPQAIVT
:: . ::.: ...:. :. . . ..:: .:... .: :. ...
CCDS46 GP----LPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESS----GKNYSNVDTSVIP
300 310 320 330 340 350
420 430 440 450 460 470
pF1KB5 EDKTDISSGRARQQDEEMLELPAPAEVAAKNQSLEGDTTKG--TSEMSEKRGPTSSNPRK
..:. . .. .. .. :. .: :: : .::.:. ..: ..
CCDS46 F-QNDMHNDESGKNTDDCLN----------HQISIGDFGYGHCSSEISN----IDKNTKN
360 370 380 390
480 490 500 510 520 530
pF1KB5 RHREDSDVEMVEDDSRKEMTAACTPRRRIINLTSVLSLQEEINEQGHEVLREMLHNHSFV
.. : .. ..:. :.. .: ..:: : : ... : . : .:. .
CCDS46 AFQDISMSNVSWENSQTEYSKTCF-------ISSVKHTQSENGNKDH--IDESGENEEEA
400 410 420 430 440
540 550 560 570 580 590
pF1KB5 GCVNPQWALAQHQTKLYLLNTTKLSEELFYQILIYDFANFGVLRLSEPAPLFDLAMLALD
: : . :.. .. .:... ..:.. .. .. .. :. . : :
CCDS46 GLENSSEISADEWSRGNILKNS-VGENIEPVKILVPEKSLPCKVSNNNYPIPEQMNLNED
450 460 470 480 490 500
600 610 620 630 640
pF1KB5 S--PESGWTEEDGPKEGLAEYIVEFLKKKAEMLADYFSLEIDEEGNLIGLPLLIDNYVPP
: .:. .. . : . . . . :: : :. . .. :.. .. ::.:
CCDS46 SCNKKSNVIDNKSGKVTAYDLLSNRVIKKP-MSASALFVQ-DHRPQF-----LIENPKTS
510 520 530 540 550
650 660 670 680 690 700
pF1KB5 LEGLPIFILRLATEVNWDEEKECFESLSKECAMFYSIRKQYISEESTLSGQQSEVPGSIP
:: . : .: .. .:. . :. .:. . : :. : .:: .: .... .
CCDS46 LEDATLQIEELWKTLSEEEKLKYEEKATKDLERYNSQMKRAIEQESQMSLKDGRKKIKPT
560 570 580 590 600 610
710 720 730 740 750
pF1KB5 NSWKWTVEHIVYKALRSHILPPKHFTEDGNILQLANLPDLYKVFERC
..:. . .: . .: ..
CCDS46 SAWNLAQKHKLKTSLSNQPKLDELLQSQIEKRRSQNIKMVQIPFSMKNLKINFKKQNKVD
620 630 640 650 660 670
>>CCDS82544.1 PMS1 gene_id:5378|Hs108|chr2 (181 aa)
initn: 286 init1: 286 opt: 314 Z-score: 335.7 bits: 70.8 E(32554): 2.2e-12
Smith-Waterman score: 314; 36.6% identity (71.2% similar) in 153 aa overlap (8-159:1-149)
10 20 30 40 50 60
pF1KB5 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
...: ..: ......: ....::.::: ::: .::..: ... :. :.
CCDS82 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIE
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAHVTITTKTA
..::: ::. : .. .. :::..: ::: ...:::::::::.:: .:.: :::.::
CCDS82 VRDNGEGIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTA
60 70 80 90 100 110
130 140 150 160 170
pF1KB5 -DGKCAYRASYSDGKLKAPPKPCAGNQGTQITVEDLFYNIATRRKALKNPSEEYGKILEV
:. . . ..:.. . :: .:: ... :. ::
CCDS82 ADNFSTQYVLDGSGHILSQ-KPSHLGQGKKVA---LYTNILYLFCLNCWFKKKKLLGEYK
120 130 140 150 160
180 190 200 210 220 230
pF1KB5 VGRYSVHNAGISFSVKKQGETVADVRTLPNASTVDNIRSIFGNAVSRELIEIGCEDKTLA
CCDS82 YIALGLVLIKAS
170 180
756 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 17:28:27 2016 done: Tue Nov 8 17:28:28 2016
Total Scan time: 3.650 Total Display time: 0.160
Function used was FASTA [36.3.4 Apr, 2011]