FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2480, 1453 aa
1>>>pF1KE2480 1453 - 1453 aa - 1453 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.5279+/-0.00128; mu= 16.8045+/- 0.076
mean_var=81.2895+/-16.229, 0's: 0 Z-trim(101.7): 37 B-trim: 148 in 1/49
Lambda= 0.142252
statistics sampled from 6616 (6632) to 6616 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.544), E-opt: 0.2 (0.204), width: 16
Scan time: 4.690
The best scores are: opt bits E(32554)
CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453) 9549 1970.6 0
CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429) 7959 1644.3 0
CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 ( 756) 392 91.3 1.2e-17
CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 ( 770) 308 74.1 1.8e-12
CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 ( 932) 308 74.1 2.2e-12
>>CCDS32123.1 MLH3 gene_id:27030|Hs108|chr14 (1453 aa)
initn: 9549 init1: 9549 opt: 9549 Z-score: 10582.1 bits: 1970.6 E(32554): 0
Smith-Waterman score: 9549; 99.9% identity (99.9% similar) in 1453 aa overlap (1-1453:1-1453)
10 20 30 40 50 60
pF1KE2 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQVQVIDNGFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQVQVIDNGFG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 MGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKKNRTMKTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKKNRTMKTF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 VKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCMDPRLEFEKVRQRIEALSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCMDPRLEFEKVRQRIEALSL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 MHPSISFSLRNDVSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYKEFELSGYIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MHPSISFSLRNDVSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYKEFELSGYIS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 SEAHYNKNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTSRQMNSSLRHRSTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SEAHYNKNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTSRQMNSSLRHRSTP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 ELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGVKMFLKQEKLFVELSGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGVKMFLKQEKLFVELSGE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 DIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACNNILDSYEMFNLQSKAVKRKTTAENV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACNNILDSYEMFNLQSKAVKRKTTAENV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 NTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTEPSLQNKDSSCSESKMLEQETIVASE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 NTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTEPSLQNKDSSCSESKMLEQETIVASE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 AGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTPCHFEESGQDLEIWKESTTVNGMAAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 AGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTPCHFEESGQDLEIWKESTTVNGMAAN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 ILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVHSAQTEKEKKKESSNCGRRNVFSYGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVHSAQTEKEKKKESSNCGRRNVFSYGR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 VKLCSTGFITHVVQNEKTKSTETEHSFKNYVRPGPTRAQETFGNRTRHSVETPDIKDLAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VKLCSTGFITHVVQNEKTKSTETEHSFKNYVRPGPTRAQETFGNRTRHSVETPDIKDLAS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 TLSKESGQLPNKKNCRTNISYGLENEPTATYTMFSAFQEGSKKSQTDCILSDTSPSFPWY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 TLSKESGQLPNKKNCRTNISYGLENEPTATYTMFSAFQEGSKKSQTDCILSDTSPSFPWY
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 RHVSNDSRKTDKLIGFSKPIVRKKLSLSSQLGSLEKFKRQYGKVENPLDTEVEESNGVTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RHVSNDSRKTDKLIGFSKPIVRKKLSLSSQLGSLEKFKRQYGKVENPLDTEVEESNGVTT
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 NLSLQVEPDILLKDKNRLENSDVCKITTMEHSDSDSSCQPASHILDSEKFPFSKDEDCLE
:::::::::::::::::::::::::::::::::::::::::::::.::::::::::::::
CCDS32 NLSLQVEPDILLKDKNRLENSDVCKITTMEHSDSDSSCQPASHILNSEKFPFSKDEDCLE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 QQMLSLRESPMTLKELSLFNRKPLDLEKSSESLASKLSRLKGSERETQTMGMMSRFNELP
::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 QQMPSLRESPMTLKELSLFNRKPLDLEKSSESLASKLSRLKGSERETQTMGMMSRFNELP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 NSDSSRKDSKLCSVLTQDFCMLFNNKHEKTENGVIPTSDSATQDNSFNKNSKTHSNSNTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 NSDSSRKDSKLCSVLTQDFCMLFNNKHEKTENGVIPTSDSATQDNSFNKNSKTHSNSNTT
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 ENCVISETPLVLPYNNSKVTGKDSDVLIRASEQQIGSLDSPSGMLMNPVEDATGDQNGIC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ENCVISETPLVLPYNNSKVTGKDSDVLIRASEQQIGSLDSPSGMLMNPVEDATGDQNGIC
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 FQSEESKARACSETEESNTCCSDWQRHFDVALGRMVYVNKMTGLSTFIAPTEDIQAACTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 FQSEESKARACSETEESNTCCSDWQRHFDVALGRMVYVNKMTGLSTFIAPTEDIQAACTK
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 DLTTVAVDVVLENGSQYRCQPFRSDLVLPFLPRARAERTVMRQDNRDTVDDTVSSESLQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DLTTVAVDVVLENGSQYRCQPFRSDLVLPFLPRARAERTVMRQDNRDTVDDTVSSESLQS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 LFSEWDNPVFARYPEVAVDVSSGQAESLAVKIHNILYPYRFTKGMIHSMQVLQQVDNKFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LFSEWDNPVFARYPEVAVDVSSGQAESLAVKIHNILYPYRFTKGMIHSMQVLQQVDNKFI
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 ACLMSTKTEENGEAGGNLLVLVDQHAAHERIRLEQLIIDSYEKQQAQGSGRKKLLSSTLI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ACLMSTKTEENGEAGGNLLVLVDQHAAHERIRLEQLIIDSYEKQQAQGSGRKKLLSSTLI
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE2 PPLEITVTEEQRRLLWCYHKNLEDLGLEFVFPDTSDSLVLVGKVPLCFVEREANELRRGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PPLEITVTEEQRRLLWCYHKNLEDLGLEFVFPDTSDSLVLVGKVPLCFVEREANELRRGR
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KE2 STVTKSIVEEFIREQLELLQTTGGIQGTLPLTVQKVLASQACHGAIKFNDGLSLQESCRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 STVTKSIVEEFIREQLELLQTTGGIQGTLPLTVQKVLASQACHGAIKFNDGLSLQESCRL
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KE2 IEALSSCQLPFQCAHGRPSMLPLADIDHLEQEKQIKPNLTKLRKMAQAWRLFGKAECDTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 IEALSSCQLPFQCAHGRPSMLPLADIDHLEQEKQIKPNLTKLRKMAQAWRLFGKAECDTR
1390 1400 1410 1420 1430 1440
1450
pF1KE2 QSLQQSMPPCEPP
:::::::::::::
CCDS32 QSLQQSMPPCEPP
1450
>>CCDS9837.1 MLH3 gene_id:27030|Hs108|chr14 (1429 aa)
initn: 9384 init1: 7959 opt: 7959 Z-score: 8818.7 bits: 1644.3 E(32554): 0
Smith-Waterman score: 9340; 98.2% identity (98.3% similar) in 1453 aa overlap (1-1453:1-1429)
10 20 30 40 50 60
pF1KE2 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQVQVIDNGFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQVQVIDNGFG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 MGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKKNRTMKTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 MGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKKNRTMKTF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 VKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCMDPRLEFEKVRQRIEALSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 VKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCMDPRLEFEKVRQRIEALSL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 MHPSISFSLRNDVSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYKEFELSGYIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 MHPSISFSLRNDVSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYKEFELSGYIS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 SEAHYNKNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTSRQMNSSLRHRSTP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 SEAHYNKNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTSRQMNSSLRHRSTP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 ELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGVKMFLKQEKLFVELSGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 ELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGVKMFLKQEKLFVELSGE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 DIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACNNILDSYEMFNLQSKAVKRKTTAENV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 DIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACNNILDSYEMFNLQSKAVKRKTTAENV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 NTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTEPSLQNKDSSCSESKMLEQETIVASE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 NTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTEPSLQNKDSSCSESKMLEQETIVASE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 AGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTPCHFEESGQDLEIWKESTTVNGMAAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 AGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTPCHFEESGQDLEIWKESTTVNGMAAN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 ILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVHSAQTEKEKKKESSNCGRRNVFSYGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 ILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVHSAQTEKEKKKESSNCGRRNVFSYGR
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 VKLCSTGFITHVVQNEKTKSTETEHSFKNYVRPGPTRAQETFGNRTRHSVETPDIKDLAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 VKLCSTGFITHVVQNEKTKSTETEHSFKNYVRPGPTRAQETFGNRTRHSVETPDIKDLAS
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 TLSKESGQLPNKKNCRTNISYGLENEPTATYTMFSAFQEGSKKSQTDCILSDTSPSFPWY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 TLSKESGQLPNKKNCRTNISYGLENEPTATYTMFSAFQEGSKKSQTDCILSDTSPSFPWY
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 RHVSNDSRKTDKLIGFSKPIVRKKLSLSSQLGSLEKFKRQYGKVENPLDTEVEESNGVTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 RHVSNDSRKTDKLIGFSKPIVRKKLSLSSQLGSLEKFKRQYGKVENPLDTEVEESNGVTT
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 NLSLQVEPDILLKDKNRLENSDVCKITTMEHSDSDSSCQPASHILDSEKFPFSKDEDCLE
:::::::::::::::::::::::::::::::::::::::::::::.::::::::::::::
CCDS98 NLSLQVEPDILLKDKNRLENSDVCKITTMEHSDSDSSCQPASHILNSEKFPFSKDEDCLE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 QQMLSLRESPMTLKELSLFNRKPLDLEKSSESLASKLSRLKGSERETQTMGMMSRFNELP
::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 QQMPSLRESPMTLKELSLFNRKPLDLEKSSESLASKLSRLKGSERETQTMGMMSRFNELP
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 NSDSSRKDSKLCSVLTQDFCMLFNNKHEKTENGVIPTSDSATQDNSFNKNSKTHSNSNTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 NSDSSRKDSKLCSVLTQDFCMLFNNKHEKTENGVIPTSDSATQDNSFNKNSKTHSNSNTT
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 ENCVISETPLVLPYNNSKVTGKDSDVLIRASEQQIGSLDSPSGMLMNPVEDATGDQNGIC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 ENCVISETPLVLPYNNSKVTGKDSDVLIRASEQQIGSLDSPSGMLMNPVEDATGDQNGIC
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 FQSEESKARACSETEESNTCCSDWQRHFDVALGRMVYVNKMTGLSTFIAPTEDIQAACTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 FQSEESKARACSETEESNTCCSDWQRHFDVALGRMVYVNKMTGLSTFIAPTEDIQAACTK
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 DLTTVAVDVVLENGSQYRCQPFRSDLVLPFLPRARAERTVMRQDNRDTVDDTVSSESLQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 DLTTVAVDVVLENGSQYRCQPFRSDLVLPFLPRARAERTVMRQDNRDTVDDTVSSESLQS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 LFSEWDNPVFARYPEVAVDVSSGQAESLAVKIHNILYPYRFTKGMIHSMQVLQQVDNKFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 LFSEWDNPVFARYPEVAVDVSSGQAESLAVKIHNILYPYRFTKGMIHSMQVLQQVDNKFI
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 ACLMSTKTEENGEAGGNLLVLVDQHAAHERIRLEQLIIDSYEKQQAQGSGRKKLLSSTLI
:::::::::::::: ::::::::::::::::::::::
CCDS98 ACLMSTKTEENGEA------------------------DSYEKQQAQGSGRKKLLSSTLI
1210 1220 1230
1270 1280 1290 1300 1310 1320
pF1KE2 PPLEITVTEEQRRLLWCYHKNLEDLGLEFVFPDTSDSLVLVGKVPLCFVEREANELRRGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 PPLEITVTEEQRRLLWCYHKNLEDLGLEFVFPDTSDSLVLVGKVPLCFVEREANELRRGR
1240 1250 1260 1270 1280 1290
1330 1340 1350 1360 1370 1380
pF1KE2 STVTKSIVEEFIREQLELLQTTGGIQGTLPLTVQKVLASQACHGAIKFNDGLSLQESCRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 STVTKSIVEEFIREQLELLQTTGGIQGTLPLTVQKVLASQACHGAIKFNDGLSLQESCRL
1300 1310 1320 1330 1340 1350
1390 1400 1410 1420 1430 1440
pF1KE2 IEALSSCQLPFQCAHGRPSMLPLADIDHLEQEKQIKPNLTKLRKMAQAWRLFGKAECDTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS98 IEALSSCQLPFQCAHGRPSMLPLADIDHLEQEKQIKPNLTKLRKMAQAWRLFGKAECDTR
1360 1370 1380 1390 1400 1410
1450
pF1KE2 QSLQQSMPPCEPP
:::::::::::::
CCDS98 QSLQQSMPPCEPP
1420
>>CCDS2663.1 MLH1 gene_id:4292|Hs108|chr3 (756 aa)
initn: 217 init1: 161 opt: 392 Z-score: 430.6 bits: 91.3 E(32554): 1.2e-17
Smith-Waterman score: 414; 26.4% identity (57.1% similar) in 508 aa overlap (1-489:7-475)
10 20 30 40 50
pF1KE2 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETFQ-VQ
.:. :. : .. .: .:. .. ..:. : .::.. . : :. .. .:
CCDS26 MSFVAGVIRRLDETVVNRIAAGEVIQRPANAIKEMIENCLDAKSTSIQVIVKEGGLKLIQ
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 VIDNGFGMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKK
. ::: :. ..:.. : .:. ::: .: .:: . :::::::::.:. .: : :..:
CCDS26 IQDNGTGIRKEDLDIVCERFTTSKLQSFEDLASISTYGFRGEALASISHVAH-VTITTKT
70 80 90 100 110
120 130 140 150 160 170
pF1KE2 NRTMKTFVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRRKCM-DPRLEFEKVR
.. ...:: ::: . .. :: .:: .:::.. .::: . .: :. :.
CCDS26 ADGKCAYRASYSDGK-LKAPPKPCA-GNQGTQITVEDLFYNIATRRKALKNPSEEYGKIL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 QRIEALSLMHPSISFSLRND-VSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYK
. . :. . .::::.... . . : ::... : . . .:.: . :..: ::. . :
CCDS26 EVVGRYSVHNAGISFSVKKQGETVADVRTLPNASTV-DNIRSIFGNAVSRELIEIGCEDK
180 190 200 210 220 230
240 250 260 270 280
pF1KE2 E--FELSGYISSEAHYN--KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKPKNGPTS
:...::::. :.:. : . .::.:.::: :.:.: :. . :::
CCDS26 TLAFKMNGYISN-ANYSVKKCIFLLFINHRLVESTSLRKAIETVYAAYL----PKN----
240 250 260 270 280
290 300 310 320 330 340
pF1KE2 RQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQEGV---
. : :: :. : . :: ..:.: ..: . ...: .:. .
CCDS26 ----------THPFLYLSLEISPQ----NVDVNVHPTKHEVHFLHEESILERVQQHIESK
290 300 310 320 330
350 360 370 380 390
pF1KE2 -------KMFLKQEKL--FVELSGEDIKEFSEDNGFSLFDATLQKRVTSDERSNFQEACN
.:.. : : .. ::: .: . .. : .. . . . :.. .:
CCDS26 LLGSNSSRMYFTQTLLPGLAGPSGEMVKSTTSLTSSSTSGSSDKVYAHQMVRTDSRE---
340 350 360 370 380 390
400 410 420 430 440 450
pF1KE2 NILDSYEMFNLQSKAVKRKTTAENVNTQSSRDSEATRKNTNDAFLYIYESGGPGHSKMTE
. ::.. :: . .. . . :... : . : .: . : .:.. .
CCDS26 QKLDAF----LQPLSKPLSSQPQAIVTEDKTDISSGRARQQDEEM--LELPAPAEVAAKN
400 410 420 430 440
460 470 480 490 500 510
pF1KE2 PSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSSLENPCGTSLEMFLSPFQTP
::.. :.. . :.: :.. ..:. ..:..
CCDS26 QSLEG-DTTKGTSEMSEKRGPTSSNP--RKRHREDSDVEMVEDDSRKEMTAACTPRRRII
450 460 470 480 490 500
520 530 540 550 560 570
pF1KE2 CHFEESGQDLEIWKESTTVNGMAANILKNNRIQNQPKRFKDATEVGCQPLPFATTLWGVH
CCDS26 NLTSVLSLQEEINEQGHEVLREMLHNHSFVGCVNPQWALAQHQTKLYLLNTTKLSEELFY
510 520 530 540 550 560
>>CCDS46473.1 PMS1 gene_id:5378|Hs108|chr2 (770 aa)
initn: 251 init1: 152 opt: 308 Z-score: 337.3 bits: 74.1 E(32554): 1.8e-12
Smith-Waterman score: 361; 25.5% identity (53.1% similar) in 631 aa overlap (13-587:12-597)
10 20 30 40 50
pF1KE2 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETF-QVQVIDNGF
: :. :.:. . :.:: ::.:: : : :... : ...: :::
CCDS46 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIEVRDNGE
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 GMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKKNRTMKT
:. . :. .. .:.::: .: .:::: ::::::::..: .: .. . ...:
CCDS46 GIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTAADNFST
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 FVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRR-------KCMDPRLEFEKVR
: ::. :. . . . :::::. :: .::::. :: : :..:..
CCDS46 QYVLDGSGHILSQKPSHL---GQGTTVTALRLFKNLPVRKQFYSTAKKCKD---EIKKIQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 QRIEALSLMHPSISFSLRNDVSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYKE
. . ......:.. . . .. ... : ...: . .. : . .... ::.:.
CCDS46 DLLMSFGILKPDLRIVFVHN--KAVIWQKSRVSDHKMALMSVLGTAVMNNME--SFQYHS
180 190 200 210 220
240 250 260 270 280
pF1KE2 FE----LSGYISS-EAHYN------KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKP
: :::.. . .: .. . .:.:.:.: : . . ::: .. .. :
CCDS46 EESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIR---HHYNLKC--
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE2 KNGPTSRQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQ
.. : : :: .. .... . :: . : :. . .:: ...:. .
CCDS46 --------LKESTR------LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVLIAL-
290 300 310 320
350 360 370 380 390
pF1KE2 EGVKMFLKQEKLFVELSGEDIKEFSEDNG---FSLFDATLQKRVTSDERSNFQEAC----
:.:.. : . : .:. : : .:.: . .: : :.
CCDS46 ---------ENLMTTCYGPLPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESSGKNY
330 340 350 360 370 380
400 410 420 430 440
pF1KE2 NNILDSYEMF-NLQSKAVKRKTTAENVNTQSSR--------DSEATR--KNTNDAFLYIY
.:. : : : . . . :.: . .: : : .:: . :::..:: :
CCDS46 SNVDTSVIPFQNDMHNDESGKNTDDCLNHQISIGDFGYGHCSSEISNIDKNTKNAFQDIS
390 400 410 420 430 440
450 460 470 480 490
pF1KE2 ESGGPGHSKMTEPSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSS-------
:. ....:: : :: .... . . .:.::::. .. ::.::
CCDS46 MSNVSWENSQTEYSKTCFISSVKHTQSENGNKDHIDESGENEE--EAGLENSSEISADEW
450 460 470 480 490
500 510 520 530 540
pF1KE2 -----LENPCGTSLE--MFLSPFQT-PCHFEESGQDLEIWKESTTVNGMAANILKNNRIQ
:.: : ..: .: : .. ::. :... : :. ..: . : :.: :.
CCDS46 SRGNILKNSVGENIEPVKILVPEKSLPCKV--SNNNYPI-PEQMNLNEDSCNK-KSNVID
500 510 520 530 540 550
550 560 570 580 590 600
pF1KE2 NQPKRFKD----ATEVGCQPLPFATTLWGVHSAQTEKEKKKESSNCGRRNVFSYGRVKLC
:. . ...: .:. .. . : : :. : :
CCDS46 NKSGKVTAYDLLSNRVIKKPMSASALFVQDHRPQFLIENPKTSLEDATLQIEELWKTLSE
560 570 580 590 600 610
610 620 630 640 650 660
pF1KE2 STGFITHVVQNEKTKSTETEHSFKNYVRPGPTRAQETFGNRTRHSVETPDIKDLASTLSK
CCDS46 EEKLNLFNGSHYLDVLYKMTADDQRYSGSTYLSDPRLTANGFKIKLIPGVSITENYLEIE
620 630 640 650 660 670
>>CCDS2302.1 PMS1 gene_id:5378|Hs108|chr2 (932 aa)
initn: 251 init1: 152 opt: 308 Z-score: 335.9 bits: 74.1 E(32554): 2.2e-12
Smith-Waterman score: 361; 25.5% identity (53.1% similar) in 631 aa overlap (13-587:12-597)
10 20 30 40 50
pF1KE2 MIKCLSVEVQAKLRSGLAISSLGQCVEELALNSIDAEAKCVAVRVNMETF-QVQVIDNGF
: :. :.:. . :.:: ::.:: : : :... : ...: :::
CCDS23 MKQLPAATVRLLSSSQIITSVVSVVKELIENSLDAGATSVDVKLENYGFDKIEVRDNGE
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 GMGSDDVEKVGNRYFTSKCHSVQDLENPRFYGFRGEALANIADMASAVEISSKKNRTMKT
:. . :. .. .:.::: .: .:::: ::::::::..: .: .. . ...:
CCDS23 GIKAVDAPVMAMKYYTSKINSHEDLENLTTYGFRGEALGSICCIAEVLITTRTAADNFST
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 FVKLFQSGKALKACEADVTRASAGTTVTVYNLFYQLPVRR-------KCMDPRLEFEKVR
: ::. :. . . . :::::. :: .::::. :: : :..:..
CCDS23 QYVLDGSGHILSQKPSHL---GQGTTVTALRLFKNLPVRKQFYSTAKKCKD---EIKKIQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 QRIEALSLMHPSISFSLRNDVSGSMVLQLPKTKDVCSRFCQIYGLGKSQKLREISFKYKE
. . ......:.. . . .. ... : ...: . .. : . .... ::.:.
CCDS23 DLLMSFGILKPDLRIVFVHN--KAVIWQKSRVSDHKMALMSVLGTAVMNNME--SFQYHS
180 190 200 210 220
240 250 260 270 280
pF1KE2 FE----LSGYISS-EAHYN------KNMQFLFVNKRLVLRTKLHKLIDFLLRKESIICKP
: :::.. . .: .. . .:.:.:.: : . . ::: .. .. :
CCDS23 EESQIYLSGFLPKCDADHSFTSLSTPERSFIFINSRPVHQKDILKLIR---HHYNLKC--
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE2 KNGPTSRQMNSSLRHRSTPELYGIYVINVQCQFCEYDVCMEPAKTLIEFQNWDTLLFCIQ
.. : : :: .. .... . :: . : :. . .:: ...:. .
CCDS23 --------LKESTR------LYPVFFLKIDVPTADVDVNLTPDKSQVLLQNKESVLIAL-
290 300 310 320
350 360 370 380 390
pF1KE2 EGVKMFLKQEKLFVELSGEDIKEFSEDNG---FSLFDATLQKRVTSDERSNFQEAC----
:.:.. : . : .:. : : .:.: . .: : :.
CCDS23 ---------ENLMTTCYGPLPSTNSYENNKTDVSAADIVLSKTAETDVLFNKVESSGKNY
330 340 350 360 370 380
400 410 420 430 440
pF1KE2 NNILDSYEMF-NLQSKAVKRKTTAENVNTQSSR--------DSEATR--KNTNDAFLYIY
.:. : : : . . . :.: . .: : : .:: . :::..:: :
CCDS23 SNVDTSVIPFQNDMHNDESGKNTDDCLNHQISIGDFGYGHCSSEISNIDKNTKNAFQDIS
390 400 410 420 430 440
450 460 470 480 490
pF1KE2 ESGGPGHSKMTEPSLQNKDSSCSESKMLEQETIVASEAGENEKHKKSFLEHSS-------
:. ....:: : :: .... . . .:.::::. .. ::.::
CCDS23 MSNVSWENSQTEYSKTCFISSVKHTQSENGNKDHIDESGENEE--EAGLENSSEISADEW
450 460 470 480 490
500 510 520 530 540
pF1KE2 -----LENPCGTSLE--MFLSPFQT-PCHFEESGQDLEIWKESTTVNGMAANILKNNRIQ
:.: : ..: .: : .. ::. :... : :. ..: . : :.: :.
CCDS23 SRGNILKNSVGENIEPVKILVPEKSLPCKV--SNNNYPI-PEQMNLNEDSCNK-KSNVID
500 510 520 530 540 550
550 560 570 580 590 600
pF1KE2 NQPKRFKD----ATEVGCQPLPFATTLWGVHSAQTEKEKKKESSNCGRRNVFSYGRVKLC
:. . ...: .:. .. . : : :. : :
CCDS23 NKSGKVTAYDLLSNRVIKKPMSASALFVQDHRPQFLIENPKTSLEDATLQIEELWKTLSE
560 570 580 590 600 610
610 620 630 640 650 660
pF1KE2 STGFITHVVQNEKTKSTETEHSFKNYVRPGPTRAQETFGNRTRHSVETPDIKDLASTLSK
CCDS23 EEKLKYEEKATKDLERYNSQMKRAIEQESQMSLKDGRKKIKPTSAWNLAQKHKLKTSLSN
620 630 640 650 660 670
1453 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 20:44:45 2016 done: Mon Nov 7 20:44:46 2016
Total Scan time: 4.690 Total Display time: 0.170
Function used was FASTA [36.3.4 Apr, 2011]