FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4594, 1235 aa
1>>>pF1KE4594 1235 - 1235 aa - 1235 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.5458+/-0.00108; mu= 15.9560+/- 0.066
mean_var=81.2320+/-15.922, 0's: 0 Z-trim(104.0): 27 B-trim: 0 in 0/51
Lambda= 0.142302
statistics sampled from 7649 (7659) to 7649 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.579), E-opt: 0.2 (0.235), width: 16
Scan time: 4.780
The best scores are: opt bits E(32554)
CCDS14190.1 PHKA2 gene_id:5256|Hs108|chrX (1235) 8157 1685.2 0
CCDS14421.1 PHKA1 gene_id:5255|Hs108|chrX (1223) 4775 990.9 0
CCDS48137.1 PHKA1 gene_id:5255|Hs108|chrX (1210) 4749 985.6 0
CCDS55453.1 PHKA1 gene_id:5255|Hs108|chrX (1151) 3387 706.0 1.4e-202
CCDS42161.1 PHKB gene_id:5257|Hs108|chr16 (1086) 1284 274.2 1.2e-72
CCDS10729.1 PHKB gene_id:5257|Hs108|chr16 (1093) 1284 274.2 1.3e-72
>>CCDS14190.1 PHKA2 gene_id:5256|Hs108|chrX (1235 aa)
initn: 8157 init1: 8157 opt: 8157 Z-score: 9042.3 bits: 1685.2 E(32554): 0
Smith-Waterman score: 8157; 99.8% identity (100.0% similar) in 1235 aa overlap (1-1235:1-1235)
10 20 30 40 50 60
pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV
::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::::
CCDS14 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDQHHFYLALDNEMIV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE4 DHYINHLLQSTSLRSYLPPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 DHYINHLLQSTSLRSYLPPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPT
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE4 KVLSAHRKSLNLVDSPQPLLEKVPESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQADIL
:::::::::::::::::::::::::::::::::::.::::::::::::::::::::::::
CCDS14 KVLSAHRKSLNLVDSPQPLLEKVPESDFQWPRDDHGDVDCEKLVEQLKDCSNLQDQADIL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE4 YILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 YILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE4 CTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVVYLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVVYLAM
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE4 YVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 YVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE4 GKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQF
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE4 FSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 FSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRV
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE4 PVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEYRQLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEYRQLL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE4 VEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFF
1150 1160 1170 1180 1190 1200
1210 1220 1230
pF1KE4 YDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ
:::::::::::::::::::::::::::::::::::
CCDS14 YDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ
1210 1220 1230
>>CCDS14421.1 PHKA1 gene_id:5255|Hs108|chrX (1223 aa)
initn: 5515 init1: 3572 opt: 4775 Z-score: 5289.9 bits: 990.9 E(32554): 0
Smith-Waterman score: 5624; 68.9% identity (88.4% similar) in 1241 aa overlap (1-1235:1-1223)
10 20 30 40 50 60
pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA
::::::::::::::::::::::::.:::::::: ::..:::::::::.::::::::::.:
CCDS14 MRSRSNSGVRLDGYARLVQQTILCHQNPVTGLLPASYDQKDAWVRDNVYSILAVWGLGLA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT
:::::::::::::::::::.:::::::::.::.::: :::.::..::::::::::::: :
CCDS14 YRKNADRDEDKAKAYELEQSVVKLMRGLLHCMIRQVDKVESFKYSQSTKDSLHAKYNTKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD
:.::::::::::::.::::..::::::::::::.:: .:::: ::::::::::::::.::
CCDS14 CATVVGDDQWGHLQLDATSVYLLFLAQMTASGLHIIHSLDEVNFIQNLVFYIEAAYKTAD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS
.:.::::::::::: ::::::::::::::::.:::::::..:: .:::::: :::.::::
CCDS14 FGIWERGDKTNQGISELNASSVGMAKAALEALDELDLFGVKGGPQSVIHVLADEVQHCQS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG
:: :.:::::::::.::.:::..::::::::: .::..::.:::.:::::::::::::::
CCDS14 ILNSLLPRASTSKEVDASLLSVVSFPAFAVEDSQLVELTKQEIITKLQGRYGCCRFLRDG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI
::::.::::::.:.:::::::::::::::.::::::.::::::.: :::::.::::..::
CCDS14 YKTPKEDPNRLYYEPAELKLFENIECEWPLFWTYFILDGVFSGNAEQVQEYKEALEAVLI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA
.::::. :.::::.:::..:::::.::::::::::::.::.::::::::.::.::::::
CCDS14 KGKNGVPLLPELYSVPPDRVDEEYQNPHTVDRVPMGKLPHMWGQSLYILGSLMAEGFLAP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS
:::::::::::: ::::::::..:::...:: .:. .:. :..::...::.:::.::::
CCDS14 GEIDPLNRRFSTVPKPDVVVQVSILAETEEIKTILKDKGIYVETIAEVYPIRVQPARILS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV
:::..:: :. :.::::::::.::::::::: ::. :::::::: :...:::::::.:::
CCDS14 HIYSSLGCNNRMKLSGRPYRHMGVLGTSKLYDIRKTIFTFTPQFIDQQQFYLALDNKMIV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK
:::: .:.:::. :::::.::.:::::..:: .::....:..:...::..:::::::::.
CCDS14 EMLRTDLSYLCSRWRMTGQPTITFPISHSMLDEDGTSLNSSILAALRKMQDGYFGGARVQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL
:.:::::::: :.:.:.:: . ::... . ... ... .. ..: . . ::.
CCDS14 TGKLSEFLTTSCCTHLSFMDPGPEGKLYSEDYDDNYDYLESGNWMNDYDSTSHARCGDEV
610 620 630 640 650 660
670 680 690 700 710
pF1KE4 DHYINHLLQSTSLRSYLPPLC-KNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLP
.:..::: :. . : : :. :: .:...: :..:...::: :.: : : ::
CCDS14 ARYLDHLLAHTAPHPKLAPTSQKGGLDRFQ-AAVQTTCDLMSLVTKAKELHVQNVHMYLP
670 680 690 700 710
720 730 740 750 760 770
pF1KE4 TKVLSAHRKSLNLVDSPQPLLE-KVP--ESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQ
::...: : :.::.:::.: : .:: . ... :::. ..:: . :: :::. :.::.:
CCDS14 TKLFQASRPSFNLLDSPHPRQENQVPSVRVEIHLPRDQSGEVDFKALVLQLKETSSLQEQ
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE4 ADILYILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEV
:::::.::..:::.:.:.: .....::..:: :::::.: ..:::::::::.::::::.
CCDS14 ADILYMLYTMKGPDWNTELYNERSATVRELLTELYGKVGEIRHWGLIRYISGILRKKVEA
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE4 LAEACTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVV
: :::::::::::.:::::::::::: :::::: : ::.:: ::: :.::..:::::.:
CCDS14 LDEACTDLLSHQKHLTVGLPPEPREKTISAPLPYEALTQLIDEASEGDMSISILTQEIMV
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE4 YLAMYVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLH
:::::.:.::.::.::.::::::::::::::::.:: ::.:::.:.:::::: ::::::
CCDS14 YLAMYMRTQPGLFAEMFRLRIGLIIQVMATELAHSLRCSAEEATEGLMNLSPSAMKNLLH
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KE4 HILSGKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMT-RRFS
:::::::::::::::: :..: :.:::::.: .:.:::::.:: .:.::.::. ::.:
CCDS14 HILSGKEFGVERSVRPTDSNVS-PAISIHEIGAVGATKTERTGIMQLKSEIKQVEFRRLS
960 970 980 990 1000 1010
1020 1030 1040 1050 1060 1070
pF1KE4 ADEQFFSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDG
. . : : . . :. .: ::. ::.:: ::::: :::::::
CCDS14 ISAESQSPGTSMTPSS-------GSFPSAYDQQSSKDS---------RQGQWQRRRRLDG
1020 1030 1040 1050 1060
1080 1090 1100 1110 1120 1130
pF1KE4 AINRVPVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPE
:.:::::::::.:::.::::::::..:.:::::::::::: ::::.::::::::::::::
CCDS14 ALNRVPVGFYQKVWKVLQKCHGLSVEGFVLPSSTTREMTPGEIKFSVHVESVLNRVPQPE
1070 1080 1090 1100 1110 1120
1140 1150 1160 1170 1180 1190
pF1KE4 YRQLLVEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDT-LEKDQAT
:::::::::.:::.:.: :. :::.:: :..::..:..::::.: ..:: :: : :: :.
CCDS14 YRQLLVEAILVLTMLADIEIHSIGSIIAVEKIVHIANDLFLQEQKTLGADDTMLAKDPAS
1130 1140 1150 1160 1170 1180
1200 1210 1220 1230
pF1KE4 GICHFFYDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ
::: ..::::::: .::::::..:.:.:.::.::.: : ::
CCDS14 GICTLLYDSAPSGRFGTMTYLSKAAATYVQEFLPHSICAMQ
1190 1200 1210 1220
>>CCDS48137.1 PHKA1 gene_id:5255|Hs108|chrX (1210 aa)
initn: 5482 init1: 3572 opt: 4749 Z-score: 5261.2 bits: 985.6 E(32554): 0
Smith-Waterman score: 5589; 68.7% identity (87.9% similar) in 1240 aa overlap (1-1235:1-1210)
10 20 30 40 50 60
pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA
::::::::::::::::::::::::.:::::::: ::..:::::::::.::::::::::.:
CCDS48 MRSRSNSGVRLDGYARLVQQTILCHQNPVTGLLPASYDQKDAWVRDNVYSILAVWGLGLA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT
:::::::::::::::::::.:::::::::.::.::: :::.::..::::::::::::: :
CCDS48 YRKNADRDEDKAKAYELEQSVVKLMRGLLHCMIRQVDKVESFKYSQSTKDSLHAKYNTKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD
:.::::::::::::.::::..::::::::::::.:: .:::: ::::::::::::::.::
CCDS48 CATVVGDDQWGHLQLDATSVYLLFLAQMTASGLHIIHSLDEVNFIQNLVFYIEAAYKTAD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS
.:.::::::::::: ::::::::::::::::.:::::::..:: .:::::: :::.::::
CCDS48 FGIWERGDKTNQGISELNASSVGMAKAALEALDELDLFGVKGGPQSVIHVLADEVQHCQS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG
:: :.:::::::::.::.:::..::::::::: .::..::.:::.:::::::::::::::
CCDS48 ILNSLLPRASTSKEVDASLLSVVSFPAFAVEDSQLVELTKQEIITKLQGRYGCCRFLRDG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI
::::.::::::.:.:::::::::::::::.::::::.::::::.: :::::.::::..::
CCDS48 YKTPKEDPNRLYYEPAELKLFENIECEWPLFWTYFILDGVFSGNAEQVQEYKEALEAVLI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA
.::::. :.::::.:::..:::::.::::::::::::.::.::::::::.::.::::::
CCDS48 KGKNGVPLLPELYSVPPDRVDEEYQNPHTVDRVPMGKLPHMWGQSLYILGSLMAEGFLAP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS
:::::::::::: ::::::::..:::...:: .:. .:. :..::...::.:::.::::
CCDS48 GEIDPLNRRFSTVPKPDVVVQVSILAETEEIKTILKDKGIYVETIAEVYPIRVQPARILS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV
:::..:: :. :.::::::::.::::::::: ::. :::::::: :...:::::::.:::
CCDS48 HIYSSLGCNNRMKLSGRPYRHMGVLGTSKLYDIRKTIFTFTPQFIDQQQFYLALDNKMIV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK
:::: .:.:::. :::::.::.:::::..:: .::....:..:...::..:::::::::.
CCDS48 EMLRTDLSYLCSRWRMTGQPTITFPISHSMLDEDGTSLNSSILAALRKMQDGYFGGARVQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL
:.:::::::: :.:.:.:: . ::... . ... ... .. ..: . . ::.
CCDS48 TGKLSEFLTTSCCTHLSFMDPGPEGKLYSEDYDDNYDYLESGNWMNDYDSTSHARCGDEV
610 620 630 640 650 660
670 680 690 700 710
pF1KE4 DHYINHLLQSTSLRSYLPPLC-KNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLP
.:..::: :. . : : :. :: .:...: :..:...::: :.: : : ::
CCDS48 ARYLDHLLAHTAPHPKLAPTSQKGGLDRFQ-AAVQTTCDLMSLVTKAKELHVQNVHMYLP
670 680 690 700 710
720 730 740 750 760 770
pF1KE4 TKVLSAHRKSLNLVDSPQPLLE-KVP--ESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQ
::...: : :.::.:::.: : .:: . ... :::. ..:: . :: :::. :.::.:
CCDS48 TKLFQASRPSFNLLDSPHPRQENQVPSVRVEIHLPRDQSGEVDFKALVLQLKETSSLQEQ
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE4 ADILYILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEV
:::::.::..:::.:.:.: .....::..:: :::::.: ..:::::::::.::::::.
CCDS48 ADILYMLYTMKGPDWNTELYNERSATVRELLTELYGKVGEIRHWGLIRYISGILRKKVEA
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE4 LAEACTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVV
: :::::::::::.:::::::::::: :::::: : ::.:: ::: :.::..:::::.:
CCDS48 LDEACTDLLSHQKHLTVGLPPEPREKTISAPLPYEALTQLIDEASEGDMSISILTQEIMV
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE4 YLAMYVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLH
:::::.:.::.::.::.::::::::::::::::.:: ::.:::.:.:::::: ::::::
CCDS48 YLAMYMRTQPGLFAEMFRLRIGLIIQVMATELAHSLRCSAEEATEGLMNLSPSAMKNLLH
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KE4 HILSGKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSA
:::::::::::::::: :..: :.:::::.: .:.:::::.:: .:.::.::
CCDS48 HILSGKEFGVERSVRPTDSNVS-PAISIHEIGAVGATKTERTGIMQLKSEIKQ-------
960 970 980 990 1000 1010
1020 1030 1040 1050 1060 1070
pF1KE4 DEQFFSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGA
: : . . :. .: ::. ::.:: ::::: ::::::::
CCDS48 -----SPGTSMTPSS-------GSFPSAYDQQSSKDS---------RQGQWQRRRRLDGA
1020 1030 1040 1050
1080 1090 1100 1110 1120 1130
pF1KE4 INRVPVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEY
.:::::::::.:::.::::::::..:.:::::::::::: ::::.:::::::::::::::
CCDS48 LNRVPVGFYQKVWKVLQKCHGLSVEGFVLPSSTTREMTPGEIKFSVHVESVLNRVPQPEY
1060 1070 1080 1090 1100 1110
1140 1150 1160 1170 1180 1190
pF1KE4 RQLLVEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDT-LEKDQATG
::::::::.:::.:.: :. :::.:: :..::..:..::::.: ..:: :: : :: :.:
CCDS48 RQLLVEAILVLTMLADIEIHSIGSIIAVEKIVHIANDLFLQEQKTLGADDTMLAKDPASG
1120 1130 1140 1150 1160 1170
1200 1210 1220 1230
pF1KE4 ICHFFYDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ
:: ..::::::: .::::::..:.:.:.::.::.: : ::
CCDS48 ICTLLYDSAPSGRFGTMTYLSKAAATYVQEFLPHSICAMQ
1180 1190 1200 1210
>>CCDS55453.1 PHKA1 gene_id:5255|Hs108|chrX (1151 aa)
initn: 5383 init1: 3387 opt: 3387 Z-score: 3750.3 bits: 706.0 E(32554): 1.4e-202
Smith-Waterman score: 5403; 68.0% identity (85.1% similar) in 1239 aa overlap (1-1235:1-1151)
10 20 30 40 50 60
pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA
::::::::::::::::::::::::.:::::::: ::..:::::::::.::::::::::.:
CCDS55 MRSRSNSGVRLDGYARLVQQTILCHQNPVTGLLPASYDQKDAWVRDNVYSILAVWGLGLA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT
:::::::::::::::::::.:::::::::.::.::: :::.::..::::::::::::: :
CCDS55 YRKNADRDEDKAKAYELEQSVVKLMRGLLHCMIRQVDKVESFKYSQSTKDSLHAKYNTKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD
:.::::::::::::.::::..::::::::::::.:: .:::: ::::::::::::::.::
CCDS55 CATVVGDDQWGHLQLDATSVYLLFLAQMTASGLHIIHSLDEVNFIQNLVFYIEAAYKTAD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS
.:.::::::::::: ::::::::::::::::.:::::::..:: .:::::: :::.::::
CCDS55 FGIWERGDKTNQGISELNASSVGMAKAALEALDELDLFGVKGGPQSVIHVLADEVQHCQS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG
:: :.:::::::::.::.:::..::::::::: .::..::.:::.:::::::::::::::
CCDS55 ILNSLLPRASTSKEVDASLLSVVSFPAFAVEDSQLVELTKQEIITKLQGRYGCCRFLRDG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI
::::.::::::.:.:::::::::::::::.::::::.::::::.: :::::.::::..::
CCDS55 YKTPKEDPNRLYYEPAELKLFENIECEWPLFWTYFILDGVFSGNAEQVQEYKEALEAVLI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA
.::::. :.::::.:::..:::::.::::::::::::.::.::::::::.::.::::::
CCDS55 KGKNGVPLLPELYSVPPDRVDEEYQNPHTVDRVPMGKLPHMWGQSLYILGSLMAEGFLAP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS
:::::::::::: ::::::::..:::...:: .:. .:. :..::...::.:::.::::
CCDS55 GEIDPLNRRFSTVPKPDVVVQVSILAETEEIKTILKDKGIYVETIAEVYPIRVQPARILS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV
:::..:: :. :.::::::::.::::::::: ::. :::::::: :...:::::::.:::
CCDS55 HIYSSLGCNNRMKLSGRPYRHMGVLGTSKLYDIRKTIFTFTPQFIDQQQFYLALDNKMIV
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK
:::: .:.:::. :::::.::.:::::..:: .::....:..:...::..:::::::::.
CCDS55 EMLRTDLSYLCSRWRMTGQPTITFPISHSMLDEDGTSLNSSILAALRKMQDGYFGGARVQ
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL
:.:::::::: :.:.:.:: . ::. : : : : ::: : . .
CCDS55 TGKLSEFLTTSCCTHLSFMDPGPEGKLY--------SEDYD-DNYDYLE------SGNWM
610 620 630 640
670 680 690 700 710 720
pF1KE4 DHYINHLLQSTSLRSYLPPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPT
. : .::: .: :.. :::
CCDS55 NDY-----DSTS------------HDVHMY---------------------------LPT
650 660
730 740 750 760 770
pF1KE4 KVLSAHRKSLNLVDSPQPLLE-KVP--ESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQA
:...: : :.::.:::.: : .:: . ... :::. ..:: . :: :::. :.::.::
CCDS55 KLFQASRPSFNLLDSPHPRQENQVPSVRVEIHLPRDQSGEVDFKALVLQLKETSSLQEQA
670 680 690 700 710 720
780 790 800 810 820 830
pF1KE4 DILYILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVL
::::.::..:::.:.:.: .....::..:: :::::.: ..:::::::::.::::::.:
CCDS55 DILYMLYTMKGPDWNTELYNERSATVRELLTELYGKVGEIRHWGLIRYISGILRKKVEAL
730 740 750 760 770 780
840 850 860 870 880 890
pF1KE4 AEACTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVVY
:::::::::::.:::::::::::: :::::: : ::.:: ::: :.::..:::::.::
CCDS55 DEACTDLLSHQKHLTVGLPPEPREKTISAPLPYEALTQLIDEASEGDMSISILTQEIMVY
790 800 810 820 830 840
900 910 920 930 940 950
pF1KE4 LAMYVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHH
::::.:.::.::.::.::::::::::::::::.:: ::.:::.:.:::::: :::::::
CCDS55 LAMYMRTQPGLFAEMFRLRIGLIIQVMATELAHSLRCSAEEATEGLMNLSPSAMKNLLHH
850 860 870 880 890 900
960 970 980 990 1000 1010
pF1KE4 ILSGKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSAD
::::::::::::::: :..: :.:::::.: .:.:::::.:: .:.::.::
CCDS55 ILSGKEFGVERSVRPTDSNVS-PAISIHEIGAVGATKTERTGIMQLKSEIKQ--------
910 920 930 940 950
1020 1030 1040 1050 1060 1070
pF1KE4 EQFFSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAI
: : . . :. .: ::. ::.:: ::::: ::::::::.
CCDS55 ----SPGTSMTPSS-------GSFPSAYDQQSSKDS---------RQGQWQRRRRLDGAL
960 970 980 990
1080 1090 1100 1110 1120 1130
pF1KE4 NRVPVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEYR
:::::::::.:::.::::::::..:.:::::::::::: ::::.::::::::::::::::
CCDS55 NRVPVGFYQKVWKVLQKCHGLSVEGFVLPSSTTREMTPGEIKFSVHVESVLNRVPQPEYR
1000 1010 1020 1030 1040 1050
1140 1150 1160 1170 1180 1190
pF1KE4 QLLVEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDT-LEKDQATGI
:::::::.:::.:.: :. :::.:: :..::..:..::::.: ..:: :: : :: :.::
CCDS55 QLLVEAILVLTMLADIEIHSIGSIIAVEKIVHIANDLFLQEQKTLGADDTMLAKDPASGI
1060 1070 1080 1090 1100 1110
1200 1210 1220 1230
pF1KE4 CHFFYDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ
: ..::::::: .::::::..:.:.:.::.::.: : ::
CCDS55 CTLLYDSAPSGRFGTMTYLSKAAATYVQEFLPHSICAMQ
1120 1130 1140 1150
>>CCDS42161.1 PHKB gene_id:5257|Hs108|chr16 (1086 aa)
initn: 2011 init1: 1071 opt: 1284 Z-score: 1417.4 bits: 274.2 E(32554): 1.2e-72
Smith-Waterman score: 1952; 32.9% identity (59.6% similar) in 1251 aa overlap (10-1230:41-1079)
10 20 30
pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLL---SAS
.:: : :.:..:.: ::.:.:::. . .
CCDS42 PSSAFLRSGSVYEPLKSINLPRPDNETLWDKLDHYYRIVKSTLLLYQSPTTGLFPTKTCG
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE4 HEQKDAWVRDNIYSILAVWGLGMAYRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQV
.:: : ..:..: ..:.:..:::. :.::....:::....: :::.: :.:::.
CCDS42 GDQK-AKIQDSLYCAAGAWALALAYRRI---DDDKGRTHELEHSAIKCMRGILYCYMRQA
80 90 100 110 120
100 110 120 130 140 150
pF1KE4 AKVEKFKHTQSTKDSLHAKYNTATCGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRII
::..::. ::. .:. : ... ...::::..:.::.::.:..: .:::.::
CCDS42 DKVQQFKQDPRPTTCLHSVFNVHTGDELLSYEEYGHLQINAVSLYLLYLVEMISSGLQII
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE4 FTLDEVAFIQNLVFYIEAAYKVADYGMWERGDKTNQGIPELNASSVGMAKAALEAIDELD
.. :::.::::::: .: .:.: :.:.::::.: :.: ::..::::.::::::::. ..
CCDS42 YNTDEVSFIQNLVFCVERVYRVPDFGVWERGSKYNNGSTELHSSSVGLAKAALEAINGFN
190 200 210 220 230 240
220 230 240 250 260 270
pF1KE4 LFGAHGGRKSVIHVLPDEVEHCQSILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLV
::: .: ::: : : .. .. : :.::: : :.. ::.:: ::.::::..: :
CCDS42 LFGNQGCSWSVIFVDLDAHNRNRQTLCSLLPRESRSHNTDAALLPCISYPAFALDDEVLF
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE4 NVTKNEIISKLQGRYGCCRFLRDGYKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFI
. : .... ::.:.:: :::::::.: ::::: .: :::.:::..::::.:.:. :..
CCDS42 SQTLDKVVRKLKGKYGFKRFLRDGYRTSLEDPNRCYYKPAEIKLFDGIECEFPIFFLYMM
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE4 IDGVFSGDAVQVQEYREALEGILIRGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPM-
::::: :. :::::.. : .: . .: .::. : :: . :. : .:: . : :
CCDS42 IDGVFRGNPKQVQEYQDLLTPVLHHTTEGYPVVPKYYYVPADFVEYEKNNPGSQKRFPSN
370 380 390 400 410 420
400 410 420 430
pF1KE4 ----GKVPHLWGQSLYILSSLLAEGFLAAGEIDPLNR------------RFSTS--VKPD
::. ::::.:::...:::. ... .:::..: :::.. .. :
CCDS42 CGRDGKL-FLWGQALYIIAKLLADELISPKDIDPVQRYVPLKDQRNVSMRFSNQGPLEND
430 440 450 460 470 480
440 450 460 470 480 490
pF1KE4 VVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILSHIYAKLGRNKNMNLSGR
.::.:...::..... .: .:...:. ...:::. : . : . : .:: :....::::
CCDS42 LVVHVALIAESQRLQVFLNTYGIQTQTPQQVEPIQIWPQQELVKAYLQLGINEKLGLSGR
490 500 510 520 530 540
500 510 520 530 540 550
pF1KE4 PYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIVEMLRIELAYLCTCWRMT
: : :: :::::.: : .. . : . : ::.. : .... .. : .. :.:
CCDS42 PDRPIGCLGTSKIYRILGKTVVCYPIIFDLSDFYMSQDVFLLIDDIKNALQFIKQYWKMH
550 560 570 580 590 600
560 570 580 590 600 610
pF1KE4 GRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVKLGNLSEFLTTSFYTYLT
::: . : . . :: .. .:. . :. : .::..:.. :. ... . :
CCDS42 GRPLFLVLIREDNIR--GSRFNP-ILDMLAALKKGIIGGVKVHVDRLQTLISGAVVEQLD
610 620 630 640 650 660
620 630 640 650 660 670
pF1KE4 FLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDELDHYINHLLQSTSLRSYL
:: . :: .:: .. :..
CCDS42 FL---------------------------RISDT------EELPEF-------KSFEELE
670 680
680 690 700 710 720 730
pF1KE4 PPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPTKVLSAHRKSLNLVDSPQ
:: .: .:.: :.: ..:.
CCDS42 PP-------KH---------------SKVK-------------------RQS----STPS
690
740 750 760 770 780 790
pF1KE4 -PLLEKVPESDF-QWPRDDHSDVDCEKLVEQLKDCSNLQDQADILYILYVIKGPSWDTNL
: : . :. .. .: .: ......:.::: : .:: .: :: .::.. :
CCDS42 APELGQQPDVNISEW-----KDKPTHEILQKLNDCSCLASQAILLGILLKREGPNFIT--
700 710 720 730 740 750
800 810 820 830 840 850
pF1KE4 SGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEACTDLLSHQKQLTVGL
..: ::.. . ..: .:: .. :...: ..:: : :. :: . :..: . ::.:.:
CCDS42 --KEG-TVSDHIERVYRRAGSQKLWSVVRRAASLLSKVVDSLAPSITNVLVQGKQVTLGA
760 770 780 790 800
860 870 880 890 900 910
pF1KE4 PPEPREKIISAPLPPEELTKLIY-EASGQDISIAVLTQEIVVYLAMYVRAQPSLFVEMLR
. .:..:: :: :. . ..:: . . .: ::. ::.:.... . .: :: ::.
CCDS42 FGH-EEEVISNPLSPRVIQNIIYYKCNTHDEREAVIQQELVIHIGWIISNNPELFSGMLK
810 820 830 840 850 860
920 930 940 950 960 970
pF1KE4 LRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILSGKEFGVERSVRPIH
.::: ::..: :: .:.. . .:..::: ..:.:: ::. .. : :
CCDS42 IRIGWIIHAMEYELQIR---GGDKPALDLYQLSPSEVKQLLLDILQPQQNG--RC-----
870 880 890 900 910
980 990 1000 1010 1020 1030
pF1KE4 SSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQFFSVGQAASSSAHSS
CCDS42 ------------------------------------------------------------
1040 1050 1060 1070 1080 1090
pF1KE4 KSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRVPVGFYQRVWKILQK
:: ::..::..::.:.:::.:::.::..
CCDS42 --------------------------------WLNRRQIDGSLNRTPTGFYDRVWQILER
920 930 940
1100 1110 1120 1130 1140 1150
pF1KE4 C-HGLSIDGYVLPSSTT-REMTPHEIKFAVHVESVLNRVPQPEYRQLLVEAIMVLTL-LS
.:. . : ::.. : .:: .:..:.. ::..:. . ::.:::..:: .::... :
CCDS42 TPNGIIVAGKHLPQQPTLSDMTMYEMNFSLLVEDTLGNIDQPQYRQIVVELLMVVSIVLE
950 960 970 980 990 1000
1160 1170 1180 1190 1200 1210
pF1KE4 DTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFFYDSAPSGAYGT
. . . .:..:. : . : .:: . .. ..:. :. ::.. : : ::
CCDS42 RNPELEFQDKVDLDRLVKEAFNEFQKDQSRLKEIE--KQDDMTS----FYNTPPLGKRGT
1010 1020 1030 1040 1050
1220 1230
pF1KE4 MTYLTRAVASYLQE--LLPNSGCQMQ
.:::.:: . : : . ::.
CCDS42 CSYLTKAVMNLLLEGEVKPNNDDPCLIS
1060 1070 1080
>>CCDS10729.1 PHKB gene_id:5257|Hs108|chr16 (1093 aa)
initn: 1991 init1: 1071 opt: 1284 Z-score: 1417.4 bits: 274.2 E(32554): 1.3e-72
Smith-Waterman score: 1932; 32.8% identity (59.2% similar) in 1251 aa overlap (10-1230:48-1086)
10 20 30
pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLL---SAS
.:: : :.:..:.: ::.:.:::. . .
CCDS10 RRARTKRSGSVYEPLKSINLPRPDNETLWDKLDHYYRIVKSTLLLYQSPTTGLFPTKTCG
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE4 HEQKDAWVRDNIYSILAVWGLGMAYRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQV
.:: : ..:..: ..:.:..:::. :.::....:::....: :::.: :.:::.
CCDS10 GDQK-AKIQDSLYCAAGAWALALAYRRI---DDDKGRTHELEHSAIKCMRGILYCYMRQA
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE4 AKVEKFKHTQSTKDSLHAKYNTATCGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRII
::..::. ::. .:. : ... ...::::..:.::.::.:..: .:::.::
CCDS10 DKVQQFKQDPRPTTCLHSVFNVHTGDELLSYEEYGHLQINAVSLYLLYLVEMISSGLQII
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE4 FTLDEVAFIQNLVFYIEAAYKVADYGMWERGDKTNQGIPELNASSVGMAKAALEAIDELD
.. :::.::::::: .: .:.: :.:.::::.: :.: ::..::::.::::::::. ..
CCDS10 YNTDEVSFIQNLVFCVERVYRVPDFGVWERGSKYNNGSTELHSSSVGLAKAALEAINGFN
200 210 220 230 240 250
220 230 240 250 260 270
pF1KE4 LFGAHGGRKSVIHVLPDEVEHCQSILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLV
::: .: ::: : : .. .. : :.::: : :.. ::.:: ::.::::..: :
CCDS10 LFGNQGCSWSVIFVDLDAHNRNRQTLCSLLPRESRSHNTDAALLPCISYPAFALDDEVLF
260 270 280 290 300 310
280 290 300 310 320 330
pF1KE4 NVTKNEIISKLQGRYGCCRFLRDGYKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFI
. : .... ::.:.:: :::::::.: ::::: .: :::.:::..::::.:.:. :..
CCDS10 SQTLDKVVRKLKGKYGFKRFLRDGYRTSLEDPNRCYYKPAEIKLFDGIECEFPIFFLYMM
320 330 340 350 360 370
340 350 360 370 380 390
pF1KE4 IDGVFSGDAVQVQEYREALEGILIRGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPM-
::::: :. :::::.. : .: . .: .::. : :: . :. : .:: . : :
CCDS10 IDGVFRGNPKQVQEYQDLLTPVLHHTTEGYPVVPKYYYVPADFVEYEKNNPGSQKRFPSN
380 390 400 410 420 430
400 410 420 430
pF1KE4 ----GKVPHLWGQSLYILSSLLAEGFLAAGEIDPLNR------------RFSTS--VKPD
::. ::::.:::...:::. ... .:::..: :::.. .. :
CCDS10 CGRDGKL-FLWGQALYIIAKLLADELISPKDIDPVQRYVPLKDQRNVSMRFSNQGPLEND
440 450 460 470 480 490
440 450 460 470 480 490
pF1KE4 VVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILSHIYAKLGRNKNMNLSGR
.::.:...::..... .: .:...:. ...:::. : . : . : .:: :....::::
CCDS10 LVVHVALIAESQRLQVFLNTYGIQTQTPQQVEPIQIWPQQELVKAYLQLGINEKLGLSGR
500 510 520 530 540 550
500 510 520 530 540 550
pF1KE4 PYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIVEMLRIELAYLCTCWRMT
: : :: :::::.: : .. . : . : ::.. : .... .. : .. :.:
CCDS10 PDRPIGCLGTSKIYRILGKTVVCYPIIFDLSDFYMSQDVFLLIDDIKNALQFIKQYWKMH
560 570 580 590 600 610
560 570 580 590 600 610
pF1KE4 GRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVKLGNLSEFLTTSFYTYLT
::: . : . . :: .. .:. . :. : .::..:.. :. ... . :
CCDS10 GRPLFLVLIREDNIR--GSRFNP-ILDMLAALKKGIIGGVKVHVDRLQTLISGAVVEQLD
620 630 640 650 660
620 630 640 650 660 670
pF1KE4 FLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDELDHYINHLLQSTSLRSYL
:: . :: .:: .. :..
CCDS10 FL---------------------------RISDT------EELPEF-------KSFEELE
670 680
680 690 700 710 720 730
pF1KE4 PPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPTKVLSAHRKSLNLVDSPQ
:: .: .:.: :.: ..:.
CCDS10 PP-------KH---------------SKVK-------------------RQS----STPS
690 700
740 750 760 770 780 790
pF1KE4 -PLLEKVPESDF-QWPRDDHSDVDCEKLVEQLKDCSNLQDQADILYILYVIKGPSWDTNL
: : . :. .. .: .: ......:.::: : .:: .: :: .::.. :
CCDS10 APELGQQPDVNISEW-----KDKPTHEILQKLNDCSCLASQAILLGILLKREGPNFIT--
710 720 730 740 750
800 810 820 830 840 850
pF1KE4 SGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEACTDLLSHQKQLTVGL
..: ::.. . ..: .:: .. : .:: ... .: .: : .: : ::.:.:
CCDS10 --KEG-TVSDHIERVYRRAGSQKLWLAVRYGAAFTQKFSSSIAPHITTFLVHGKQVTLGA
760 770 780 790 800 810
860 870 880 890 900 910
pF1KE4 PPEPREKIISAPLPPEELTKLIY-EASGQDISIAVLTQEIVVYLAMYVRAQPSLFVEMLR
. .:..:: :: :. . ..:: . . .: ::. ::.:.... . .: :: ::.
CCDS10 FGH-EEEVISNPLSPRVIQNIIYYKCNTHDEREAVIQQELVIHIGWIISNNPELFSGMLK
820 830 840 850 860 870
920 930 940 950 960 970
pF1KE4 LRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILSGKEFGVERSVRPIH
.::: ::..: :: .:.. . .:..::: ..:.:: ::. .. : :
CCDS10 IRIGWIIHAMEYELQIR---GGDKPALDLYQLSPSEVKQLLLDILQPQQNG--RC-----
880 890 900 910 920
980 990 1000 1010 1020 1030
pF1KE4 SSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQFFSVGQAASSSAHSS
CCDS10 ------------------------------------------------------------
1040 1050 1060 1070 1080 1090
pF1KE4 KSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRVPVGFYQRVWKILQK
:: ::..::..::.:.:::.:::.::..
CCDS10 --------------------------------WLNRRQIDGSLNRTPTGFYDRVWQILER
930 940 950
1100 1110 1120 1130 1140 1150
pF1KE4 C-HGLSIDGYVLPSSTT-REMTPHEIKFAVHVESVLNRVPQPEYRQLLVEAIMVLTL-LS
.:. . : ::.. : .:: .:..:.. ::..:. . ::.:::..:: .::... :
CCDS10 TPNGIIVAGKHLPQQPTLSDMTMYEMNFSLLVEDTLGNIDQPQYRQIVVELLMVVSIVLE
960 970 980 990 1000 1010
1160 1170 1180 1190 1200 1210
pF1KE4 DTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFFYDSAPSGAYGT
. . . .:..:. : . : .:: . .. ..:. :. ::.. : : ::
CCDS10 RNPELEFQDKVDLDRLVKEAFNEFQKDQSRLKEIE--KQDDMTS----FYNTPPLGKRGT
1020 1030 1040 1050 1060
1220 1230
pF1KE4 MTYLTRAVASYLQE--LLPNSGCQMQ
.:::.:: . : : . ::.
CCDS10 CSYLTKAVMNLLLEGEVKPNNDDPCLIS
1070 1080 1090
1235 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 23:43:53 2016 done: Sat Nov 5 23:43:54 2016
Total Scan time: 4.780 Total Display time: 0.470
Function used was FASTA [36.3.4 Apr, 2011]