FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4594, 1235 aa 1>>>pF1KE4594 1235 - 1235 aa - 1235 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5458+/-0.00108; mu= 15.9560+/- 0.066 mean_var=81.2320+/-15.922, 0's: 0 Z-trim(104.0): 27 B-trim: 0 in 0/51 Lambda= 0.142302 statistics sampled from 7649 (7659) to 7649 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.579), E-opt: 0.2 (0.235), width: 16 Scan time: 4.780 The best scores are: opt bits E(32554) CCDS14190.1 PHKA2 gene_id:5256|Hs108|chrX (1235) 8157 1685.2 0 CCDS14421.1 PHKA1 gene_id:5255|Hs108|chrX (1223) 4775 990.9 0 CCDS48137.1 PHKA1 gene_id:5255|Hs108|chrX (1210) 4749 985.6 0 CCDS55453.1 PHKA1 gene_id:5255|Hs108|chrX (1151) 3387 706.0 1.4e-202 CCDS42161.1 PHKB gene_id:5257|Hs108|chr16 (1086) 1284 274.2 1.2e-72 CCDS10729.1 PHKB gene_id:5257|Hs108|chr16 (1093) 1284 274.2 1.3e-72 >>CCDS14190.1 PHKA2 gene_id:5256|Hs108|chrX (1235 aa) initn: 8157 init1: 8157 opt: 8157 Z-score: 9042.3 bits: 1685.2 E(32554): 0 Smith-Waterman score: 8157; 99.8% identity (100.0% similar) in 1235 aa overlap (1-1235:1-1235) 10 20 30 40 50 60 pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV ::::::::::::::::::::::::::::::::::::::::::::::.::::::::::::: CCDS14 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDQHHFYLALDNEMIV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 DHYINHLLQSTSLRSYLPPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 DHYINHLLQSTSLRSYLPPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPT 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 KVLSAHRKSLNLVDSPQPLLEKVPESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQADIL :::::::::::::::::::::::::::::::::::.:::::::::::::::::::::::: CCDS14 KVLSAHRKSLNLVDSPQPLLEKVPESDFQWPRDDHGDVDCEKLVEQLKDCSNLQDQADIL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 YILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 YILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEA 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 CTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVVYLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 CTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVVYLAM 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE4 YVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 YVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILS 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE4 GKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQF 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE4 FSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 FSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRV 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE4 PVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEYRQLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 PVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEYRQLL 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE4 VEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFF 1150 1160 1170 1180 1190 1200 1210 1220 1230 pF1KE4 YDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ ::::::::::::::::::::::::::::::::::: CCDS14 YDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ 1210 1220 1230 >>CCDS14421.1 PHKA1 gene_id:5255|Hs108|chrX (1223 aa) initn: 5515 init1: 3572 opt: 4775 Z-score: 5289.9 bits: 990.9 E(32554): 0 Smith-Waterman score: 5624; 68.9% identity (88.4% similar) in 1241 aa overlap (1-1235:1-1223) 10 20 30 40 50 60 pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA ::::::::::::::::::::::::.:::::::: ::..:::::::::.::::::::::.: CCDS14 MRSRSNSGVRLDGYARLVQQTILCHQNPVTGLLPASYDQKDAWVRDNVYSILAVWGLGLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT :::::::::::::::::::.:::::::::.::.::: :::.::..::::::::::::: : CCDS14 YRKNADRDEDKAKAYELEQSVVKLMRGLLHCMIRQVDKVESFKYSQSTKDSLHAKYNTKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD :.::::::::::::.::::..::::::::::::.:: .:::: ::::::::::::::.:: CCDS14 CATVVGDDQWGHLQLDATSVYLLFLAQMTASGLHIIHSLDEVNFIQNLVFYIEAAYKTAD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS .:.::::::::::: ::::::::::::::::.:::::::..:: .:::::: :::.:::: CCDS14 FGIWERGDKTNQGISELNASSVGMAKAALEALDELDLFGVKGGPQSVIHVLADEVQHCQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG :: :.:::::::::.::.:::..::::::::: .::..::.:::.::::::::::::::: CCDS14 ILNSLLPRASTSKEVDASLLSVVSFPAFAVEDSQLVELTKQEIITKLQGRYGCCRFLRDG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI ::::.::::::.:.:::::::::::::::.::::::.::::::.: :::::.::::..:: CCDS14 YKTPKEDPNRLYYEPAELKLFENIECEWPLFWTYFILDGVFSGNAEQVQEYKEALEAVLI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA .::::. :.::::.:::..:::::.::::::::::::.::.::::::::.::.:::::: CCDS14 KGKNGVPLLPELYSVPPDRVDEEYQNPHTVDRVPMGKLPHMWGQSLYILGSLMAEGFLAP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS :::::::::::: ::::::::..:::...:: .:. .:. :..::...::.:::.:::: CCDS14 GEIDPLNRRFSTVPKPDVVVQVSILAETEEIKTILKDKGIYVETIAEVYPIRVQPARILS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV :::..:: :. :.::::::::.::::::::: ::. :::::::: :...:::::::.::: CCDS14 HIYSSLGCNNRMKLSGRPYRHMGVLGTSKLYDIRKTIFTFTPQFIDQQQFYLALDNKMIV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK :::: .:.:::. :::::.::.:::::..:: .::....:..:...::..:::::::::. CCDS14 EMLRTDLSYLCSRWRMTGQPTITFPISHSMLDEDGTSLNSSILAALRKMQDGYFGGARVQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL :.:::::::: :.:.:.:: . ::... . ... ... .. ..: . . ::. CCDS14 TGKLSEFLTTSCCTHLSFMDPGPEGKLYSEDYDDNYDYLESGNWMNDYDSTSHARCGDEV 610 620 630 640 650 660 670 680 690 700 710 pF1KE4 DHYINHLLQSTSLRSYLPPLC-KNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLP .:..::: :. . : : :. :: .:...: :..:...::: :.: : : :: CCDS14 ARYLDHLLAHTAPHPKLAPTSQKGGLDRFQ-AAVQTTCDLMSLVTKAKELHVQNVHMYLP 670 680 690 700 710 720 730 740 750 760 770 pF1KE4 TKVLSAHRKSLNLVDSPQPLLE-KVP--ESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQ ::...: : :.::.:::.: : .:: . ... :::. ..:: . :: :::. :.::.: CCDS14 TKLFQASRPSFNLLDSPHPRQENQVPSVRVEIHLPRDQSGEVDFKALVLQLKETSSLQEQ 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE4 ADILYILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEV :::::.::..:::.:.:.: .....::..:: :::::.: ..:::::::::.::::::. CCDS14 ADILYMLYTMKGPDWNTELYNERSATVRELLTELYGKVGEIRHWGLIRYISGILRKKVEA 780 790 800 810 820 830 840 850 860 870 880 890 pF1KE4 LAEACTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVV : :::::::::::.:::::::::::: :::::: : ::.:: ::: :.::..:::::.: CCDS14 LDEACTDLLSHQKHLTVGLPPEPREKTISAPLPYEALTQLIDEASEGDMSISILTQEIMV 840 850 860 870 880 890 900 910 920 930 940 950 pF1KE4 YLAMYVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLH :::::.:.::.::.::.::::::::::::::::.:: ::.:::.:.:::::: :::::: CCDS14 YLAMYMRTQPGLFAEMFRLRIGLIIQVMATELAHSLRCSAEEATEGLMNLSPSAMKNLLH 900 910 920 930 940 950 960 970 980 990 1000 1010 pF1KE4 HILSGKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMT-RRFS :::::::::::::::: :..: :.:::::.: .:.:::::.:: .:.::.::. ::.: CCDS14 HILSGKEFGVERSVRPTDSNVS-PAISIHEIGAVGATKTERTGIMQLKSEIKQVEFRRLS 960 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KE4 ADEQFFSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDG . . : : . . :. .: ::. ::.:: ::::: ::::::: CCDS14 ISAESQSPGTSMTPSS-------GSFPSAYDQQSSKDS---------RQGQWQRRRRLDG 1020 1030 1040 1050 1060 1080 1090 1100 1110 1120 1130 pF1KE4 AINRVPVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPE :.:::::::::.:::.::::::::..:.:::::::::::: ::::.:::::::::::::: CCDS14 ALNRVPVGFYQKVWKVLQKCHGLSVEGFVLPSSTTREMTPGEIKFSVHVESVLNRVPQPE 1070 1080 1090 1100 1110 1120 1140 1150 1160 1170 1180 1190 pF1KE4 YRQLLVEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDT-LEKDQAT :::::::::.:::.:.: :. :::.:: :..::..:..::::.: ..:: :: : :: :. CCDS14 YRQLLVEAILVLTMLADIEIHSIGSIIAVEKIVHIANDLFLQEQKTLGADDTMLAKDPAS 1130 1140 1150 1160 1170 1180 1200 1210 1220 1230 pF1KE4 GICHFFYDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ ::: ..::::::: .::::::..:.:.:.::.::.: : :: CCDS14 GICTLLYDSAPSGRFGTMTYLSKAAATYVQEFLPHSICAMQ 1190 1200 1210 1220 >>CCDS48137.1 PHKA1 gene_id:5255|Hs108|chrX (1210 aa) initn: 5482 init1: 3572 opt: 4749 Z-score: 5261.2 bits: 985.6 E(32554): 0 Smith-Waterman score: 5589; 68.7% identity (87.9% similar) in 1240 aa overlap (1-1235:1-1210) 10 20 30 40 50 60 pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA ::::::::::::::::::::::::.:::::::: ::..:::::::::.::::::::::.: CCDS48 MRSRSNSGVRLDGYARLVQQTILCHQNPVTGLLPASYDQKDAWVRDNVYSILAVWGLGLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT :::::::::::::::::::.:::::::::.::.::: :::.::..::::::::::::: : CCDS48 YRKNADRDEDKAKAYELEQSVVKLMRGLLHCMIRQVDKVESFKYSQSTKDSLHAKYNTKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD :.::::::::::::.::::..::::::::::::.:: .:::: ::::::::::::::.:: CCDS48 CATVVGDDQWGHLQLDATSVYLLFLAQMTASGLHIIHSLDEVNFIQNLVFYIEAAYKTAD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS .:.::::::::::: ::::::::::::::::.:::::::..:: .:::::: :::.:::: CCDS48 FGIWERGDKTNQGISELNASSVGMAKAALEALDELDLFGVKGGPQSVIHVLADEVQHCQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG :: :.:::::::::.::.:::..::::::::: .::..::.:::.::::::::::::::: CCDS48 ILNSLLPRASTSKEVDASLLSVVSFPAFAVEDSQLVELTKQEIITKLQGRYGCCRFLRDG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI ::::.::::::.:.:::::::::::::::.::::::.::::::.: :::::.::::..:: CCDS48 YKTPKEDPNRLYYEPAELKLFENIECEWPLFWTYFILDGVFSGNAEQVQEYKEALEAVLI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA .::::. :.::::.:::..:::::.::::::::::::.::.::::::::.::.:::::: CCDS48 KGKNGVPLLPELYSVPPDRVDEEYQNPHTVDRVPMGKLPHMWGQSLYILGSLMAEGFLAP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS :::::::::::: ::::::::..:::...:: .:. .:. :..::...::.:::.:::: CCDS48 GEIDPLNRRFSTVPKPDVVVQVSILAETEEIKTILKDKGIYVETIAEVYPIRVQPARILS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV :::..:: :. :.::::::::.::::::::: ::. :::::::: :...:::::::.::: CCDS48 HIYSSLGCNNRMKLSGRPYRHMGVLGTSKLYDIRKTIFTFTPQFIDQQQFYLALDNKMIV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK :::: .:.:::. :::::.::.:::::..:: .::....:..:...::..:::::::::. CCDS48 EMLRTDLSYLCSRWRMTGQPTITFPISHSMLDEDGTSLNSSILAALRKMQDGYFGGARVQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL :.:::::::: :.:.:.:: . ::... . ... ... .. ..: . . ::. CCDS48 TGKLSEFLTTSCCTHLSFMDPGPEGKLYSEDYDDNYDYLESGNWMNDYDSTSHARCGDEV 610 620 630 640 650 660 670 680 690 700 710 pF1KE4 DHYINHLLQSTSLRSYLPPLC-KNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLP .:..::: :. . : : :. :: .:...: :..:...::: :.: : : :: CCDS48 ARYLDHLLAHTAPHPKLAPTSQKGGLDRFQ-AAVQTTCDLMSLVTKAKELHVQNVHMYLP 670 680 690 700 710 720 730 740 750 760 770 pF1KE4 TKVLSAHRKSLNLVDSPQPLLE-KVP--ESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQ ::...: : :.::.:::.: : .:: . ... :::. ..:: . :: :::. :.::.: CCDS48 TKLFQASRPSFNLLDSPHPRQENQVPSVRVEIHLPRDQSGEVDFKALVLQLKETSSLQEQ 720 730 740 750 760 770 780 790 800 810 820 830 pF1KE4 ADILYILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEV :::::.::..:::.:.:.: .....::..:: :::::.: ..:::::::::.::::::. CCDS48 ADILYMLYTMKGPDWNTELYNERSATVRELLTELYGKVGEIRHWGLIRYISGILRKKVEA 780 790 800 810 820 830 840 850 860 870 880 890 pF1KE4 LAEACTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVV : :::::::::::.:::::::::::: :::::: : ::.:: ::: :.::..:::::.: CCDS48 LDEACTDLLSHQKHLTVGLPPEPREKTISAPLPYEALTQLIDEASEGDMSISILTQEIMV 840 850 860 870 880 890 900 910 920 930 940 950 pF1KE4 YLAMYVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLH :::::.:.::.::.::.::::::::::::::::.:: ::.:::.:.:::::: :::::: CCDS48 YLAMYMRTQPGLFAEMFRLRIGLIIQVMATELAHSLRCSAEEATEGLMNLSPSAMKNLLH 900 910 920 930 940 950 960 970 980 990 1000 1010 pF1KE4 HILSGKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSA :::::::::::::::: :..: :.:::::.: .:.:::::.:: .:.::.:: CCDS48 HILSGKEFGVERSVRPTDSNVS-PAISIHEIGAVGATKTERTGIMQLKSEIKQ------- 960 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 pF1KE4 DEQFFSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGA : : . . :. .: ::. ::.:: ::::: :::::::: CCDS48 -----SPGTSMTPSS-------GSFPSAYDQQSSKDS---------RQGQWQRRRRLDGA 1020 1030 1040 1050 1080 1090 1100 1110 1120 1130 pF1KE4 INRVPVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEY .:::::::::.:::.::::::::..:.:::::::::::: ::::.::::::::::::::: CCDS48 LNRVPVGFYQKVWKVLQKCHGLSVEGFVLPSSTTREMTPGEIKFSVHVESVLNRVPQPEY 1060 1070 1080 1090 1100 1110 1140 1150 1160 1170 1180 1190 pF1KE4 RQLLVEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDT-LEKDQATG ::::::::.:::.:.: :. :::.:: :..::..:..::::.: ..:: :: : :: :.: CCDS48 RQLLVEAILVLTMLADIEIHSIGSIIAVEKIVHIANDLFLQEQKTLGADDTMLAKDPASG 1120 1130 1140 1150 1160 1170 1200 1210 1220 1230 pF1KE4 ICHFFYDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ :: ..::::::: .::::::..:.:.:.::.::.: : :: CCDS48 ICTLLYDSAPSGRFGTMTYLSKAAATYVQEFLPHSICAMQ 1180 1190 1200 1210 >>CCDS55453.1 PHKA1 gene_id:5255|Hs108|chrX (1151 aa) initn: 5383 init1: 3387 opt: 3387 Z-score: 3750.3 bits: 706.0 E(32554): 1.4e-202 Smith-Waterman score: 5403; 68.0% identity (85.1% similar) in 1239 aa overlap (1-1235:1-1151) 10 20 30 40 50 60 pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLLSASHEQKDAWVRDNIYSILAVWGLGMA ::::::::::::::::::::::::.:::::::: ::..:::::::::.::::::::::.: CCDS55 MRSRSNSGVRLDGYARLVQQTILCHQNPVTGLLPASYDQKDAWVRDNVYSILAVWGLGLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 YRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQVAKVEKFKHTQSTKDSLHAKYNTAT :::::::::::::::::::.:::::::::.::.::: :::.::..::::::::::::: : CCDS55 YRKNADRDEDKAKAYELEQSVVKLMRGLLHCMIRQVDKVESFKYSQSTKDSLHAKYNTKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 CGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRIIFTLDEVAFIQNLVFYIEAAYKVAD :.::::::::::::.::::..::::::::::::.:: .:::: ::::::::::::::.:: CCDS55 CATVVGDDQWGHLQLDATSVYLLFLAQMTASGLHIIHSLDEVNFIQNLVFYIEAAYKTAD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 YGMWERGDKTNQGIPELNASSVGMAKAALEAIDELDLFGAHGGRKSVIHVLPDEVEHCQS .:.::::::::::: ::::::::::::::::.:::::::..:: .:::::: :::.:::: CCDS55 FGIWERGDKTNQGISELNASSVGMAKAALEALDELDLFGVKGGPQSVIHVLADEVQHCQS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLVNVTKNEIISKLQGRYGCCRFLRDG :: :.:::::::::.::.:::..::::::::: .::..::.:::.::::::::::::::: CCDS55 ILNSLLPRASTSKEVDASLLSVVSFPAFAVEDSQLVELTKQEIITKLQGRYGCCRFLRDG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 YKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFIIDGVFSGDAVQVQEYREALEGILI ::::.::::::.:.:::::::::::::::.::::::.::::::.: :::::.::::..:: CCDS55 YKTPKEDPNRLYYEPAELKLFENIECEWPLFWTYFILDGVFSGNAEQVQEYKEALEAVLI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 RGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPMGKVPHLWGQSLYILSSLLAEGFLAA .::::. :.::::.:::..:::::.::::::::::::.::.::::::::.::.:::::: CCDS55 KGKNGVPLLPELYSVPPDRVDEEYQNPHTVDRVPMGKLPHMWGQSLYILGSLMAEGFLAP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GEIDPLNRRFSTSVKPDVVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILS :::::::::::: ::::::::..:::...:: .:. .:. :..::...::.:::.:::: CCDS55 GEIDPLNRRFSTVPKPDVVVQVSILAETEEIKTILKDKGIYVETIAEVYPIRVQPARILS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 HIYAKLGRNKNMNLSGRPYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIV :::..:: :. :.::::::::.::::::::: ::. :::::::: :...:::::::.::: CCDS55 HIYSSLGCNNRMKLSGRPYRHMGVLGTSKLYDIRKTIFTFTPQFIDQQQFYLALDNKMIV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 EMLRIELAYLCTCWRMTGRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVK :::: .:.:::. :::::.::.:::::..:: .::....:..:...::..:::::::::. CCDS55 EMLRTDLSYLCSRWRMTGQPTITFPISHSMLDEDGTSLNSSILAALRKMQDGYFGGARVQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 LGNLSEFLTTSFYTYLTFLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDEL :.:::::::: :.:.:.:: . ::. : : : : ::: : . . CCDS55 TGKLSEFLTTSCCTHLSFMDPGPEGKLY--------SEDYD-DNYDYLE------SGNWM 610 620 630 640 670 680 690 700 710 720 pF1KE4 DHYINHLLQSTSLRSYLPPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPT . : .::: .: :.. ::: CCDS55 NDY-----DSTS------------HDVHMY---------------------------LPT 650 660 730 740 750 760 770 pF1KE4 KVLSAHRKSLNLVDSPQPLLE-KVP--ESDFQWPRDDHSDVDCEKLVEQLKDCSNLQDQA :...: : :.::.:::.: : .:: . ... :::. ..:: . :: :::. :.::.:: CCDS55 KLFQASRPSFNLLDSPHPRQENQVPSVRVEIHLPRDQSGEVDFKALVLQLKETSSLQEQA 670 680 690 700 710 720 780 790 800 810 820 830 pF1KE4 DILYILYVIKGPSWDTNLSGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVL ::::.::..:::.:.:.: .....::..:: :::::.: ..:::::::::.::::::.: CCDS55 DILYMLYTMKGPDWNTELYNERSATVRELLTELYGKVGEIRHWGLIRYISGILRKKVEAL 730 740 750 760 770 780 840 850 860 870 880 890 pF1KE4 AEACTDLLSHQKQLTVGLPPEPREKIISAPLPPEELTKLIYEASGQDISIAVLTQEIVVY :::::::::::.:::::::::::: :::::: : ::.:: ::: :.::..:::::.:: CCDS55 DEACTDLLSHQKHLTVGLPPEPREKTISAPLPYEALTQLIDEASEGDMSISILTQEIMVY 790 800 810 820 830 840 900 910 920 930 940 950 pF1KE4 LAMYVRAQPSLFVEMLRLRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHH ::::.:.::.::.::.::::::::::::::::.:: ::.:::.:.:::::: ::::::: CCDS55 LAMYMRTQPGLFAEMFRLRIGLIIQVMATELAHSLRCSAEEATEGLMNLSPSAMKNLLHH 850 860 870 880 890 900 960 970 980 990 1000 1010 pF1KE4 ILSGKEFGVERSVRPIHSSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSAD ::::::::::::::: :..: :.:::::.: .:.:::::.:: .:.::.:: CCDS55 ILSGKEFGVERSVRPTDSNVS-PAISIHEIGAVGATKTERTGIMQLKSEIKQ-------- 910 920 930 940 950 1020 1030 1040 1050 1060 1070 pF1KE4 EQFFSVGQAASSSAHSSKSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAI : : . . :. .: ::. ::.:: ::::: ::::::::. CCDS55 ----SPGTSMTPSS-------GSFPSAYDQQSSKDS---------RQGQWQRRRRLDGAL 960 970 980 990 1080 1090 1100 1110 1120 1130 pF1KE4 NRVPVGFYQRVWKILQKCHGLSIDGYVLPSSTTREMTPHEIKFAVHVESVLNRVPQPEYR :::::::::.:::.::::::::..:.:::::::::::: ::::.:::::::::::::::: CCDS55 NRVPVGFYQKVWKVLQKCHGLSVEGFVLPSSTTREMTPGEIKFSVHVESVLNRVPQPEYR 1000 1010 1020 1030 1040 1050 1140 1150 1160 1170 1180 1190 pF1KE4 QLLVEAIMVLTLLSDTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDT-LEKDQATGI :::::::.:::.:.: :. :::.:: :..::..:..::::.: ..:: :: : :: :.:: CCDS55 QLLVEAILVLTMLADIEIHSIGSIIAVEKIVHIANDLFLQEQKTLGADDTMLAKDPASGI 1060 1070 1080 1090 1100 1110 1200 1210 1220 1230 pF1KE4 CHFFYDSAPSGAYGTMTYLTRAVASYLQELLPNSGCQMQ : ..::::::: .::::::..:.:.:.::.::.: : :: CCDS55 CTLLYDSAPSGRFGTMTYLSKAAATYVQEFLPHSICAMQ 1120 1130 1140 1150 >>CCDS42161.1 PHKB gene_id:5257|Hs108|chr16 (1086 aa) initn: 2011 init1: 1071 opt: 1284 Z-score: 1417.4 bits: 274.2 E(32554): 1.2e-72 Smith-Waterman score: 1952; 32.9% identity (59.6% similar) in 1251 aa overlap (10-1230:41-1079) 10 20 30 pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLL---SAS .:: : :.:..:.: ::.:.:::. . . CCDS42 PSSAFLRSGSVYEPLKSINLPRPDNETLWDKLDHYYRIVKSTLLLYQSPTTGLFPTKTCG 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE4 HEQKDAWVRDNIYSILAVWGLGMAYRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQV .:: : ..:..: ..:.:..:::. :.::....:::....: :::.: :.:::. CCDS42 GDQK-AKIQDSLYCAAGAWALALAYRRI---DDDKGRTHELEHSAIKCMRGILYCYMRQA 80 90 100 110 120 100 110 120 130 140 150 pF1KE4 AKVEKFKHTQSTKDSLHAKYNTATCGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRII ::..::. ::. .:. : ... ...::::..:.::.::.:..: .:::.:: CCDS42 DKVQQFKQDPRPTTCLHSVFNVHTGDELLSYEEYGHLQINAVSLYLLYLVEMISSGLQII 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE4 FTLDEVAFIQNLVFYIEAAYKVADYGMWERGDKTNQGIPELNASSVGMAKAALEAIDELD .. :::.::::::: .: .:.: :.:.::::.: :.: ::..::::.::::::::. .. CCDS42 YNTDEVSFIQNLVFCVERVYRVPDFGVWERGSKYNNGSTELHSSSVGLAKAALEAINGFN 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE4 LFGAHGGRKSVIHVLPDEVEHCQSILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLV ::: .: ::: : : .. .. : :.::: : :.. ::.:: ::.::::..: : CCDS42 LFGNQGCSWSVIFVDLDAHNRNRQTLCSLLPRESRSHNTDAALLPCISYPAFALDDEVLF 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE4 NVTKNEIISKLQGRYGCCRFLRDGYKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFI . : .... ::.:.:: :::::::.: ::::: .: :::.:::..::::.:.:. :.. CCDS42 SQTLDKVVRKLKGKYGFKRFLRDGYRTSLEDPNRCYYKPAEIKLFDGIECEFPIFFLYMM 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE4 IDGVFSGDAVQVQEYREALEGILIRGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPM- ::::: :. :::::.. : .: . .: .::. : :: . :. : .:: . : : CCDS42 IDGVFRGNPKQVQEYQDLLTPVLHHTTEGYPVVPKYYYVPADFVEYEKNNPGSQKRFPSN 370 380 390 400 410 420 400 410 420 430 pF1KE4 ----GKVPHLWGQSLYILSSLLAEGFLAAGEIDPLNR------------RFSTS--VKPD ::. ::::.:::...:::. ... .:::..: :::.. .. : CCDS42 CGRDGKL-FLWGQALYIIAKLLADELISPKDIDPVQRYVPLKDQRNVSMRFSNQGPLEND 430 440 450 460 470 480 440 450 460 470 480 490 pF1KE4 VVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILSHIYAKLGRNKNMNLSGR .::.:...::..... .: .:...:. ...:::. : . : . : .:: :....:::: CCDS42 LVVHVALIAESQRLQVFLNTYGIQTQTPQQVEPIQIWPQQELVKAYLQLGINEKLGLSGR 490 500 510 520 530 540 500 510 520 530 540 550 pF1KE4 PYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIVEMLRIELAYLCTCWRMT : : :: :::::.: : .. . : . : ::.. : .... .. : .. :.: CCDS42 PDRPIGCLGTSKIYRILGKTVVCYPIIFDLSDFYMSQDVFLLIDDIKNALQFIKQYWKMH 550 560 570 580 590 600 560 570 580 590 600 610 pF1KE4 GRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVKLGNLSEFLTTSFYTYLT ::: . : . . :: .. .:. . :. : .::..:.. :. ... . : CCDS42 GRPLFLVLIREDNIR--GSRFNP-ILDMLAALKKGIIGGVKVHVDRLQTLISGAVVEQLD 610 620 630 640 650 660 620 630 640 650 660 670 pF1KE4 FLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDELDHYINHLLQSTSLRSYL :: . :: .:: .. :.. CCDS42 FL---------------------------RISDT------EELPEF-------KSFEELE 670 680 680 690 700 710 720 730 pF1KE4 PPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPTKVLSAHRKSLNLVDSPQ :: .: .:.: :.: ..:. CCDS42 PP-------KH---------------SKVK-------------------RQS----STPS 690 740 750 760 770 780 790 pF1KE4 -PLLEKVPESDF-QWPRDDHSDVDCEKLVEQLKDCSNLQDQADILYILYVIKGPSWDTNL : : . :. .. .: .: ......:.::: : .:: .: :: .::.. : CCDS42 APELGQQPDVNISEW-----KDKPTHEILQKLNDCSCLASQAILLGILLKREGPNFIT-- 700 710 720 730 740 750 800 810 820 830 840 850 pF1KE4 SGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEACTDLLSHQKQLTVGL ..: ::.. . ..: .:: .. :...: ..:: : :. :: . :..: . ::.:.: CCDS42 --KEG-TVSDHIERVYRRAGSQKLWSVVRRAASLLSKVVDSLAPSITNVLVQGKQVTLGA 760 770 780 790 800 860 870 880 890 900 910 pF1KE4 PPEPREKIISAPLPPEELTKLIY-EASGQDISIAVLTQEIVVYLAMYVRAQPSLFVEMLR . .:..:: :: :. . ..:: . . .: ::. ::.:.... . .: :: ::. CCDS42 FGH-EEEVISNPLSPRVIQNIIYYKCNTHDEREAVIQQELVIHIGWIISNNPELFSGMLK 810 820 830 840 850 860 920 930 940 950 960 970 pF1KE4 LRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILSGKEFGVERSVRPIH .::: ::..: :: .:.. . .:..::: ..:.:: ::. .. : : CCDS42 IRIGWIIHAMEYELQIR---GGDKPALDLYQLSPSEVKQLLLDILQPQQNG--RC----- 870 880 890 900 910 980 990 1000 1010 1020 1030 pF1KE4 SSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQFFSVGQAASSSAHSS CCDS42 ------------------------------------------------------------ 1040 1050 1060 1070 1080 1090 pF1KE4 KSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRVPVGFYQRVWKILQK :: ::..::..::.:.:::.:::.::.. CCDS42 --------------------------------WLNRRQIDGSLNRTPTGFYDRVWQILER 920 930 940 1100 1110 1120 1130 1140 1150 pF1KE4 C-HGLSIDGYVLPSSTT-REMTPHEIKFAVHVESVLNRVPQPEYRQLLVEAIMVLTL-LS .:. . : ::.. : .:: .:..:.. ::..:. . ::.:::..:: .::... : CCDS42 TPNGIIVAGKHLPQQPTLSDMTMYEMNFSLLVEDTLGNIDQPQYRQIVVELLMVVSIVLE 950 960 970 980 990 1000 1160 1170 1180 1190 1200 1210 pF1KE4 DTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFFYDSAPSGAYGT . . . .:..:. : . : .:: . .. ..:. :. ::.. : : :: CCDS42 RNPELEFQDKVDLDRLVKEAFNEFQKDQSRLKEIE--KQDDMTS----FYNTPPLGKRGT 1010 1020 1030 1040 1050 1220 1230 pF1KE4 MTYLTRAVASYLQE--LLPNSGCQMQ .:::.:: . : : . ::. CCDS42 CSYLTKAVMNLLLEGEVKPNNDDPCLIS 1060 1070 1080 >>CCDS10729.1 PHKB gene_id:5257|Hs108|chr16 (1093 aa) initn: 1991 init1: 1071 opt: 1284 Z-score: 1417.4 bits: 274.2 E(32554): 1.3e-72 Smith-Waterman score: 1932; 32.8% identity (59.2% similar) in 1251 aa overlap (10-1230:48-1086) 10 20 30 pF1KE4 MRSRSNSGVRLDGYARLVQQTILCYQNPVTGLL---SAS .:: : :.:..:.: ::.:.:::. . . CCDS10 RRARTKRSGSVYEPLKSINLPRPDNETLWDKLDHYYRIVKSTLLLYQSPTTGLFPTKTCG 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE4 HEQKDAWVRDNIYSILAVWGLGMAYRKNADRDEDKAKAYELEQNVVKLMRGLLQCMMRQV .:: : ..:..: ..:.:..:::. :.::....:::....: :::.: :.:::. CCDS10 GDQK-AKIQDSLYCAAGAWALALAYRRI---DDDKGRTHELEHSAIKCMRGILYCYMRQA 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE4 AKVEKFKHTQSTKDSLHAKYNTATCGTVVGDDQWGHLQVDATSLFLLFLAQMTASGLRII ::..::. ::. .:. : ... ...::::..:.::.::.:..: .:::.:: CCDS10 DKVQQFKQDPRPTTCLHSVFNVHTGDELLSYEEYGHLQINAVSLYLLYLVEMISSGLQII 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE4 FTLDEVAFIQNLVFYIEAAYKVADYGMWERGDKTNQGIPELNASSVGMAKAALEAIDELD .. :::.::::::: .: .:.: :.:.::::.: :.: ::..::::.::::::::. .. CCDS10 YNTDEVSFIQNLVFCVERVYRVPDFGVWERGSKYNNGSTELHSSSVGLAKAALEAINGFN 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE4 LFGAHGGRKSVIHVLPDEVEHCQSILFSMLPRASTSKEIDAGLLSIISFPAFAVEDVNLV ::: .: ::: : : .. .. : :.::: : :.. ::.:: ::.::::..: : CCDS10 LFGNQGCSWSVIFVDLDAHNRNRQTLCSLLPRESRSHNTDAALLPCISYPAFALDDEVLF 260 270 280 290 300 310 280 290 300 310 320 330 pF1KE4 NVTKNEIISKLQGRYGCCRFLRDGYKTPREDPNRLHYDPAELKLFENIECEWPVFWTYFI . : .... ::.:.:: :::::::.: ::::: .: :::.:::..::::.:.:. :.. CCDS10 SQTLDKVVRKLKGKYGFKRFLRDGYRTSLEDPNRCYYKPAEIKLFDGIECEFPIFFLYMM 320 330 340 350 360 370 340 350 360 370 380 390 pF1KE4 IDGVFSGDAVQVQEYREALEGILIRGKNGIRLVPELYAVPPNKVDEEYKNPHTVDRVPM- ::::: :. :::::.. : .: . .: .::. : :: . :. : .:: . : : CCDS10 IDGVFRGNPKQVQEYQDLLTPVLHHTTEGYPVVPKYYYVPADFVEYEKNNPGSQKRFPSN 380 390 400 410 420 430 400 410 420 430 pF1KE4 ----GKVPHLWGQSLYILSSLLAEGFLAAGEIDPLNR------------RFSTS--VKPD ::. ::::.:::...:::. ... .:::..: :::.. .. : CCDS10 CGRDGKL-FLWGQALYIIAKLLADELISPKDIDPVQRYVPLKDQRNVSMRFSNQGPLEND 440 450 460 470 480 490 440 450 460 470 480 490 pF1KE4 VVVQVTVLAENNHIKDLLRKHGVNVQSIADIHPIQVQPGRILSHIYAKLGRNKNMNLSGR .::.:...::..... .: .:...:. ...:::. : . : . : .:: :....:::: CCDS10 LVVHVALIAESQRLQVFLNTYGIQTQTPQQVEPIQIWPQQELVKAYLQLGINEKLGLSGR 500 510 520 530 540 550 500 510 520 530 540 550 pF1KE4 PYRHIGVLGTSKLYVIRNQIFTFTPQFTDEHHFYLALDNEMIVEMLRIELAYLCTCWRMT : : :: :::::.: : .. . : . : ::.. : .... .. : .. :.: CCDS10 PDRPIGCLGTSKIYRILGKTVVCYPIIFDLSDFYMSQDVFLLIDDIKNALQFIKQYWKMH 560 570 580 590 600 610 560 570 580 590 600 610 pF1KE4 GRPTLTFPISRTMLTNDGSDIHSAVLSTIRKLEDGYFGGARVKLGNLSEFLTTSFYTYLT ::: . : . . :: .. .:. . :. : .::..:.. :. ... . : CCDS10 GRPLFLVLIREDNIR--GSRFNP-ILDMLAALKKGIIGGVKVHVDRLQTLISGAVVEQLD 620 630 640 650 660 620 630 640 650 660 670 pF1KE4 FLDPDCDEKLFDNASEGTFSPDSDSDLVGYLEDTCNQESQDELDHYINHLLQSTSLRSYL :: . :: .:: .. :.. CCDS10 FL---------------------------RISDT------EELPEF-------KSFEELE 670 680 680 690 700 710 720 730 pF1KE4 PPLCKNTEDRHVFSAIHSTRDILSVMAKAKGLEVPFVPMTLPTKVLSAHRKSLNLVDSPQ :: .: .:.: :.: ..:. CCDS10 PP-------KH---------------SKVK-------------------RQS----STPS 690 700 740 750 760 770 780 790 pF1KE4 -PLLEKVPESDF-QWPRDDHSDVDCEKLVEQLKDCSNLQDQADILYILYVIKGPSWDTNL : : . :. .. .: .: ......:.::: : .:: .: :: .::.. : CCDS10 APELGQQPDVNISEW-----KDKPTHEILQKLNDCSCLASQAILLGILLKREGPNFIT-- 710 720 730 740 750 800 810 820 830 840 850 pF1KE4 SGQHGVTVQNLLGELYGKAGLNQEWGLIRYISGLLRKKVEVLAEACTDLLSHQKQLTVGL ..: ::.. . ..: .:: .. : .:: ... .: .: : .: : ::.:.: CCDS10 --KEG-TVSDHIERVYRRAGSQKLWLAVRYGAAFTQKFSSSIAPHITTFLVHGKQVTLGA 760 770 780 790 800 810 860 870 880 890 900 910 pF1KE4 PPEPREKIISAPLPPEELTKLIY-EASGQDISIAVLTQEIVVYLAMYVRAQPSLFVEMLR . .:..:: :: :. . ..:: . . .: ::. ::.:.... . .: :: ::. CCDS10 FGH-EEEVISNPLSPRVIQNIIYYKCNTHDEREAVIQQELVIHIGWIISNNPELFSGMLK 820 830 840 850 860 870 920 930 940 950 960 970 pF1KE4 LRIGLIIQVMATELARSLNCSGEEASESLMNLSPFDMKNLLHHILSGKEFGVERSVRPIH .::: ::..: :: .:.. . .:..::: ..:.:: ::. .. : : CCDS10 IRIGWIIHAMEYELQIR---GGDKPALDLYQLSPSEVKQLLLDILQPQQNG--RC----- 880 890 900 910 920 980 990 1000 1010 1020 1030 pF1KE4 SSTSSPTISIHEVGHTGVTKTERSGINRLRSEMKQMTRRFSADEQFFSVGQAASSSAHSS CCDS10 ------------------------------------------------------------ 1040 1050 1060 1070 1080 1090 pF1KE4 KSARSSTPSSPTGTSSSDSGGHHIGWGERQGQWLRRRRLDGAINRVPVGFYQRVWKILQK :: ::..::..::.:.:::.:::.::.. CCDS10 --------------------------------WLNRRQIDGSLNRTPTGFYDRVWQILER 930 940 950 1100 1110 1120 1130 1140 1150 pF1KE4 C-HGLSIDGYVLPSSTT-REMTPHEIKFAVHVESVLNRVPQPEYRQLLVEAIMVLTL-LS .:. . : ::.. : .:: .:..:.. ::..:. . ::.:::..:: .::... : CCDS10 TPNGIIVAGKHLPQQPTLSDMTMYEMNFSLLVEDTLGNIDQPQYRQIVVELLMVVSIVLE 960 970 980 990 1000 1010 1160 1170 1180 1190 1200 1210 pF1KE4 DTEMTSIGGIIHVDQIVQMASQLFLQDQVSIGAMDTLEKDQATGICHFFYDSAPSGAYGT . . . .:..:. : . : .:: . .. ..:. :. ::.. : : :: CCDS10 RNPELEFQDKVDLDRLVKEAFNEFQKDQSRLKEIE--KQDDMTS----FYNTPPLGKRGT 1020 1030 1040 1050 1060 1220 1230 pF1KE4 MTYLTRAVASYLQE--LLPNSGCQMQ .:::.:: . : : . ::. CCDS10 CSYLTKAVMNLLLEGEVKPNNDDPCLIS 1070 1080 1090 1235 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 23:43:53 2016 done: Sat Nov 5 23:43:54 2016 Total Scan time: 4.780 Total Display time: 0.470 Function used was FASTA [36.3.4 Apr, 2011]