FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4969, 2224 aa
1>>>pF1KB4969 2224 - 2224 aa - 2224 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.1169+/-0.0014; mu= 11.6155+/- 0.083
mean_var=155.5783+/-30.761, 0's: 0 Z-trim(103.6): 100 B-trim: 0 in 0/51
Lambda= 0.102825
statistics sampled from 7415 (7504) to 7415 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.565), E-opt: 0.2 (0.231), width: 16
Scan time: 6.540
The best scores are: opt bits E(32554)
CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224) 15037 2244.9 0
CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351) 1809 282.6 1.5e-74
CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159) 996 161.8 1.7e-38
CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 ( 470) 924 150.9 1.3e-35
CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 ( 480) 924 150.9 1.3e-35
CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065) 922 150.8 3.1e-35
CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160) 900 147.5 3.2e-34
CCDS14384.3 HEPH gene_id:9843|Hs108|chrX (1212) 900 147.6 3.4e-34
CCDS81918.1 MFGE8 gene_id:4240|Hs108|chr15 ( 343) 882 144.6 7.5e-34
CCDS14385.1 HEPH gene_id:9843|Hs108|chrX ( 891) 889 145.8 8e-34
CCDS10347.1 MFGE8 gene_id:4240|Hs108|chr15 ( 387) 869 142.7 3.1e-33
CCDS44026.1 F8 gene_id:2157|Hs108|chrX ( 216) 671 113.2 1.3e-24
CCDS45345.1 MFGE8 gene_id:4240|Hs108|chr15 ( 335) 576 99.2 3.4e-20
CCDS65277.1 HEPH gene_id:9843|Hs108|chrX ( 969) 505 88.9 1.2e-16
CCDS46878.1 DCBLD2 gene_id:131566|Hs108|chr3 ( 775) 462 82.5 8.4e-15
CCDS34522.1 DCBLD1 gene_id:285761|Hs108|chr6 ( 539) 415 75.4 7.8e-13
CCDS46499.1 NRP2 gene_id:8828|Hs108|chr2 ( 555) 404 73.8 2.5e-12
CCDS46498.1 NRP2 gene_id:8828|Hs108|chr2 ( 901) 404 73.9 3.7e-12
CCDS2365.1 NRP2 gene_id:8828|Hs108|chr2 ( 906) 404 73.9 3.7e-12
CCDS46497.1 NRP2 gene_id:8828|Hs108|chr2 ( 909) 404 73.9 3.7e-12
CCDS46496.1 NRP2 gene_id:8828|Hs108|chr2 ( 926) 404 73.9 3.8e-12
CCDS2364.1 NRP2 gene_id:8828|Hs108|chr2 ( 931) 404 73.9 3.8e-12
CCDS14187.1 RS1 gene_id:6247|Hs108|chrX ( 224) 387 71.0 6.7e-12
CCDS44873.1 KMT2D gene_id:8085|Hs108|chr12 (5537) 397 73.3 3.5e-11
>>CCDS1281.1 F5 gene_id:2153|Hs108|chr1 (2224 aa)
initn: 15037 init1: 15037 opt: 15037 Z-score: 12057.5 bits: 2244.9 E(32554): 0
Smith-Waterman score: 15037; 100.0% identity (100.0% similar) in 2224 aa overlap (1-2224:1-2224)
10 20 30 40 50 60
pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSLNLSVTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSLNLSVTS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 FKKIVYREYEPYFKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 FKKIVYREYEPYFKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 KLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 DFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSWSQSSSLMYTVNGYVNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSWSQSSSLMYTVNGYVNG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 TMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 GPEGKWIISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GPEGKWIISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 WDYAPVIPANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHTVNPNMKEDGILG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 WDYAPVIPANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHTVNPNMKEDGILG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 PIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGET
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 YTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 YTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAA
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 DIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 GFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 WMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 WMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEES
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 DADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDIIVGSNYSSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDIIVGSNYSSP
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 SNISKFTVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SNISKFTVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPL
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 QPDVTGIRLLSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QPDVTGIRLLSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGS
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 PSGMRPWEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PSGMRPWEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB4 DTDEDTAVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPRVRHKSLQVRQDGGKSRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DTDEDTAVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPRVRHKSLQVRQDGGKSRL
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB4 KKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERRLKHSLVLHKSNETSLPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERRLKHSLVLHKSNETSLPT
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB4 DLNQTLPSMDFGWIASLPDHNQNSSNDTGQASCPPGLYQTVPPEEHYQTFPIQDPDQMHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DLNQTLPSMDFGWIASLPDHNQNSSNDTGQASCPPGLYQTVPPEEHYQTFPIQDPDQMHS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB4 TSDPSHRSSSPELSEMLEYDRSHKSFPTDISQMSPSSEHEVWQTVISPDLSQVTLSPELS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TSDPSHRSSSPELSEMLEYDRSHKSFPTDISQMSPSSEHEVWQTVISPDLSQVTLSPELS
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KB4 QTNLSPDLSHTTLSPELIQRNLSPALGQMPISPDLSHTTLSPDLSHTTLSLDLSQTNLSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QTNLSPDLSHTTLSPELIQRNLSPALGQMPISPDLSHTTLSPDLSHTTLSLDLSQTNLSP
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KB4 ELSQTNLSPALGQMPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNLSPALGQMP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ELSQTNLSPALGQMPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNLSPALGQMP
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KB4 ISPDLSHTTLSLDFSQTNLSPELSQTNLSPALGQMPLSPDPSHTTLSLDLSQTNLSPELS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ISPDLSHTTLSLDFSQTNLSPELSQTNLSPALGQMPLSPDPSHTTLSLDLSQTNLSPELS
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KB4 QTNLSPDLSEMPLFADLSQIPLTPDLDQMTLSPDLGETDLSPNFGQMSLSPDLSQVTLSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QTNLSPDLSEMPLFADLSQIPLTPDLDQMTLSPDLGETDLSPNFGQMSLSPDLSQVTLSP
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KB4 DISDTTLLPDLSQISPPPDLDQIFYPSESSQSLLLQEFNESFPYPDLGQMPSPSSPTLND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 DISDTTLLPDLSQISPPPDLDQIFYPSESSQSLLLQEFNESFPYPDLGQMPSPSSPTLND
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KB4 TFLSKEFNPLVIVGLSKDGTDYIEIIPKEEVQSSEDDYAEIDYVPYDDPYKTDVRTNINS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TFLSKEFNPLVIVGLSKDGTDYIEIIPKEEVQSSEDDYAEIDYVPYDDPYKTDVRTNINS
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KB4 SRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDYSEFVQRETDIEDSDDIPEDTTYKKVVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDYSEFVQRETDIEDSDDIPEDTTYKKVVF
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KB4 RKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDVIQVRFKNLASRPYSLHAHGLSYEKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDVIQVRFKNLASRPYSLHAHGLSYEKS
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KB4 SEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATERSGPESPGSACRAWAYYSAVNPEKDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATERSGPESPGSACRAWAYYSAVNPEKDI
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KB4 HSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMTFDEKKSWYYEKKSRSSWRLTSSEMK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 HSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMTFDEKKSWYYEKKSRSSWRLTSSEMK
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KB4 KSHEFHAINGMIYSLPGLKMYEQEWVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 KSHEFHAINGMIYSLPGLKMYEQEWVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLG
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KB4 VWPLLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VWPLLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISD
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KB4 SQIKASEFLGYWEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SQIKASEFLGYWEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQG
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KB4 AKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPIVARY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPIVARY
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KB4 IRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDYWEPFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 IRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDYWEPFR
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KB4 ARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYTIHYSEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 ARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYTIHYSEQ
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KB4 GVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIALRLELFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIALRLELFG
2170 2180 2190 2200 2210 2220
pF1KB4 CDIY
::::
CCDS12 CDIY
>>CCDS35457.1 F8 gene_id:2157|Hs108|chrX (2351 aa)
initn: 2085 init1: 458 opt: 1809 Z-score: 1451.9 bits: 282.6 E(32554): 1.5e-74
Smith-Waterman score: 3396; 31.8% identity (59.1% similar) in 2333 aa overlap (92-2222:97-2346)
70 80 90 100 110 120
pF1KB4 KKIVYREYEPYFKKEKPQSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYSK
::: : . . .:: :..:.:.: :. : :
CCDS35 KTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 LSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIED
:::: : :.: :: :: : :: .:: :.. ...:: .:: :::. : :: .:..:
CCDS35 ASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKD
130 140 150 160 170 180
190 200 210 220 230
pF1KB4 FNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLFAVFDESKSWSQSS--SLM--------
.:::::: ::.:..:.:.. :: :. : ..::::::::.::: . . :::
CCDS35 LNSGLIGALLVCREGSLAKEKTQ-TLHK-FILLFAVFDEGKSWHSETKNSLMQDRDAASA
190 200 210 220 230 240
240 250 260 270 280
pF1KB4 ------YTVNGYVNGTMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSA
.::::::: ..: . : . . ::..::.. ::. :: ..:... .:. ..
CCDS35 RAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQAS
250 260 270 280 290 300
290 300 310 320 330
pF1KB4 ITLVSATSTTANMTVGPEGKWIISSLTPKHLQAGMQAYIDIKNCPK----KTRN------
. . : ::. . :.... .: . ::.::. . .::. . .:
CCDS35 LEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAED
310 320 330 340 350 360
340 350 360 370
pF1KB4 ----------------------LKKITREQRRHMKRWEYFIAAEEVIWDYAPVIPANMDK
. .: ..: : : ..::::: :::::.. : :.
CCDS35 YDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDR
370 380 390 400 410 420
380 390 400 410 420 430
pF1KB4 KYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHTVNPNMKEDGILGPIIRAQVRDTLKI
.:.::.:.: ..::..:::: . : ::.: .: . ..:.:::::.. ..: ::: :
CCDS35 SYKSQYLNNGPQRIGRKYKKVRFMAYTDETF--KTREAIQHESGILGPLLYGEVGDTLLI
430 440 450 460 470 480
440 450 460 470 480 490
pF1KB4 VFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYTYKWNILEFDEP
.:::.:::::.:::::.: . . . .: .. . ::: . :::.. : :
CCDS35 IFKNQASRPYNIYPHGIT--DVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGP
490 500 510 520 530 540
500 510 520 530 540 550
pF1KB4 TENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADIEQQAVFAVFDE
:..: .:::: : : :.. ::.:::::: :::: ..:.:.:: : .: .. .:.::::
CCDS35 TKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDE
550 560 570 580 590 600
560 570 580 590 600 610
pF1KB4 NKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTLGFCFDDTVQWHFC
:.:::: .::..: :: :. .::.: :::: .::::: .:. :. :. ... :..
CCDS35 NRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQ-LSVCLHEVAYWYIL
610 620 630 640 650
620 630 640 650 660 670
pF1KB4 SVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGTWMLTSMNSSPRSK
:.:.:...:.. :.:..: . .::::::::. ::.: ..:.: : :.: ::. :..
CCDS35 SIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNR
660 670 680 690 700 710
680 690 700 710 720 730
pF1KB4 KLRLKFRDVKC---IPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEESDADYDYQNRL
. .. .: : ::::: . :. . .. .. .::.. ::
CCDS35 GMTALLKVSSCDKNTGDYYEDSYEDI----SAYLLSK--NNAIEPRSFS-------QNSR
720 730 740 750 760
740 750 760 770 780
pF1KB4 AAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVS--SNTDIIVGSNYS-SPSNISKFT
. ..: ... ... : . .: .. .. :..:... : .: ..:
CCDS35 HPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLS---
770 780 790 800 810 820
790 800 810 820 830 840
pF1KB4 VNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTGI
:.. :.: . : . .: : .:. :. : : : . . . :. .:.
CCDS35 ---LSDLQEA---KYETFSDDPSPGAIDSNNSLSEMT--HFRPQLHHSGDMVFTPE-SGL
830 840 850 860 870
850 860 870 880 890 900
pF1KB4 RL-LSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGSPSGMRP
.: :. : . : :. :: ...... .: . .: ... : :: :
CCDS35 QLRLNEKLGTTAATE-LKKLDFKV--SSTSNNLISTIPSDNLAAGTDNTSSLGPPS-MPV
880 890 900 910 920 930
910 920 930 940 950 960
pF1KB4 WEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQDTDEDT
: . : .. : . . : : ...:.::.: . ..:.. . ...:.
CCDS35 HYDSQLDTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMNSQESSWGKNVSSTESGR
940 950 960 970 980 990
970 980 990 1000 1010 1020
pF1KB4 ------AVNNWLISPQNASRAWGESTPLANKPGKQSGHPKFPRVRHKSLQVRQDGGKSRL
: . :.. .:: . : .:: ...:. . .. :: .... .
CCDS35 LFKGKRAHGPALLTKDNALFKVSISLLKTNKTSNNSATNRKTHIDGPSLLIENS---PSV
1000 1010 1020 1030 1040
1030 1040 1050 1060 1070
pF1KB4 KKSQFLIKTRKKKKEKHTHHAPLSPRTFHPLRSEAYNTFSERRL--KHSLVLHKSNETSL
.. . :. :: : : .. :: : .:.. :. ......: .
CCDS35 WQNILESDTEFKKVTPLIHDRMLMDKNATALR---LNHMSNKTTSSKNMEMVQQKKEGPI
1050 1060 1070 1080 1090 1100
1080 1090 1100 1110 1120
pF1KB4 PTDLNQTLPSMDFGWIASLPD--------HNQNSSNDTGQASCPPGLYQTVPPEEHY--Q
: : .. :.:.: . ::. :..:: : .::. : : .. ::. :
CCDS35 PPDAQN--PDMSFFKMLFLPESARWIQRTHGKNSLN-SGQGPSPKQLV-SLGPEKSVEGQ
1110 1120 1130 1140 1150 1160
1130 1140 1150 1160 1170 1180
pF1KB4 TFPIQDPDQMHSTSDPSHRSSSPELSEMLEYDRSHKSFPTDISQMSPSSEHEVWQTVISP
.: ... ... . .. ... :.::. . :.. : :..... .. :. . .
CCDS35 NF-LSEKNKV--VVGKGEFTKDVGLKEMV-FPSSRNLFLTNLDNLHENNTHNQEKKI---
1170 1180 1190 1200 1210
1190 1200 1210 1220 1230
pF1KB4 DLSQVTLSPELSQTNLSPDLSHTTLSPELIQRNL-----------SPALGQMPISPDLSH
.. . : : :. ::. . . ...:: : . :. :.
CCDS35 -QEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEGSYDGAYAPVLQDFRS
1220 1230 1240 1250 1260 1270
1240 1250 1260
pF1KB4 TTLSPDLS--HTT-------------LSLDLSQ--------TNLSPELSQTNLSP-----
. : . . ::. :. . .: : .::. :: :.
CCDS35 LNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNTSQQNFVTQRSKR
1280 1290 1300 1310 1320 1330
1270 1280 1290 1300 1310 1320
pF1KB4 ALGQ--MPLSPDLSHTTLSLDFSQTNLSPELSHMTLSPELSQTNLSP----ALGQMPISP
:: : .:: . . .: ..:. : ...:.: : :.: . . :. : :.:
CCDS35 ALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPST-LTQIDYNEKEKGAITQSPLSD
1340 1350 1360 1370 1380 1390
1330 1340 1350 1360 1370
pF1KB4 DL--SHTTLS-----LDFSQTNLSPELSQTNLSPALGQMPLSPDPSHTTLSLDLSQTNLS
: ::. . : ..... : . :. .: : : :. . . : . . :
CCDS35 CLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASYRKKDSGVQESS
1400 1410 1420 1430 1440 1450
1380 1390 1400 1410
pF1KB4 PELS---QTNLSPDLSEMPLFADLSQIPL--TPDLDQMTLS---------PDL----GET
:. ..::: . . . .: .. : ...: . ::: :..
CCDS35 HFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVENTVLPKPDLPKTSGKV
1460 1470 1480 1490 1500 1510
1420 1430 1440 1450 1460
pF1KB4 DLSP--NFGQMSLSPDLSQVTLSP---DISDTTLLPDL------SQISPPPDLDQIFYPS
.: : .. : .: : .. . :: :. . .:: .. . : . . .
CCDS35 ELLPKVHIYQKDLFPTETS-NGSPGHLDLVEGSLLQGTEGAIKWNEANRPGKVPFLRVAT
1520 1530 1540 1550 1560 1570
1470 1480 1490 1500
pF1KB4 ESSQ---SLLLQ------EFNESFPYPDL-GQMPSPSSPTLN--DTFLSK---EFN----
::: : ::. ... ..: . .: :: . ... ::.:: : :
CCDS35 ESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACESNHAIA
1580 1590 1600 1610 1620 1630
1510 1520 1530 1540 1550
pF1KB4 --------PLVIVGLSKDG-TDYI--EIIP-----KEEVQSS--EDDYAEIDYVPYDDPY
: . : .:.: :. . . : ..:. . ..: :::: ::
CCDS35 AINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEEIDY---DDTI
1640 1650 1660 1670 1680
1560 1570 1580 1590 1600
pF1KB4 KTDVRTNINSSRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDY----SEFVQRETDIEDS
..... . . : :. . :: . . :.:.::: : ::: : : :. .:
CCDS35 SVEMKKEDFDIYDEDENQS--PRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNR--AQS
1690 1700 1710 1720 1730 1740
1610 1620 1630 1640 1650 1660
pF1KB4 DDIPEDTTYKKVVFRKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDVIQVRFKNLASR
..:. .:::::... :..::. ::: .::::.::: :::::.: :.: :.: :::
CCDS35 GSVPQ---FKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASR
1750 1760 1770 1780 1790 1800
1670 1680 1690 1700 1710 1720
pF1KB4 PYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATERSGPESPGSACR
:::... .::: ::. . : :.:: . :: :.. .. .: . :.
CCDS35 PYSFYSSLISYE--------EDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCK
1810 1820 1830 1840 1850
1730 1740 1750 1760 1770 1780
pF1KB4 AWAYYSAVNPEKDIHSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMTFDEKKSWYY--
::::.: :. :::.:::::::::.:. . :. . . ..::.:.: ::: ::::.
CCDS35 AWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTE
1860 1870 1880 1890 1900 1910
1790 1800 1810 1820 1830
pF1KB4 --EKKSRS--SWRLTSSEMKKSHEFHAINGMIY-SLPGLKMYEQEWVRLHLLNIGGSQDI
:.. :. . .. . .:....::::::.:. .:::: : ... .: .::..:....:
CCDS35 NMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENI
1920 1930 1940 1950 1960 1970
1840 1850 1860 1870 1880 1890
pF1KB4 HVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTP
: .:: :... ......... : :: :.:.:: :: : : .. .::. .:::.:
CCDS35 HSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTL
1980 1990 2000 2010 2020 2030
1900 1910 1920 1930 1940 1950
pF1KB4 FLIMDRDCRMPMGLSTGIISDSQIKASEFLGYWEPRLARLNNGGSYNAWSVEKLAAEFAS
::... :. :.:...: : : :: :: : : :.::::. .:: ::::... :.
CCDS35 FLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKE---PFS-
2040 2050 2060 2070 2080
1960 1970 1980 1990 2000 2010
pF1KB4 KPWIQVDMQKEVIITGIQTQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFN
::.::. .:: ::.::::.. ..: : ..: . :: . .:: ..:::: ..: :
CCDS35 --WIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFF
2090 2100 2110 2120 2130 2140
2020 2030 2040 2050 2060 2070
pF1KB4 GNSDASTIKENQFDPPIVARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIEN
:: :.: ::.: :.:::.:::::. ::. : :::.::.::..:.:: :::::. : .
CCDS35 GNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISD
2150 2160 2170 2180 2190 2200
2080 2090 2100 2110 2120 2130
pF1KB4 KQITASSFKKSWWGDYWEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQ
::::::. . .. : : .:::. ::: :::. ..:: :.::..:. : :.:.. ::
CCDS35 AQITASSYFTNMFAT-WSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQ
2210 2220 2230 2240 2250 2260
2140 2150 2160 2170 2180 2190
pF1KB4 GCKSLSSEMYVKSYTIHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISR
: ::: . :::: . : :..: .: . .... : :.:.:: .. : : ..::...:
CCDS35 GVKSLLTSMYVKEFLISSSQDGHQWTLF-FQNGKV-KVFQGNQDSFTPVVNSLDPPLLTR
2270 2280 2290 2300 2310 2320
2200 2210 2220
pF1KB4 FIRVIPKTWNQSIALRLELFGCDIY
..:. :..: ..::::.:..::.
CCDS35 YLRIHPQSWVHQIALRMEVLGCEAQDLY
2330 2340 2350
>>CCDS44710.1 HEPHL1 gene_id:341208|Hs108|chr11 (1159 aa)
initn: 1444 init1: 488 opt: 996 Z-score: 804.7 bits: 161.8 E(32554): 1.7e-38
Smith-Waterman score: 1495; 33.3% identity (58.9% similar) in 879 aa overlap (4-832:8-836)
10 20 30 40 50
pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSLNL
:: ...:. :: : : :: . : .:.. :.: :. : .
CCDS44 MPRKQPAGC--IFLLTFLGLS----GLVGTVT---RTYYIGIVEEYWNYVPQGKNVITGK
10 20 30 40 50
60 70 80 90
pF1KB4 SVTS------------------FKKIVYREY-EPYFKKEKPQSTISGLLGPTLYAEVGDI
: : .:: :::.. . .. : :. :.::: : :::::.
CCDS44 SFTEDKLATLFLERGPNRIGSIYKKAVYRRFTDGTYSIEIPKPPWLGFLGPILRAEVGDV
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB4 IKVHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISED
: .:.:: :..: :.::.:. :.: :::: : : : .: :: : ::..::: : . :.
CCDS44 IVIHLKNFASRPYSLHPHGVFYNKDSEGALYPDGTSGRNKNDDMVPPGKNYTYVWPVREE
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB4 SGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTE-GGTQKTFDKQIVLLFA
.:: : ::: .:.:: . .:. ::::::::.::.: :.. .::.. :...:..:.
CCDS44 YAPTPADANCLTWVYHSHIDAPKDICSGLIGPLLVCKEGILNRYSGTRNDVDREFVIMFT
180 190 200 210 220 230
220 230 240 250
pF1KB4 VFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITVCAHDHIS
. ::..:: : :. :...:::. :..:. .:. . .:
CCDS44 LVDENQSWYLNENIKHFCTNPDSVDKKDAVFQRSNKMHALNGYLFGNFPEPDMCVGESVS
240 250 260 270 280 290
260 270 280 290 300 310
pF1KB4 WHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTPK
:::.::.. .. ::.: :... . :......: :: :..: . :::.:. .
CCDS44 WHLFGMGNEIDIHSIYFYGNTFISRGHRTDVVNLFPATFLTTEMIAENPGKWMITCQVSD
300 310 320 330 340 350
320 330 340 350 360
pF1KB4 HLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPV-------I
:::::: . .. :: :. :. .::: ::::::...::::: .
CCDS44 HLQAGMLGQYNVDNC-KSDIFYPKMKGQQRR------YFIAAEKILWDYAPQGYNKFSGL
360 370 380 390 400
370 380 390 400 410 420
pF1KB4 PANMDKKYRSQHLDNFSNQIGKHYKKVMYTQYEDESFTKHT-VNPNMKEDGILGPIIRAQ
: : . . . .. . .:.:: .: :: ::.. : .:::. .. . . :::::.:.:.
CCDS44 PLNASGSDSDLYFTQGDNRIGGKYWKVRYTEFVDATFTKRKRLSAEEAHLGILGPVIKAE
410 420 430 440 450 460
430 440 450 460 470 480
pF1KB4 VRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYTYKWN
: ::: ..: : :.. ::: :::: .. : . . .: . . :.::::.::::.
CCDS44 VGDTLLVTFANKADKVYSILPHGVIYDKASDAAPN--LDGFVKPGAH-VKPGETFTYKWT
470 480 490 500 510 520
490 500 510 520 530 540
pF1KB4 ILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADIEQQA
. : :: .: ::: :.: :: ..: .:::.: ::.::. :. : :.. : :
CCDS44 VPESVSPTAGDPPCLTYLYFSAVDPIKDTSSGLVGPLLVCKKGVLNADGTQKGIDKEFYL
530 540 550 560 570 580
550 560 570 580 590 600
pF1KB4 VFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTLGFCFDD
.:.::::: : :...::.:: .: . ..: .: .:: : ..:::. . :..: :
CCDS44 LFTVFDENLSRYFDENIQKFIWHPFSIDKEDKEFVKSNRMHAVNGYMYGNQPGLNMCKRD
590 600 610 620 630 640
610 620 630 640 650 660
pF1KB4 TVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVTVTMDNVGTWMLTSM
:.::. ..::.... : : :... :.:.:.::: . .. . :..: . .
CCDS44 RVSWHLIGLGTDTDMHGIVFQGNTIHLRGTHRDSLALFPHMATTAFMQPDHAGIFRVFCA
650 660 670 680 690 700
670 680 690 700 710 720
pF1KB4 NSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDEESDADYDY
. :. . .. .: :..: : :. : .. :: . ::
CCDS44 TMPHLSRGMGQIYEVSSC---DNRD------PSEQRYGMIRTFY----IAAEEVEWDYA-
710 720 730 740
730 740 750 760 770 780
pF1KB4 QNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDIIVGSNYSSPSNISKF
:. : : :. .. : . ..: :.. :. .::.:.. ..
CCDS44 PNK---------------NWEFEKQHVDARGERHGDIFMNR-TENWIGSQYKK-VVYREY
750 760 770 780 790
790 800 810 820 830 840
pF1KB4 TVNNLAEPQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTG
: ....: . : ... .:. : :.:: . : :::
CCDS44 TDGEFVEIKARPPREEHLELLGPMIHAEVGNTVLIIFKNKASRPYSISAQGVEEMDSGKQ
800 810 820 830 840 850
850 860 870 880 890 900
pF1KB4 IRLLSLGAGEFKSQEHAKHKGPKVERDQAAKHRFSWMKLLAHKVGRHLSQDTGSPSGMRP
CCDS44 FQVPMTKPGEVKTYRWNIPKRSGPGPSDPNCIPWVYYSTVNFVKDTYSGLMGPLITCRKG
860 870 880 890 900 910
>--
initn: 998 init1: 377 opt: 459 Z-score: 374.2 bits: 82.1 E(32554): 1.6e-14
Smith-Waterman score: 552; 36.8% identity (68.4% similar) in 250 aa overlap (1680-1919:838-1084)
1650 1660 1670 1680 1690 1700
pF1KB4 AEVDDVIQVRFKNLASRPYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYV
:..: . : :: . :. ..:. ::
CCDS44 LELLGPMIHAEVGNTVLIIFKNKASRPYSISAQG-VEEMDSGKQFQVP-MTKPGEVKTYR
810 820 830 840 850 860
1710 1720 1730 1740 1750 1760
pF1KB4 WHATERSGPESPGSACRAWAYYSAVNPEKDIHSGLIGPLLICQKGILH-KDSNMPMDMRE
:. .:::: : :.:::.:: :: .:::.:::. :.::.:. : .:. :
CCDS44 WNIPKRSGPGPSDPNCIPWVYYSTVNFVKDTYSGLMGPLITCRKGVLNEKGRRSDVDY-E
870 880 890 900 910 920
1770 1780 1790 1800 1810 1820
pF1KB4 FVLLFMTFDEKKSWYYEKKSRSSWRLTSSEMKKSHEF------HAINGMIY-SLPGLKMY
:.:::..:.:..::: . . .. ..:.. .: ::::: :. .: :: :
CCDS44 FALLFLVFNENESWYLDDNIKKYLNKDPRDFKRTDDFEESNRMHAINGKIFGNLHGLIMN
930 940 950 960 970 980
1830 1840 1850 1860 1870 1880
pF1KB4 EQEWVRLHLLNIGGSQDIHVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGW
:. . .::.::. :::..:.:....: . .:... :. :.::.:.:.:. :..::
CCDS44 EDTMTNWYLLGIGSEVDIHTIHYHAESFLFKIDKSYREDVYDLFPGTFQTIELFADHPGT
990 1000 1010 1020 1030 1040
1890 1900 1910 1920 1930
pF1KB4 WLLNTEVGENQRAGMQTPFLIM-DRDCRMPMGLST-GIISDSQIKASEFLGYWEPRLARL
:::. .:... .:::.: . .. . : :.:.. .. :. :
CCDS44 WLLHCHVSDHIHAGMETTYTVLRNIDNRIPYSTTSPGVASHPATVPSNERPGKEQLYFFG
1050 1060 1070 1080 1090 1100
1940 1950 1960 1970 1980 1990
pF1KB4 NNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQTQGAKHYLKSCYTTEFYVAYSS
CCDS44 KNLGPTGAKAALVILFIIGLLLLITTVILSLRLCSAMKQTDYQQVQSCALPTDAL
1110 1120 1130 1140 1150
>>CCDS64195.1 EDIL3 gene_id:10085|Hs108|chr5 (470 aa)
initn: 963 init1: 420 opt: 924 Z-score: 752.9 bits: 150.9 E(32554): 1.3e-35
Smith-Waterman score: 924; 42.7% identity (68.5% similar) in 337 aa overlap (1897-2221:134-466)
1870 1880 1890 1900 1910 1920
pF1KB4 GSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRM----PMGLSTGIISDSQ
. : .: :.:.. :.:. ::::..:
CCDS64 IHCQHNINECEVEPCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQ
110 120 130 140 150 160
1930 1940 1950 1960 1970
pF1KB4 IKASE----FLGY--WEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGI
: :: ..: : : ::::. : :::. ::: ::::...:... .::.
CCDS64 ITASSTHRALFGLQKWYPYYARLNKKGLINAWT----AAENDRWPWIQINLQRKMRVTGV
170 180 190 200 210
1980 1990 2000 2010 2020 2030
pF1KB4 QTQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPI
:::::. . : . .:::.. .: ..: ..: . : : :: : .: :.: :::
CCDS64 ITQGAKRIGSPEYIKSYKIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPI
220 230 240 250 260 270
2040 2050 2060 2070 2080 2090
pF1KB4 VARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDY-
:.:.:. : . :::.:: :::..::: ::::..:.:.. ::::::. .. :.
CCDS64 KAQYVRLYPQVCRRHCTLRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF
280 290 300 310 320 330
2100 2110 2120 2130 2140 2150
pF1KB4 -WEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYT
::: .:::. ::.:::: . :...:::..::: :.:.::::: :... ..: ::
CCDS64 TWEPRKARLDKQGKVNAWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYK
340 350 360 370 380 390
2160 2170 2180 2190 2200 2210
pF1KB4 IHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIAL
. ::..: .: :. ... ::.:.:: .. : :: ..::: .: ::..: .: :.:
CCDS64 LAYSNDGEHWTVYQDEKQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITL
400 410 420 430 440 450
2220
pF1KB4 RLELFGCDIY
: ::.::
CCDS64 RSELLGCTEEE
460 470
>>CCDS4062.1 EDIL3 gene_id:10085|Hs108|chr5 (480 aa)
initn: 963 init1: 420 opt: 924 Z-score: 752.7 bits: 150.9 E(32554): 1.3e-35
Smith-Waterman score: 924; 42.7% identity (68.5% similar) in 337 aa overlap (1897-2221:144-476)
1870 1880 1890 1900 1910 1920
pF1KB4 GSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRM----PMGLSTGIISDSQ
. : .: :.:.. :.:. ::::..:
CCDS40 IHCQHNINECEVEPCKNGGICTDLVANYSCECPGEFMGRNCQYKCSGPLGIEGGIISNQQ
120 130 140 150 160 170
1930 1940 1950 1960 1970
pF1KB4 IKASE----FLGY--WEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGI
: :: ..: : : ::::. : :::. ::: ::::...:... .::.
CCDS40 ITASSTHRALFGLQKWYPYYARLNKKGLINAWT----AAENDRWPWIQINLQRKMRVTGV
180 190 200 210 220
1980 1990 2000 2010 2020 2030
pF1KB4 QTQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPI
:::::. . : . .:::.. .: ..: ..: . : : :: : .: :.: :::
CCDS40 ITQGAKRIGSPEYIKSYKIAYSNDGKTWAMYKVKGTNEDMVFRGNIDNNTPYANSFTPPI
230 240 250 260 270 280
2040 2050 2060 2070 2080 2090
pF1KB4 VARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDY-
:.:.:. : . :::.:: :::..::: ::::..:.:.. ::::::. .. :.
CCDS40 KAQYVRLYPQVCRRHCTLRMELLGCELSGCSEPLGMKSGHIQDYQITASSIFRTLNMDMF
290 300 310 320 330 340
2100 2110 2120 2130 2140 2150
pF1KB4 -WEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYT
::: .:::. ::.:::: . :...:::..::: :.:.::::: :... ..: ::
CCDS40 TWEPRKARLDKQGKVNAWTSGHNDQSQWLQVDLLVPTKVTGIITQGAKDFGHVQFVGSYK
350 360 370 380 390 400
2160 2170 2180 2190 2200 2210
pF1KB4 IHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIAL
. ::..: .: :. ... ::.:.:: .. : :: ..::: .: ::..: .: :.:
CCDS40 LAYSNDGEHWTVYQDEKQRKDKVFQGNFDNDTHRKNVIDPPIYARHIRILPWSWYGRITL
410 420 430 440 450 460
2220
pF1KB4 RLELFGCDIY
: ::.::
CCDS40 RSELLGCTEEE
470 480
>>CCDS3141.1 CP gene_id:1356|Hs108|chr3 (1065 aa)
initn: 923 init1: 479 opt: 922 Z-score: 746.0 bits: 150.8 E(32554): 3.1e-35
Smith-Waterman score: 1371; 34.7% identity (64.4% similar) in 675 aa overlap (61-697:67-731)
40 50 60 70 80
pF1KB4 LRQFYVAAQGISWSYRPEPTNSSLNLSVTSFKKIVYREY-EPYFKKEKPQSTISGLLGPT
.:: .: .: . :. . . :.:::
CCDS31 SDHGEKKLISVDTEHSNIYLQNGPDRIGRLYKKALYLQYTDETFRTTIEKPVWLGFLGPI
40 50 60 70 80 90
90 100 110 120 130 140
pF1KB4 LYAEVGDIIKVHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYT
. ::.:: . ::.:: :..: ..: .:: : : ::: : :.: .. :: : ::..::
CCDS31 IKAETGDKVYVHLKNLASRPYTFHSHGITYYKEHEGAIYPDNTTDFQRADDKVYPGEQYT
100 110 120 130 140 150
150 160 170 180 190 200
pF1KB4 YEWSISEDSGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGTQKTFDK
: .:...: . : :.:.::.:: . .:. :::::::.:::: .: . .: .:.
CCDS31 YMLLATEEQSPGEGDGNCVTRIYHSHIDAPKDIASGLIGPLIICKKDSL-DKEKEKHIDR
160 170 180 190 200 210
210 220 230 240
pF1KB4 QIVLLFAVFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITV
..:..:.: ::. :: : :. ::.::::. :..: ...
CCDS31 EFVVMFSVVDENFSWYLEDNIKTYCSEPEKVDKDNEDFQESNRMYSVNGYTFGSLPGLSM
220 230 240 250 260 270
250 260 270 280 290 300
pF1KB4 CAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWI
::.:...:.:.::.. .. . :.::.: ........:.: :: : :.. :.:.
CCDS31 CAEDRVKWYLFGMGNEVDVHAAFFHGQALTNKNYRIDTINLFPATLFDAYMVAQNPGEWM
280 290 300 310 320 330
310 320 330 340 350 360
pF1KB4 ISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPV-
.: . .::.::.::......: .:. . .: .. :: :.:::::.::.:::
CCDS31 LSCQNLNHLKAGLQAFFQVQEC-NKSSSKDNIRGKHVRH-----YYIAAEEIIWNYAPSG
340 350 360 370 380
370 380 390 400 410
pF1KB4 IPANMDKKYRSQHLDN--FSNQ----IGKHYKKVMYTQYEDESFT-KHTVNPNMKEDGIL
: .. . :. : .: :: :::..: .: : ::: .. .:. .. :::
CCDS31 IDIFTKENLTAPGSDSAVFFEQGTTRIGGSYKKLVYREYTDASFTNRKERGPEEEHLGIL
390 400 410 420 430 440
420 430 440 450 460 470
pF1KB4 GPIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPG-
::.: :.: ::....:.: .. : :: : :: :. .. ... : : . :.: :.
CCDS31 GPVIWAEVGDTIRVTFHNKGAYPLSIEPIGVRFNKNNE---GTYYSPNYNPQSRSVPPSA
450 460 470 480 490 500
480 490 500 510 520 530
pF1KB4 ------ETYTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLD
::.::.:.. . ::. : ::.. ::: :. .:: .:::: . :::. ::
CCDS31 SHVAPTETFTYEWTVPKEVGPTNADPVCLAKMYYSAVEPTKDIFTGLIGPMKICKKGSLH
510 520 530 540 550 560
540 550 560 570 580 590
pF1KB4 RRGIQRAADIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGY
: :. .: : .:::::.: ::::: : ::.: ..: : ::: : ..::.
CCDS31 ANGRQKDVDKEFYLFPTVFDENESLLLEDNIRMFTTAPDQVDKEDEDFQESNKMHSMNGF
570 580 590 600 610 620
600 610 620 630 640 650
pF1KB4 VPESITTLGFCFDDTVQWHFCSVGTQNEILTIHFTGHSFIYGKRHEDTLTLFPMRGESVT
. . : .: :.: :.. :.:.. .. :.:.:..... ...:: .:::. . ..
CCDS31 MYGNQPGLTMCKGDSVVWYLFSAGNEADVHGIYFSGNTYLWRGERRDTANLFPQTSLTLH
630 640 650 660 670 680
660 670 680 690 700 710
pF1KB4 VTMDNVGTWMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDR
. :. ::. . .... . .. :. .: ....... . :
CCDS31 MWPDTEGTFNVECLTTDHYTGGMKQKYTVNQCRRQSEDSTFYLGERTYYIAAVEVEWDYS
690 700 710 720 730 740
720 730 740 750 760 770
pF1KB4 LEPEDEESDADYDYQNRLAAALGIRSFRNSSLNQEEEEFNLTALALENGTEFVSSNTDII
CCDS31 PQREWEKELHHLQEQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFRVPVERKAEEEHLG
750 760 770 780 790 800
>--
initn: 878 init1: 274 opt: 546 Z-score: 444.5 bits: 95.0 E(32554): 1.9e-18
Smith-Waterman score: 778; 39.7% identity (64.7% similar) in 348 aa overlap (1580-1906:732-1060)
1550 1560 1570 1580 1590 1600
pF1KB4 YKTDVRTNINSSRDPDNIAAWYLRSNNGNRRNYYIAAEEISWDYSEFVQRETDIE-----
:.::::: :. :::: ::: . :
CCDS31 TDHYTGGMKQKYTVNQCRRQSEDSTFYLGERTYYIAAVEVEWDYSP--QREWEKELHHLQ
710 720 730 740 750
1610 1620 1630 1640 1650
pF1KB4 ---------DSDDIPEDTTYKKVVFRKYLDSTFTKRDPRGEYEEHLGILGPIIRAEVDDV
:. .. . :::::.:.: :::: : ::::::::: ..:.: :
CCDS31 EQNVSNAFLDKGEFYIGSKYKKVVYRQYTDSTFRVPVERKAEEEHLGILGPQLHADVGDK
760 770 780 790 800 810
1660 1670 1680 1690 1700 1710
pF1KB4 IQVRFKNLASRPYSLHAHGLSYEKSSEGKTYEDDSPEWFKEDNAVQPNSSYTYVWHATER
... :::.:.::::.::::.. :.:. : :. . ::::. ::
CCDS31 VKIIFKNMATRPYSIHAHGVQTESSTVTPTL---------------PGETLTYVWKIPER
820 830 840 850 860
1720 1730 1740 1750 1760 1770
pF1KB4 SGPESPGSACRAWAYYSAVNPEKDIHSGLIGPLLICQKGILHKDSNMPMDMREFVLLFMT
:: . ::: :::::.:. ::..:::::::..:.. : : : : ::.:::..
CCDS31 SGAGTEDSACIPWAYYSTVDQVKDLYSGLIGPLIVCRRPYL-KVFN-PRRKLEFALLFLV
870 880 890 900 910 920
1780 1790 1800 1810 1820
pF1KB4 FDEKKSWYYEK--KSRSSW--RLTSS--EMKKSHEFHAINGMIY-SLPGLKMYEQEWVRL
:::..::: . :. :. ..... :. .:...::::: .. .: :: :. . :
CCDS31 FDENESWYLDDNIKTYSDHPEKVNKDDEEFIESNKMHAINGRMFGNLQGLTMHVGDEVNW
930 940 950 960 970 980
1830 1840 1850 1860 1870 1880
pF1KB4 HLLNIGGSQDIHVVHFHGQTLLENGNKQHQLGVWPLLPGSFKTLEMKASKPGWWLLNTEV
.:...:. :.:.:::::... . .. :. ..::...:::: :: :::. .:
CCDS31 YLMGMGNEIDLHTVHFHGHSFQYKHRGVYSSDVFDIFPGTYQTLEMFPRTPGIWLLHCHV
990 1000 1010 1020 1030 1040
1890 1900 1910 1920 1930 1940
pF1KB4 GENQRAGMQTPFLIMDRDCRMPMGLSTGIISDSQIKASEFLGYWEPRLARLNNGGSYNAW
.. .:::.: . ... .
CCDS31 TDHIHAGMETTYTVLQNEDTKSG
1050 1060
>>CCDS48133.1 HEPH gene_id:9843|Hs108|chrX (1160 aa)
initn: 1356 init1: 411 opt: 900 Z-score: 727.8 bits: 147.5 E(32554): 3.2e-34
Smith-Waterman score: 1378; 31.0% identity (55.6% similar) in 984 aa overlap (8-900:10-953)
10 20 30 40 50
pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEP----TNSSL
::.:. . . : : :..: : .:.. . ..:.: :. ::. :
CCDS48 MWAMESGHLLWALLFMQSLW----PQLTDGAT-RVYYLGIRDVQWNYAPKGRNVITNQPL
10 20 30 40 50
60 70 80 90
pF1KB4 NLSVT--------------SFKKIVYREY-EPYFKKEKPQSTISGLLGPTLYAEVGDIIK
. ... ..:: .:.:: . . : : . :.:::.: :::::.:
CCDS48 DSDIVASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVAQPAWLGFLGPVLQAEVGDVIL
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB4 VHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKMDDAVAPGREYTYEWSISEDSG
.:.:: : .: .:::.:. : : :::. : : . : ::.: :: . :.:.: : .
CCDS48 IHLKNFATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKADDSVPPGGSHIYNWTIPEGHA
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB4 PTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGT---QKTFDKQIVLLFA
:: :: ::: ::.:: . .:. .::::::. ::.:.: .:.. .. :... :::.
CCDS48 PTDADPACLTWIYHSHVDAPRDIATGLIGPLITCKRGAL-DGNSPPQRQDVDHDFFLLFS
180 190 200 210 220 230
220 230 240 250
pF1KB4 VFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITVCAHDHIS
: ::. :: : :. :...::.: :..:....::. ...
CCDS48 VVDENLSWHLNENIATYCSDPASVDKEDETFQESNRMHAINGFVFGNLPELNMCAQKRVA
240 250 260 270 280 290
260 270 280 290 300 310
pF1KB4 WHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTPK
:::.::.. .. . :.::.: :.... .. :: .::.:. : :.:: . .
CCDS48 WHLFGMGNEIDVHTAFFHGQMLTTRGHHTDVANIFPATFVTAEMVPWEPGTWLISCQVNS
300 310 320 330 340 350
320 330 340 350 360 370
pF1KB4 HLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPVI-PANMDK
:.. :::: .:.: . . . .: . : .::: :.:. :::.:. .. :
CCDS48 HFRDGMQALYKVKSC-SMAPPVDLLTGKVR------QYFIEAHEIQWDYGPMGHDGSTGK
360 370 380 390 400
380 390 400 410 420
pF1KB4 KYRSQHL--DNF----SNQIGKHYKKVMYTQYEDESFTKHTVNPNMKED---GILGPIIR
. : :.: :..:: : :: : ..::.: .. ...:: :::::.::
CCDS48 NLREPGSISDKFFQKSSSRIGGTYWKVRYEAFQDETFQEKM---HLEEDRHLGILGPVIR
410 420 430 440 450 460
430 440 450 460 470 480
pF1KB4 AQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYTYK
:.: ::...:: : ::.:.:. :::: . .: .. ...: . . : .: : ::.
CCDS48 AEVGDTIQVVFYNRASQPFSMQPHGVFYE--KDYEGTVYNDGSSYPGLVA-KPFEKVTYR
470 480 490 500 510 520
490 500 510 520 530 540
pF1KB4 WNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADIEQ
:.. :: .: ::: :.: .: .:: :::.: ::.:.. .: : :...: :
CCDS48 WTVPPHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPLLVCRAGALGADGKQKGVDKEF
530 540 550 560 570 580
550 560 570 580 590 600
pF1KB4 QAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYESNIMSTINGYVPESITTLGFCF
.:.:.::::::: . : . ...: : .:: : .:::.. .. : .:
CCDS48 FLLFTVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDSNRMHAINGFLFSNLPRLDMCK
590 600 610 620 630 640
610 620 630 640 650 660
pF1KB4 DDTVQWHFCSVGTQNEILTIHFTGHSF-IYGKRHEDTLTLFPMRGESVTVTMDNVGTWML
::: ::. ..::.... . : :.. . : :. .. ::: . . ::.::. .
CCDS48 GDTVAWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAM-LFPHTFVMAIMQPDNLGTFEI
650 660 670 680 690 700
670 680 690 700 710
pF1KB4 TSMNSSPRSKKLRLKFRDVKC-----IPDDDEDSYEIF----EPPESTVMATRKMHDRLE
. .: : .: . .: : . .. .:. : : :. . . .
CCDS48 YCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAARIYYIMAEEVEWDYCPDRSWEREWH
710 720 730 740 750 760
720 730 740 750 760
pF1KB4 PEDEESDADYDYQNRLAAALGIR------------SFRNSSLNQEEEEFNLTALA-LENG
..:... : . . . :: : .:: :: .: :. : .:
CCDS48 NQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRIPRPRTGPEE-HLGILGPLIKG
770 780 790 800 810
770 780 790 800 810
pF1KB4 TEFVSSNTDIIVGSNYSSPSNISKF------TVNNLA-EPQKAPSHQQATTAGSPLRHLI
:.. .. .: : : .. :: :: :: .. ..: : :
CCDS48 E--VGDILTVVFKNNASRPYSVHAHGVLESTTVWPLAAEPGEVVTYQWNI----PERSGP
820 830 840 850 860 870
820 830 840 850 860 870
pF1KB4 GKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTGIRLLSLGAGEFKSQEHAKHKGPKVERDQ
: :. : .:. :::.: . : . . . : : : : . . :.
CCDS48 GPNDSACVSWIYYSAV---DPIKDMYSGLVGPLAICQKGILE-------PH-GGRSDMDR
880 890 900 910 920
880 890 900 910 920
pF1KB4 AAKHRF-------SWMKLLAHKVGRHLSQDTGSPSGMRPWEDLPSQDTGSPSRMRPWKDP
: ::. : ..:. : ::: ::
CCDS48 EFALLFLIFDENKSWY--LEENVATHGSQDPGSINLQDETFLESNKMHAINGKLYANLRG
930 940 950 960 970 980
930 940 950 960 970 980
pF1KB4 PSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQDTDEDTAVNNWLISPQNASRAWGESTP
CCDS48 LTMYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGENYRADVVDLFPGTFEVVEMVAS
990 1000 1010 1020 1030 1040
>>CCDS14384.3 HEPH gene_id:9843|Hs108|chrX (1212 aa)
initn: 1749 init1: 411 opt: 900 Z-score: 727.5 bits: 147.6 E(32554): 3.4e-34
Smith-Waterman score: 1378; 31.0% identity (55.6% similar) in 984 aa overlap (8-900:61-1004)
10 20 30
pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVA
::.:. . . : : :..: : .:..
CCDS14 CAQPAWRKVSAPSQDLLITKVMWAMESGHLLWALLFMQSLW----PQLTDGAT-RVYYLG
40 50 60 70 80
40 50 60 70
pF1KB4 AQGISWSYRPEP----TNSSLNLSVT--------------SFKKIVYREY-EPYFKKEKP
. ..:.: :. ::. :. ... ..:: .:.:: . . :
CCDS14 IRDVQWNYAPKGRNVITNQPLDSDIVASSFLKSDKNRIGGTYKKTIYKEYKDDSYTDEVA
90 100 110 120 130 140
80 90 100 110 120 130
pF1KB4 QSTISGLLGPTLYAEVGDIIKVHFKNKADKPLSIHPQGIRYSKLSEGASYLDHTFPAEKM
: . :.:::.: :::::.: .:.:: : .: .:::.:. : : :::. : : . :
CCDS14 QPAWLGFLGPVLQAEVGDVILIHLKNFATRPYTIHPHGVFYEKDSEGSLYPDGSSGPLKA
150 160 170 180 190 200
140 150 160 170 180 190
pF1KB4 DDAVAPGREYTYEWSISEDSGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTL
::.: :: . :.:.: : .:: :: ::: ::.:: . .:. .::::::. ::.:.:
CCDS14 DDSVPPGGSHIYNWTIPEGHAPTDADPACLTWIYHSHVDAPRDIATGLIGPLITCKRGAL
210 220 230 240 250 260
200 210 220 230
pF1KB4 TEGGT---QKTFDKQIVLLFAVFDESKSWS----------------------QSSSLMYT
.:.. .. :... :::.: ::. :: : :. :..
CCDS14 -DGNSPPQRQDVDHDFFLLFSVVDENLSWHLNENIATYCSDPASVDKEDETFQESNRMHA
270 280 290 300 310 320
240 250 260 270 280 290
pF1KB4 VNGYVNGTMPDITVCAHDHISWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATS
.::.: :..:....::. ...:::.::.. .. . :.::.: :.... .. ::
CCDS14 INGFVFGNLPELNMCAQKRVAWHLFGMGNEIDVHTAFFHGQMLTTRGHHTDVANIFPATF
330 340 350 360 370 380
300 310 320 330 340 350
pF1KB4 TTANMTVGPEGKWIISSLTPKHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYF
.::.:. : :.:: . .:.. :::: .:.: . . . .: . : .::
CCDS14 VTAEMVPWEPGTWLISCQVNSHFRDGMQALYKVKSC-SMAPPVDLLTGKVR------QYF
390 400 410 420 430
360 370 380 390 400
pF1KB4 IAAEEVIWDYAPVI-PANMDKKYRSQHL--DNF----SNQIGKHYKKVMYTQYEDESFTK
: :.:. :::.:. .. :. : :.: :..:: : :: : ..::.: .
CCDS14 IEAHEIQWDYGPMGHDGSTGKNLREPGSISDKFFQKSSSRIGGTYWKVRYEAFQDETFQE
440 450 460 470 480 490
410 420 430 440 450 460
pF1KB4 HTVNPNMKED---GILGPIIRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSF
. ...:: :::::.:::.: ::...:: : ::.:.:. :::: . .: .. .
CCDS14 KM---HLEEDRHLGILGPVIRAEVGDTIQVVFYNRASQPFSMQPHGVFYE--KDYEGTVY
500 510 520 530 540 550
470 480 490 500 510 520
pF1KB4 TSGRNNTMIRAVQPGETYTYKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLL
..: . . : .: : ::.:.. :: .: ::: :.: .: .:: :::.: :
CCDS14 NDGSSYPGLVA-KPFEKVTYRWTVPPHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPL
560 570 580 590 600 610
530 540 550 560 570 580
pF1KB4 LICKSRSLDRRGIQRAADIEQQAVFAVFDENKSWYLEDNINKFCENPDEVKRDDPKFYES
:.:.. .: : :...: : .:.:.::::::: . : . ...: : .:
CCDS14 LVCRAGALGADGKQKGVDKEFFLLFTVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDS
620 630 640 650 660 670
590 600 610 620 630 640
pF1KB4 NIMSTINGYVPESITTLGFCFDDTVQWHFCSVGTQNEILTIHFTGHSF-IYGKRHEDTLT
: : .:::.. .. : .: ::: ::. ..::.... . : :.. . : :. ..
CCDS14 NRMHAINGFLFSNLPRLDMCKGDTVAWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAM-
680 690 700 710 720 730
650 660 670 680 690
pF1KB4 LFPMRGESVTVTMDNVGTWMLTSMNSSPRSKKLRLKFRDVKC-----IPDDDEDSYEIF-
::: . . ::.::. . . .: : .: . .: : . .. .:.
CCDS14 LFPHTFVMAIMQPDNLGTFEIYCQAGSHREAGMRAIYNVSQCPGHQATPRQRYQAARIYY
740 750 760 770 780 790
700 710 720 730 740
pF1KB4 ---EPPESTVMATRKMHDRLEPEDEESDADYDYQNRLAAALGIR------------SFRN
: : :. . . . ..:... : . . . :: : .::
CCDS14 IMAEEVEWDYCPDRSWEREWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRI
800 810 820 830 840 850
750 760 770 780 790
pF1KB4 SSLNQEEEEFNLTALA-LENGTEFVSSNTDIIVGSNYSSPSNISKF------TVNNLA-E
:: .: :. : .: :.. .. .: : : .. :: :: :
CCDS14 PRPRTGPEE-HLGILGPLIKGE--VGDILTVVFKNNASRPYSVHAHGVLESTTVWPLAAE
860 870 880 890 900
800 810 820 830 840 850
pF1KB4 PQKAPSHQQATTAGSPLRHLIGKNSVLNSSTAEHSSPYSEDPIEDPLQPDVTGIRLLSLG
: .. ..: : : : :. : .:. :::.: . : . . . :
CCDS14 PGEVVTYQWNI----PERSGPGPNDSACVSWIYYSAV---DPIKDMYSGLVGPLAICQKG
910 920 930 940 950 960
860 870 880 890 900
pF1KB4 AGEFKSQEHAKHKGPKVERDQAAKHRF-------SWMKLLAHKVGRHLSQDTGSPSGMRP
: : : . . :. : ::. : ..:. : ::: ::
CCDS14 ILE-------PH-GGRSDMDREFALLFLIFDENKSWY--LEENVATHGSQDPGSINLQDE
970 980 990 1000 1010
910 920 930 940 950 960
pF1KB4 WEDLPSQDTGSPSRMRPWKDPPSDLLLLKQSNSSKILVGRWHLASEKGSYEIIQDTDEDT
CCDS14 TFLESNKMHAINGKLYANLRGLTMYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGEN
1020 1030 1040 1050 1060 1070
>>CCDS81918.1 MFGE8 gene_id:4240|Hs108|chr15 (343 aa)
initn: 637 init1: 411 opt: 882 Z-score: 721.3 bits: 144.6 E(32554): 7.5e-34
Smith-Waterman score: 882; 41.5% identity (70.3% similar) in 337 aa overlap (1894-2221:13-343)
1870 1880 1890 1900 1910 1920
pF1KB4 LLPGSFKTLEMKASKPGWWLLNTEVGENQRAGMQTPFLIMDRDCRMPMGLSTGIISDSQI
: . .: :.. .: :.:: .: :..:::
CCDS81 MPRPRLLAALCGALLCAPSLLVALECVEPLGLENGNIANSQI
10 20 30 40
1930 1940 1950 1960 1970
pF1KB4 KASE----FLG--YWEPRLARLNNGGSYNAWSVEKLAAEFASKPWIQVDMQKEVIITGIQ
:: ::: .: :.::::: .: :::. . ..:::::.. ... .::.
CCDS81 AASSVRVTFLGLQHWVPELARLNRAGMVNAWT----PSSNDDNPWIQVNLLRRMWVTGVV
50 60 70 80 90
1980 1990 2000 2010 2020 2030
pF1KB4 TQGAKHYLKSCYTTEFYVAYSSNQINWQIFKGNSTRNVMYFNGNSDASTIKENQFDPPIV
::::.. . : : :::: : ... : . ... : :: . .... : :. :.
CCDS81 TQGASRLASHEYLKAFKVAYSLNGHEFD-FIHDVNKKHKEFVGNWNKNAVHVNLFETPVE
100 110 120 130 140 150
2040 2050 2060 2070 2080 2090
pF1KB4 ARYIRISPTRAYNRPTLRLELQGCEVNGCSTPLGMENGKIENKQITASSFKKSWWGDY--
:.:.:. :: .. :::.:: :::.:::..:::..:..: .::::::: :.: : .
CCDS81 AQYVRLYPTSCHTACTLRFELLGCELNGCANPLGLKNNSIPDKQITASSSYKTW-GLHLF
160 170 180 190 200 210
2100 2110 2120 2130 2140 2150
pF1KB4 -WEPFRARLNAQGRVNAWQAKANNNKQWLEIDLLKIKKITAIITQGCKSLSSEMYVKSYT
:.: :::. :: ::: : . .: :::..:: . :..:.::::: ....: ..: ::
CCDS81 SWNPSYARLDKQGNFNAWVAGSYGNDQWLQVDLGSSKEVTGIITQGARNFGSVQFVASYK
220 230 240 250 260 270
2160 2170 2180 2190 2200 2210
pF1KB4 IHYSEQGVEWKPYRLKSSMVDKIFEGNTNTKGHVKNFFNPPIISRFIRVIPKTWNQSIAL
. ::.....: :. . .::: :: ....: ::.:. ::..:..:..: .:.. :::
CCDS81 VAYSNDSANWTEYQDPRTGSSKIFPGNWDNHSHKKNLFETPILARYVRILPVAWHNRIAL
280 290 300 310 320 330
2220
pF1KB4 RLELFGCDIY
::::.::
CCDS81 RLELLGC
340
>>CCDS14385.1 HEPH gene_id:9843|Hs108|chrX (891 aa)
initn: 1196 init1: 411 opt: 889 Z-score: 720.7 bits: 145.8 E(32554): 8e-34
Smith-Waterman score: 1271; 34.1% identity (60.7% similar) in 695 aa overlap (30-663:111-777)
10 20 30 40 50
pF1KB4 MFPGCPRLWVLVVLGTSWVGWGSQGTEAAQLRQFYVAAQGISWSYRPEPTNSSL--NL-
..::... :. :.:.: : ..: ::
CCDS14 QVNSHFRDGMQALYKVKSCSMAPPVDLLTGKVRQYFIEAHEIQWDYGPMGHDGSTGKNLR
90 100 110 120 130 140
60 70 80 90
pF1KB4 ---SVTS--FKKIVYR--------EYEPYFKKEKPQSTIS-------GLLGPTLYAEVGD
:... :.: : .:: :. : : . :.:::.. :::::
CCDS14 EPGSISDKFFQKSSSRIGGTYWKVRYEA-FQDETFQEKMHLEEDRHLGILGPVIRAEVGD
150 160 170 180 190
100 110 120 130 140 150
pF1KB4 IIKVHFKNKADKPLSIHPQGIRYSKLSEGASYLD-HTFPAEKMDDAVAPGREYTYEWSIS
:.: : :.:..:.:..:.:. : : ::. : : ..:. .. : .. ::.:..
CCDS14 TIQVVFYNRASQPFSMQPHGVFYEKDYEGTVYNDGSSYPGL----VAKPFEKVTYRWTVP
200 210 220 230 240 250
160 170 180 190 200 210
pF1KB4 EDSGPTHDDPPCLTHIYYSHENLIEDFNSGLIGPLLICKKGTLTEGGTQKTFDKQIVLLF
.::: .:: ::: .:.: . :.: ::::.::::.:. :.: : :: ::.. :::
CCDS14 PHAGPTAQDPACLTWMYFSAADPIRDTNSGLVGPLLVCRAGALGADGKQKGVDKEFFLLF
260 270 280 290 300 310
220 230 240 250
pF1KB4 AVFDESKSWS----------------------QSSSLMYTVNGYVNGTMPDITVCAHDHI
.:.::.::: :.:. :...::.. ...: . .: : .
CCDS14 TVLDENKSWYSNANQAAAMLDFRLLSEDIEGFQDSNRMHAINGFLFSNLPRLDMCKGDTV
320 330 340 350 360 370
260 270 280 290 300 310
pF1KB4 SWHLLGMSSGPELFSIHFNGQVLEQNHHKVSAITLVSATSTTANMTVGPEGKWIISSLTP
.:::::... .. .. :.:.... . . .: : : . : : : . : .
CCDS14 AWHLLGLGTETDVHGVMFQGNTVQLQGMRKGAAMLFPHTFVMAIMQPDNLGTFEIYCQAG
380 390 400 410 420 430
320 330 340 350 360 370
pF1KB4 KHLQAGMQAYIDIKNCPKKTRNLKKITREQRRHMKRWEYFIAAEEVIWDYAPVIPANMDK
.: .:::.: ....:: .. : .:: . : :.: :::: ::: : . ..
CCDS14 SHREAGMRAIYNVSQCPG-----HQATPRQRYQAARI-YYIMAEEVEWDYCP--DRSWER
440 450 460 470 480
380 390 400 410 420
pF1KB4 KYRSQH---------LDNFSNQIGKHYKKVMYTQYEDESFT--KHTVNPNMKEDGILGPI
....: :.: .. .:..:::... .: : .: . ..:. .. :::::.
CCDS14 EWHNQSEKDSYGYIFLSNKDGLLGSRYKKAVFREYTDGTFRIPRPRTGPE-EHLGILGPL
490 500 510 520 530 540
430 440 450 460 470 480
pF1KB4 IRAQVRDTLKIVFKNMASRPYSIYPHGVTFSPYEDEVNSSFTSGRNNTMIRAVQPGETYT
:...: : : .:::: ::::::.. ::: : ... :..:::. :
CCDS14 IKGEVGDILTVVFKNNASRPYSVHAHGVLES--------------TTVWPLAAEPGEVVT
550 560 570 580 590
490 500 510 520 530 540
pF1KB4 YKWNILEFDEPTENDAQCLTRPYYSDVDIMRDIASGLIGLLLICKSRSLDRRGIQRAADI
:.::: : . : ::. :.. ::: :: ..:. :::.: : ::.. :. .: . :
CCDS14 YQWNIPERSGPGPNDSACVSWIYYSAVDPIKDMYSGLVGPLAICQKGILEPHGGRSDMDR
600 610 620 630 640 650
550 560 570 580 590 600
pF1KB4 EQQAVFAVFDENKSWYLEDNINKF-CENPDEVKRDDPKFYESNIMSTINGYVPESITTLG
: .: .::::::::::.:. ..: .. .: : ::: : .::: . .. :
CCDS14 EFALLFLIFDENKSWYLEENVATHGSQDPGSINLQDETFLESNKMHAINGKLYANLRGLT
660 670 680 690 700 710
610 620 630 640 650
pF1KB4 FCFDDTVQWHFCSVGTQNEILTIHFTGHSFIY--GKRHE-DTLTLFPMRGESVTVTMDNV
. . : :.. ..: . .. :::: ..::.: :. .. :.. ::: : : .. .:
CCDS14 MYQGERVAWYMLAMGQDVDLHTIHFHAESFLYRNGENYRADVVDLFPGTFEVVEMVASNP
720 730 740 750 760 770
660 670 680 690 700 710
pF1KB4 GTWMLTSMNSSPRSKKLRLKFRDVKCIPDDDEDSYEIFEPPESTVMATRKMHDRLEPEDE
:::..
CCDS14 GTWLMHCHVTDHVHAGMETLFTVFSRTEHLSPLTVITKETEKAVPPRDIEEGNVKMLGMQ
780 790 800 810 820 830
2224 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 22:10:06 2016 done: Thu Nov 3 22:10:07 2016
Total Scan time: 6.540 Total Display time: 0.790
Function used was FASTA [36.3.4 Apr, 2011]