FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4592, 1191 aa
1>>>pF1KE4592 1191 - 1191 aa - 1191 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 20.0677+/-0.000512; mu= -45.5803+/- 0.032
mean_var=999.6228+/-208.241, 0's: 0 Z-trim(126.8): 229 B-trim: 2411 in 1/61
Lambda= 0.040565
statistics sampled from 53207 (53574) to 53207 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.838), E-opt: 0.2 (0.628), width: 16
Scan time: 20.200
The best scores are: opt bits E(85289)
NP_001931 (OMIM: 125370,607462) atrophin-1 [Homo s (1190) 8372 506.2 4.9e-142
NP_001007027 (OMIM: 125370,607462) atrophin-1 [Hom (1190) 8372 506.2 4.9e-142
NP_001036147 (OMIM: 605226,616975) arginine-glutam (1012) 1791 121.1 3.7e-26
XP_005263523 (OMIM: 605226,616975) PREDICTED: argi (1298) 1791 121.1 4.5e-26
XP_011539812 (OMIM: 605226,616975) PREDICTED: argi (1524) 1791 121.2 5.2e-26
NP_036234 (OMIM: 605226,616975) arginine-glutamic (1566) 1791 121.2 5.3e-26
XP_016856848 (OMIM: 605226,616975) PREDICTED: argi (1566) 1791 121.2 5.3e-26
XP_005263521 (OMIM: 605226,616975) PREDICTED: argi (1566) 1791 121.2 5.3e-26
XP_016856847 (OMIM: 605226,616975) PREDICTED: argi (1566) 1791 121.2 5.3e-26
NP_001036146 (OMIM: 605226,616975) arginine-glutam (1566) 1791 121.2 5.3e-26
XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 667 55.5 4.2e-06
XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 667 55.5 4.2e-06
XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 667 55.5 4.2e-06
XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 667 55.5 4.2e-06
XP_011539813 (OMIM: 605226,616975) PREDICTED: argi (1181) 520 46.7 0.001
NP_061939 (OMIM: 176270,605283,615547) MAGE-like p (1249) 514 46.4 0.0014
XP_011544221 (OMIM: 608601) PREDICTED: probable fi ( 958) 490 44.9 0.0029
NP_624361 (OMIM: 603024,614607) AT-rich interactiv (2068) 502 45.8 0.0034
XP_011544219 (OMIM: 608601) PREDICTED: probable fi ( 970) 486 44.7 0.0035
NP_001098549 (OMIM: 608601) probable fibrosin-1 [H ( 980) 486 44.7 0.0035
NP_006239 (OMIM: 168810) basic salivary proline-ri ( 416) 468 43.4 0.0037
NP_006006 (OMIM: 603024,614607) AT-rich interactiv (2285) 502 45.8 0.0037
XP_005257115 (OMIM: 114000,120150,130000,130060,16 (1374) 490 45.0 0.004
XP_016867496 (OMIM: 604918,608027) PREDICTED: prot (2561) 502 45.9 0.004
XP_016867495 (OMIM: 604918,608027) PREDICTED: prot (2838) 502 45.9 0.0044
XP_011522643 (OMIM: 114000,120150,130000,130060,16 (1398) 478 44.3 0.0065
NP_000079 (OMIM: 114000,120150,130000,130060,16620 (1464) 478 44.3 0.0068
XP_005257116 (OMIM: 114000,120150,130000,130060,16 (1158) 471 43.8 0.0074
>>NP_001931 (OMIM: 125370,607462) atrophin-1 [Homo sapie (1190 aa)
initn: 5167 init1: 5167 opt: 8372 Z-score: 2671.1 bits: 506.2 E(85289): 4.9e-142
Smith-Waterman score: 8372; 99.9% identity (99.9% similar) in 1191 aa overlap (1-1191:1-1190)
10 20 30 40 50 60
pF1KE4 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 HHHQQQQQQQQQQQQQQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL
:::::::::::::::::::::: :::::::::::::::::::::::::::::::::::::
NP_001 HHHQQQQQQQQQQQQQQQQQQQ-HHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL
490 500 510 520 530
550 560 570 580 590 600
pF1KE4 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE4 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP
600 610 620 630 640 650
670 680 690 700 710 720
pF1KE4 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP
660 670 680 690 700 710
730 740 750 760 770 780
pF1KE4 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR
720 730 740 750 760 770
790 800 810 820 830 840
pF1KE4 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV
780 790 800 810 820 830
850 860 870 880 890 900
pF1KE4 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN
840 850 860 870 880 890
910 920 930 940 950 960
pF1KE4 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KE4 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE
960 970 980 990 1000 1010
1030 1040 1050 1060 1070 1080
pF1KE4 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL
1020 1030 1040 1050 1060 1070
1090 1100 1110 1120 1130 1140
pF1KE4 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ
1080 1090 1100 1110 1120 1130
1150 1160 1170 1180 1190
pF1KE4 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
:::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
1140 1150 1160 1170 1180 1190
>>NP_001007027 (OMIM: 125370,607462) atrophin-1 [Homo sa (1190 aa)
initn: 5167 init1: 5167 opt: 8372 Z-score: 2671.1 bits: 506.2 E(85289): 4.9e-142
Smith-Waterman score: 8372; 99.9% identity (99.9% similar) in 1191 aa overlap (1-1191:1-1190)
10 20 30 40 50 60
pF1KE4 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 HHHQQQQQQQQQQQQQQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL
:::::::::::::::::::::: :::::::::::::::::::::::::::::::::::::
NP_001 HHHQQQQQQQQQQQQQQQQQQQ-HHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL
490 500 510 520 530
550 560 570 580 590 600
pF1KE4 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE4 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP
600 610 620 630 640 650
670 680 690 700 710 720
pF1KE4 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP
660 670 680 690 700 710
730 740 750 760 770 780
pF1KE4 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR
720 730 740 750 760 770
790 800 810 820 830 840
pF1KE4 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV
780 790 800 810 820 830
850 860 870 880 890 900
pF1KE4 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN
840 850 860 870 880 890
910 920 930 940 950 960
pF1KE4 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KE4 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE
960 970 980 990 1000 1010
1030 1040 1050 1060 1070 1080
pF1KE4 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL
1020 1030 1040 1050 1060 1070
1090 1100 1110 1120 1130 1140
pF1KE4 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ
1080 1090 1100 1110 1120 1130
1150 1160 1170 1180 1190
pF1KE4 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
:::::::::::::::::::::::::::::::::::::::::::::::::::
NP_001 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
1140 1150 1160 1170 1180 1190
>>NP_001036147 (OMIM: 605226,616975) arginine-glutamic a (1012 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 590.6 bits: 121.1 E(85289): 3.7e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:18-1012)
10 20 30
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP-------REELRSRGRASP
:.::... ::: .::::::. .: :..:: :: ::
NP_001 MFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSPINEDIRSSGRNSP
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE4 GGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESESEETNAPKKTKTEQ
...::::.:.::: ...:::.. ::::.: : ::. : . :..: . .. ::::: :
NP_001 SAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEEADRTSSKKTKT-Q
70 80 90 100 110
100 110 120 130 140 150
pF1KE4 ELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPGSVENDSDSSSGLS
:. ::.:::. . : :.::.::.:::::.::::::::::::: :: . :.:::::. .
NP_001 EISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQDNESDSDSSAQQQ
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE4 QGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGA
. :.: :. : : . ::: :: .:
NP_001 MLQAQP--------PALQAPTG--------------VTP----------------APSSA
180 190 200
220 230 240 250 260 270
pF1KE4 PPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTTPISVSSSGASGAP
:: ::: :: : .. . :: .:. .::.. :: : ::.: : . . ::
NP_001 PPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTAP--VPHTHIQQAP
210 220 230 240 250
280 290 300 310 320
pF1KE4 PTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP--PGLGAQPLPGHL
.: : :: :: :: .:. :: :.::......: :. . :: :.
NP_001 ALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPSAPSHAQPPLHGQG
260 270 280 290
330 340 350 360 370 380
pF1KE4 P-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPYSSSSSSSAAASSS
: .::.. : ::: :.: .::: .:.. :: ..: :::
NP_001 PPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP--------LGTSPAAAYPH
300 310 320 330 340
390 400 410 420 430 440
pF1KE4 SSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQAVWSQGPPPPPPY
.: . .:::: ..:. :.:::. :: :. . . :::
NP_001 TSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAPLAMPHIKPPPTT-
350 360 370 380
450 460 470 480 490 500
pF1KE4 GRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQQQQQQQQQHHGNS
:.: . :. ::: : . . .. :.
NP_001 ------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--------------NA
390 400
510 520 530 540 550 560
pF1KE4 GPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPPPHSQVSYSQAGPN
. ::: :. .:: . :.:: : : : : . .: : .::. :: .: :: :
NP_001 NLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PPGLTQ---SQNLP-
410 420 430 440 450 460
570 580 590 600 610 620
pF1KE4 GPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTSSATLSTVIATVAS
:: : ::: :. : :: : : : :
NP_001 -PP----------------PASHP-PTGLHQVAPQPPFAQHPFV----------------
470 480
630 640 650 660 670 680
pF1KE4 SPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTPPGYRGTSPPAGPG
: :::: ::: . :: : ::::::
NP_001 ---------PGGPPPI-------------TPP-----TCPSTST----------PPAGPG
490 500
690 700 710 720 730 740
pF1KE4 TFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEPAEEYETPESPVPP
: .. : : :. :: : .:. :: ..:::.: .. : :::: ::
NP_001 T------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEALDDAEEPESPPPP
510 520 530 540 550
750 760 770 780 790 800
pF1KE4 ARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGSKLAKKRADLVEKV
::::: : :::.:::::::::: ::::::.:::::.::::.:: :::::::: . .::.
NP_001 PRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGSKLAKKREEAIEKA
560 570 580 590 600 610
810 820 830 840 850 860
pF1KE4 RREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRAPVECPSL-GPVPH
.:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: . :.: ::
NP_001 KREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR--LSDPQLSGPGHM
620 630 640 650 660 670
870 880 890 900 910
pF1KE4 RPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFYVPLGAVDPGLLGY
:: ::: ...:.::::.::::::::::::::::::::: :::::::.::. .:: ::.:
NP_001 RPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFYMPLNPTDP-LLAY
680 690 700 710 720 730
920 930 940 950 960 970
pF1KE4 NVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSELEPLHGVPGPGLDP
..:.::. ::. :::: :: :::.::.:.:::::::: ::.::: . .: ..
NP_001 HMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPELDPLHPAANP-MEH
740 750 760 770 780 790
980 990 1000 1010 1020 1030
pF1KE4 FPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMSYAERLAAERQHAE
: ::..:.. : : ::: :::.:.:::::::::: :: :::.::: .:::::: :::
NP_001 FARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMSYPDRLAAERIHAE
800 810 820 830 840 850
1040 1050 1060 1070 1080
pF1KE4 RVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-VHPLIDPLASGSH
:.:.: .::::::::.:::::::::::::::::::::: .: .::. ::::.:::..: :
NP_001 RMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGPVHPLVDPLTAGPH
860 870 880 890 900 910
1090 1100 1110 1120 1130 1140
pF1KE4 LTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPMSAAHQLQAMHAQS
:.:.::: :::::::: .: ::.:.::: .:..:: ::::... :::::::::::::::
NP_001 LARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPMSAAHQLQAMHAQS
920 930 940 950 960 970
1150 1160 1170 1180 1190
pF1KE4 AELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
:::::::.::: :::.: .:. ::.::::::.::::.:: :
NP_001 AELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
980 990 1000 1010
>>XP_005263523 (OMIM: 605226,616975) PREDICTED: arginine (1298 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 589.0 bits: 121.1 E(85289): 4.5e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:304-1298)
10 20
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------
:.::... ::: .::::::. .:
XP_005 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP
280 290 300 310 320 330
30 40 50 60 70 80
pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES
:..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..:
XP_005 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE
340 350 360 370 380 390
90 100 110 120 130
pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG
. .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: ::
XP_005 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ
400 410 420 430 440 450
140 150 160 170 180 190
pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME
. :.:::::. .. :.: :. : : . :::
XP_005 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP--------
460 470 480
200 210 220 230 240 250
pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT
:: .::: ::: :: : .. . :: .:. .::.. :: : ::.
XP_005 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA
490 500 510 520
260 270 280 290 300 310
pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP-
: : . . :: .: : :: :: :: .:. :: :.::......:
XP_005 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS
530 540 550 560
320 330 340 350 360 370
pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY
:. . :: :. : .::.. : ::: :.: .::: .:.. ::
XP_005 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------
570 580 590 600 610
380 390 400 410 420 430
pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ
..: ::: .: . .:::: ..:. :.:::. :: :.
XP_005 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP
620 630 640 650
440 450 460 470 480 490
pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ
. . ::: :.: . :. ::: : . . ..
XP_005 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM---
660 670 680 690
500 510 520 530 540 550
pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP
:.. ::: :. .:: . :.:: : : : : . .: : .::. ::
XP_005 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP
700 710 720 730
560 570 580 590 600 610
pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS
.: :: : :: : ::: :. : :: : : : :
XP_005 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---
740 750 760 770
620 630 640 650 660 670
pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP
: :::: ::: . :: :
XP_005 ----------------------PGGPPPI-------------TPP-----TCPSTST---
780
680 690 700 710 720 730
pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP
::::::: .. : : :. :: : .:. :: ..:::.:
XP_005 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA
790 800 810 820
740 750 760 770 780 790
pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS
.. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: ::
XP_005 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS
830 840 850 860 870 880
800 810 820 830 840
pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA
:::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.:::
XP_005 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR-
890 900 910 920 930 940
850 860 870 880 890 900
pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY
. :.: :: :: ::: ...:.::::.::::::::::::::::::::: :::::::
XP_005 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY
950 960 970 980 990 1000
910 920 930 940 950
pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL
.::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: ::
XP_005 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL
1010 1020 1030 1040 1050 1060
960 970 980 990 1000 1010
pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS
.::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.::
XP_005 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS
1070 1080 1090 1100 1110 1120
1020 1030 1040 1050 1060 1070
pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-
: .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::.
XP_005 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP
1130 1140 1150 1160 1170 1180
1080 1090 1100 1110 1120 1130
pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM
::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::
XP_005 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM
1190 1200 1210 1220 1230 1240
1140 1150 1160 1170 1180 1190
pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: :
XP_005 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
1250 1260 1270 1280 1290
>>XP_011539812 (OMIM: 605226,616975) PREDICTED: arginine (1524 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 588.0 bits: 121.2 E(85289): 5.2e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:530-1524)
10 20
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------
:.::... ::: .::::::. .:
XP_011 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP
500 510 520 530 540 550
30 40 50 60 70 80
pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES
:..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..:
XP_011 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE
560 570 580 590 600 610
90 100 110 120 130
pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG
. .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: ::
XP_011 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ
620 630 640 650 660 670
140 150 160 170 180 190
pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME
. :.:::::. .. :.: :. : : . :::
XP_011 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP--------
680 690 700
200 210 220 230 240 250
pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT
:: .::: ::: :: : .. . :: .:. .::.. :: : ::.
XP_011 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA
710 720 730 740 750
260 270 280 290 300 310
pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP-
: : . . :: .: : :: :: :: .:. :: :.::......:
XP_011 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS
760 770 780 790
320 330 340 350 360 370
pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY
:. . :: :. : .::.. : ::: :.: .::: .:.. ::
XP_011 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------
800 810 820 830 840
380 390 400 410 420 430
pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ
..: ::: .: . .:::: ..:. :.:::. :: :.
XP_011 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP
850 860 870 880
440 450 460 470 480 490
pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ
. . ::: :.: . :. ::: : . . ..
XP_011 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM---
890 900 910
500 510 520 530 540 550
pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP
:.. ::: :. .:: . :.:: : : : : . .: : .::. ::
XP_011 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP
920 930 940 950 960
560 570 580 590 600 610
pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS
.: :: : :: : ::: :. : :: : : : :
XP_011 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---
970 980 990
620 630 640 650 660 670
pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP
: :::: ::: . :: :
XP_011 ----------------------PGGPPPI-------------TPP-----TCPSTST---
1000 1010
680 690 700 710 720 730
pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP
::::::: .. : : :. :: : .:. :: ..:::.:
XP_011 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA
1020 1030 1040 1050
740 750 760 770 780 790
pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS
.. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: ::
XP_011 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS
1060 1070 1080 1090 1100 1110
800 810 820 830 840
pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA
:::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.:::
XP_011 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR-
1120 1130 1140 1150 1160 1170
850 860 870 880 890 900
pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY
. :.: :: :: ::: ...:.::::.::::::::::::::::::::: :::::::
XP_011 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY
1180 1190 1200 1210 1220 1230
910 920 930 940 950
pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL
.::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: ::
XP_011 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL
1240 1250 1260 1270 1280 1290
960 970 980 990 1000 1010
pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS
.::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.::
XP_011 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS
1300 1310 1320 1330 1340
1020 1030 1040 1050 1060 1070
pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-
: .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::.
XP_011 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP
1350 1360 1370 1380 1390 1400
1080 1090 1100 1110 1120 1130
pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM
::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::
XP_011 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM
1410 1420 1430 1440 1450 1460
1140 1150 1160 1170 1180 1190
pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: :
XP_011 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
1470 1480 1490 1500 1510 1520
>>NP_036234 (OMIM: 605226,616975) arginine-glutamic acid (1566 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566)
10 20
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------
:.::... ::: .::::::. .:
NP_036 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP
550 560 570 580 590 600
30 40 50 60 70 80
pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES
:..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..:
NP_036 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE
610 620 630 640 650 660
90 100 110 120 130
pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG
. .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: ::
NP_036 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ
670 680 690 700 710
140 150 160 170 180 190
pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME
. :.:::::. .. :.: :. : : . :::
NP_036 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP--------
720 730 740
200 210 220 230 240 250
pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT
:: .::: ::: :: : .. . :: .:. .::.. :: : ::.
NP_036 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA
750 760 770 780 790
260 270 280 290 300 310
pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP-
: : . . :: .: : :: :: :: .:. :: :.::......:
NP_036 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS
800 810 820 830
320 330 340 350 360 370
pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY
:. . :: :. : .::.. : ::: :.: .::: .:.. ::
NP_036 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------
840 850 860 870 880
380 390 400 410 420 430
pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ
..: ::: .: . .:::: ..:. :.:::. :: :.
NP_036 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP
890 900 910 920
440 450 460 470 480 490
pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ
. . ::: :.: . :. ::: : . . ..
NP_036 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM---
930 940 950
500 510 520 530 540 550
pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP
:.. ::: :. .:: . :.:: : : : : . .: : .::. ::
NP_036 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP
960 970 980 990 1000
560 570 580 590 600 610
pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS
.: :: : :: : ::: :. : :: : : : :
NP_036 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---
1010 1020 1030 1040
620 630 640 650 660 670
pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP
: :::: ::: . :: :
NP_036 ----------------------PGGPPPI-------------TPP-----TCPSTST---
1050
680 690 700 710 720 730
pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP
::::::: .. : : :. :: : .:. :: ..:::.:
NP_036 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA
1060 1070 1080 1090
740 750 760 770 780 790
pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS
.. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: ::
NP_036 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS
1100 1110 1120 1130 1140 1150
800 810 820 830 840
pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA
:::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.:::
NP_036 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR-
1160 1170 1180 1190 1200 1210
850 860 870 880 890 900
pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY
. :.: :: :: ::: ...:.::::.::::::::::::::::::::: :::::::
NP_036 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY
1220 1230 1240 1250 1260 1270
910 920 930 940 950
pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL
.::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: ::
NP_036 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL
1280 1290 1300 1310 1320 1330
960 970 980 990 1000 1010
pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS
.::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.::
NP_036 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS
1340 1350 1360 1370 1380 1390
1020 1030 1040 1050 1060 1070
pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-
: .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::.
NP_036 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP
1400 1410 1420 1430 1440 1450
1080 1090 1100 1110 1120 1130
pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM
::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::
NP_036 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM
1460 1470 1480 1490 1500 1510
1140 1150 1160 1170 1180 1190
pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: :
NP_036 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
1520 1530 1540 1550 1560
>>XP_016856848 (OMIM: 605226,616975) PREDICTED: arginine (1566 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566)
10 20
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------
:.::... ::: .::::::. .:
XP_016 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP
550 560 570 580 590 600
30 40 50 60 70 80
pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES
:..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..:
XP_016 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE
610 620 630 640 650 660
90 100 110 120 130
pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG
. .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: ::
XP_016 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ
670 680 690 700 710
140 150 160 170 180 190
pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME
. :.:::::. .. :.: :. : : . :::
XP_016 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP--------
720 730 740
200 210 220 230 240 250
pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT
:: .::: ::: :: : .. . :: .:. .::.. :: : ::.
XP_016 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA
750 760 770 780 790
260 270 280 290 300 310
pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP-
: : . . :: .: : :: :: :: .:. :: :.::......:
XP_016 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS
800 810 820 830
320 330 340 350 360 370
pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY
:. . :: :. : .::.. : ::: :.: .::: .:.. ::
XP_016 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------
840 850 860 870 880
380 390 400 410 420 430
pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ
..: ::: .: . .:::: ..:. :.:::. :: :.
XP_016 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP
890 900 910 920
440 450 460 470 480 490
pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ
. . ::: :.: . :. ::: : . . ..
XP_016 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM---
930 940 950
500 510 520 530 540 550
pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP
:.. ::: :. .:: . :.:: : : : : . .: : .::. ::
XP_016 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP
960 970 980 990 1000
560 570 580 590 600 610
pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS
.: :: : :: : ::: :. : :: : : : :
XP_016 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---
1010 1020 1030 1040
620 630 640 650 660 670
pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP
: :::: ::: . :: :
XP_016 ----------------------PGGPPPI-------------TPP-----TCPSTST---
1050
680 690 700 710 720 730
pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP
::::::: .. : : :. :: : .:. :: ..:::.:
XP_016 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA
1060 1070 1080 1090
740 750 760 770 780 790
pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS
.. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: ::
XP_016 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS
1100 1110 1120 1130 1140 1150
800 810 820 830 840
pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA
:::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.:::
XP_016 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR-
1160 1170 1180 1190 1200 1210
850 860 870 880 890 900
pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY
. :.: :: :: ::: ...:.::::.::::::::::::::::::::: :::::::
XP_016 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY
1220 1230 1240 1250 1260 1270
910 920 930 940 950
pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL
.::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: ::
XP_016 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL
1280 1290 1300 1310 1320 1330
960 970 980 990 1000 1010
pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS
.::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.::
XP_016 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS
1340 1350 1360 1370 1380 1390
1020 1030 1040 1050 1060 1070
pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-
: .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::.
XP_016 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP
1400 1410 1420 1430 1440 1450
1080 1090 1100 1110 1120 1130
pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM
::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::
XP_016 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM
1460 1470 1480 1490 1500 1510
1140 1150 1160 1170 1180 1190
pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: :
XP_016 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
1520 1530 1540 1550 1560
>>XP_005263521 (OMIM: 605226,616975) PREDICTED: arginine (1566 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566)
10 20
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------
:.::... ::: .::::::. .:
XP_005 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP
550 560 570 580 590 600
30 40 50 60 70 80
pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES
:..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..:
XP_005 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE
610 620 630 640 650 660
90 100 110 120 130
pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG
. .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: ::
XP_005 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ
670 680 690 700 710
140 150 160 170 180 190
pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME
. :.:::::. .. :.: :. : : . :::
XP_005 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP--------
720 730 740
200 210 220 230 240 250
pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT
:: .::: ::: :: : .. . :: .:. .::.. :: : ::.
XP_005 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA
750 760 770 780 790
260 270 280 290 300 310
pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP-
: : . . :: .: : :: :: :: .:. :: :.::......:
XP_005 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS
800 810 820 830
320 330 340 350 360 370
pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY
:. . :: :. : .::.. : ::: :.: .::: .:.. ::
XP_005 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------
840 850 860 870 880
380 390 400 410 420 430
pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ
..: ::: .: . .:::: ..:. :.:::. :: :.
XP_005 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP
890 900 910 920
440 450 460 470 480 490
pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ
. . ::: :.: . :. ::: : . . ..
XP_005 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM---
930 940 950
500 510 520 530 540 550
pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP
:.. ::: :. .:: . :.:: : : : : . .: : .::. ::
XP_005 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP
960 970 980 990 1000
560 570 580 590 600 610
pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS
.: :: : :: : ::: :. : :: : : : :
XP_005 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---
1010 1020 1030 1040
620 630 640 650 660 670
pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP
: :::: ::: . :: :
XP_005 ----------------------PGGPPPI-------------TPP-----TCPSTST---
1050
680 690 700 710 720 730
pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP
::::::: .. : : :. :: : .:. :: ..:::.:
XP_005 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA
1060 1070 1080 1090
740 750 760 770 780 790
pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS
.. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: ::
XP_005 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS
1100 1110 1120 1130 1140 1150
800 810 820 830 840
pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA
:::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.:::
XP_005 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR-
1160 1170 1180 1190 1200 1210
850 860 870 880 890 900
pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY
. :.: :: :: ::: ...:.::::.::::::::::::::::::::: :::::::
XP_005 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY
1220 1230 1240 1250 1260 1270
910 920 930 940 950
pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL
.::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: ::
XP_005 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL
1280 1290 1300 1310 1320 1330
960 970 980 990 1000 1010
pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS
.::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.::
XP_005 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS
1340 1350 1360 1370 1380 1390
1020 1030 1040 1050 1060 1070
pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-
: .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::.
XP_005 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP
1400 1410 1420 1430 1440 1450
1080 1090 1100 1110 1120 1130
pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM
::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::
XP_005 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM
1460 1470 1480 1490 1500 1510
1140 1150 1160 1170 1180 1190
pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: :
XP_005 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
1520 1530 1540 1550 1560
>>XP_016856847 (OMIM: 605226,616975) PREDICTED: arginine (1566 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566)
10 20
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------
:.::... ::: .::::::. .:
XP_016 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP
550 560 570 580 590 600
30 40 50 60 70 80
pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES
:..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..:
XP_016 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE
610 620 630 640 650 660
90 100 110 120 130
pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG
. .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: ::
XP_016 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ
670 680 690 700 710
140 150 160 170 180 190
pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME
. :.:::::. .. :.: :. : : . :::
XP_016 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP--------
720 730 740
200 210 220 230 240 250
pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT
:: .::: ::: :: : .. . :: .:. .::.. :: : ::.
XP_016 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA
750 760 770 780 790
260 270 280 290 300 310
pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP-
: : . . :: .: : :: :: :: .:. :: :.::......:
XP_016 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS
800 810 820 830
320 330 340 350 360 370
pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY
:. . :: :. : .::.. : ::: :.: .::: .:.. ::
XP_016 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------
840 850 860 870 880
380 390 400 410 420 430
pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ
..: ::: .: . .:::: ..:. :.:::. :: :.
XP_016 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP
890 900 910 920
440 450 460 470 480 490
pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ
. . ::: :.: . :. ::: : . . ..
XP_016 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM---
930 940 950
500 510 520 530 540 550
pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP
:.. ::: :. .:: . :.:: : : : : . .: : .::. ::
XP_016 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP
960 970 980 990 1000
560 570 580 590 600 610
pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS
.: :: : :: : ::: :. : :: : : : :
XP_016 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---
1010 1020 1030 1040
620 630 640 650 660 670
pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP
: :::: ::: . :: :
XP_016 ----------------------PGGPPPI-------------TPP-----TCPSTST---
1050
680 690 700 710 720 730
pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP
::::::: .. : : :. :: : .:. :: ..:::.:
XP_016 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA
1060 1070 1080 1090
740 750 760 770 780 790
pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS
.. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: ::
XP_016 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS
1100 1110 1120 1130 1140 1150
800 810 820 830 840
pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA
:::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.:::
XP_016 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR-
1160 1170 1180 1190 1200 1210
850 860 870 880 890 900
pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY
. :.: :: :: ::: ...:.::::.::::::::::::::::::::: :::::::
XP_016 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY
1220 1230 1240 1250 1260 1270
910 920 930 940 950
pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL
.::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: ::
XP_016 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL
1280 1290 1300 1310 1320 1330
960 970 980 990 1000 1010
pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS
.::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.::
XP_016 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS
1340 1350 1360 1370 1380 1390
1020 1030 1040 1050 1060 1070
pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-
: .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::.
XP_016 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP
1400 1410 1420 1430 1440 1450
1080 1090 1100 1110 1120 1130
pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM
::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::
XP_016 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM
1460 1470 1480 1490 1500 1510
1140 1150 1160 1170 1180 1190
pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: :
XP_016 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
1520 1530 1540 1550 1560
>>NP_001036146 (OMIM: 605226,616975) arginine-glutamic a (1566 aa)
initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26
Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566)
10 20
pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------
:.::... ::: .::::::. .:
NP_001 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP
550 560 570 580 590 600
30 40 50 60 70 80
pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES
:..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..:
NP_001 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE
610 620 630 640 650 660
90 100 110 120 130
pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG
. .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: ::
NP_001 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ
670 680 690 700 710
140 150 160 170 180 190
pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME
. :.:::::. .. :.: :. : : . :::
NP_001 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP--------
720 730 740
200 210 220 230 240 250
pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT
:: .::: ::: :: : .. . :: .:. .::.. :: : ::.
NP_001 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA
750 760 770 780 790
260 270 280 290 300 310
pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP-
: : . . :: .: : :: :: :: .:. :: :.::......:
NP_001 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS
800 810 820 830
320 330 340 350 360 370
pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY
:. . :: :. : .::.. : ::: :.: .::: .:.. ::
NP_001 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------
840 850 860 870 880
380 390 400 410 420 430
pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ
..: ::: .: . .:::: ..:. :.:::. :: :.
NP_001 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP
890 900 910 920
440 450 460 470 480 490
pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ
. . ::: :.: . :. ::: : . . ..
NP_001 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM---
930 940 950
500 510 520 530 540 550
pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP
:.. ::: :. .:: . :.:: : : : : . .: : .::. ::
NP_001 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP
960 970 980 990 1000
560 570 580 590 600 610
pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS
.: :: : :: : ::: :. : :: : : : :
NP_001 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---
1010 1020 1030 1040
620 630 640 650 660 670
pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP
: :::: ::: . :: :
NP_001 ----------------------PGGPPPI-------------TPP-----TCPSTST---
1050
680 690 700 710 720 730
pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP
::::::: .. : : :. :: : .:. :: ..:::.:
NP_001 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA
1060 1070 1080 1090
740 750 760 770 780 790
pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS
.. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: ::
NP_001 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS
1100 1110 1120 1130 1140 1150
800 810 820 830 840
pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA
:::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.:::
NP_001 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR-
1160 1170 1180 1190 1200 1210
850 860 870 880 890 900
pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY
. :.: :: :: ::: ...:.::::.::::::::::::::::::::: :::::::
NP_001 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY
1220 1230 1240 1250 1260 1270
910 920 930 940 950
pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL
.::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: ::
NP_001 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL
1280 1290 1300 1310 1320 1330
960 970 980 990 1000 1010
pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS
.::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.::
NP_001 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS
1340 1350 1360 1370 1380 1390
1020 1030 1040 1050 1060 1070
pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-
: .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::.
NP_001 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP
1400 1410 1420 1430 1440 1450
1080 1090 1100 1110 1120 1130
pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM
::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::
NP_001 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM
1460 1470 1480 1490 1500 1510
1140 1150 1160 1170 1180 1190
pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL
::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: :
NP_001 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL
1520 1530 1540 1550 1560
1191 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 16:58:43 2016 done: Mon Nov 7 16:58:46 2016
Total Scan time: 20.200 Total Display time: 0.410
Function used was FASTA [36.3.4 Apr, 2011]