FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4592, 1191 aa 1>>>pF1KE4592 1191 - 1191 aa - 1191 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 20.0677+/-0.000512; mu= -45.5803+/- 0.032 mean_var=999.6228+/-208.241, 0's: 0 Z-trim(126.8): 229 B-trim: 2411 in 1/61 Lambda= 0.040565 statistics sampled from 53207 (53574) to 53207 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.838), E-opt: 0.2 (0.628), width: 16 Scan time: 20.200 The best scores are: opt bits E(85289) NP_001931 (OMIM: 125370,607462) atrophin-1 [Homo s (1190) 8372 506.2 4.9e-142 NP_001007027 (OMIM: 125370,607462) atrophin-1 [Hom (1190) 8372 506.2 4.9e-142 NP_001036147 (OMIM: 605226,616975) arginine-glutam (1012) 1791 121.1 3.7e-26 XP_005263523 (OMIM: 605226,616975) PREDICTED: argi (1298) 1791 121.1 4.5e-26 XP_011539812 (OMIM: 605226,616975) PREDICTED: argi (1524) 1791 121.2 5.2e-26 NP_036234 (OMIM: 605226,616975) arginine-glutamic (1566) 1791 121.2 5.3e-26 XP_016856848 (OMIM: 605226,616975) PREDICTED: argi (1566) 1791 121.2 5.3e-26 XP_005263521 (OMIM: 605226,616975) PREDICTED: argi (1566) 1791 121.2 5.3e-26 XP_016856847 (OMIM: 605226,616975) PREDICTED: argi (1566) 1791 121.2 5.3e-26 NP_001036146 (OMIM: 605226,616975) arginine-glutam (1566) 1791 121.2 5.3e-26 XP_011536691 (OMIM: 601234) PREDICTED: nascent pol (2078) 667 55.5 4.2e-06 XP_006719477 (OMIM: 601234) PREDICTED: nascent pol (2082) 667 55.5 4.2e-06 XP_006719475 (OMIM: 601234) PREDICTED: nascent pol (2082) 667 55.5 4.2e-06 XP_006719476 (OMIM: 601234) PREDICTED: nascent pol (2082) 667 55.5 4.2e-06 XP_011539813 (OMIM: 605226,616975) PREDICTED: argi (1181) 520 46.7 0.001 NP_061939 (OMIM: 176270,605283,615547) MAGE-like p (1249) 514 46.4 0.0014 XP_011544221 (OMIM: 608601) PREDICTED: probable fi ( 958) 490 44.9 0.0029 NP_624361 (OMIM: 603024,614607) AT-rich interactiv (2068) 502 45.8 0.0034 XP_011544219 (OMIM: 608601) PREDICTED: probable fi ( 970) 486 44.7 0.0035 NP_001098549 (OMIM: 608601) probable fibrosin-1 [H ( 980) 486 44.7 0.0035 NP_006239 (OMIM: 168810) basic salivary proline-ri ( 416) 468 43.4 0.0037 NP_006006 (OMIM: 603024,614607) AT-rich interactiv (2285) 502 45.8 0.0037 XP_005257115 (OMIM: 114000,120150,130000,130060,16 (1374) 490 45.0 0.004 XP_016867496 (OMIM: 604918,608027) PREDICTED: prot (2561) 502 45.9 0.004 XP_016867495 (OMIM: 604918,608027) PREDICTED: prot (2838) 502 45.9 0.0044 XP_011522643 (OMIM: 114000,120150,130000,130060,16 (1398) 478 44.3 0.0065 NP_000079 (OMIM: 114000,120150,130000,130060,16620 (1464) 478 44.3 0.0068 XP_005257116 (OMIM: 114000,120150,130000,130060,16 (1158) 471 43.8 0.0074 >>NP_001931 (OMIM: 125370,607462) atrophin-1 [Homo sapie (1190 aa) initn: 5167 init1: 5167 opt: 8372 Z-score: 2671.1 bits: 506.2 E(85289): 4.9e-142 Smith-Waterman score: 8372; 99.9% identity (99.9% similar) in 1191 aa overlap (1-1191:1-1190) 10 20 30 40 50 60 pF1KE4 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 HHHQQQQQQQQQQQQQQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL :::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::: NP_001 HHHQQQQQQQQQQQQQQQQQQQ-HHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL 490 500 510 520 530 550 560 570 580 590 600 pF1KE4 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY 540 550 560 570 580 590 610 620 630 640 650 660 pF1KE4 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP 600 610 620 630 640 650 670 680 690 700 710 720 pF1KE4 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP 660 670 680 690 700 710 730 740 750 760 770 780 pF1KE4 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR 720 730 740 750 760 770 790 800 810 820 830 840 pF1KE4 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV 780 790 800 810 820 830 850 860 870 880 890 900 pF1KE4 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN 840 850 860 870 880 890 910 920 930 940 950 960 pF1KE4 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KE4 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE 960 970 980 990 1000 1010 1030 1040 1050 1060 1070 1080 pF1KE4 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL 1020 1030 1040 1050 1060 1070 1090 1100 1110 1120 1130 1140 pF1KE4 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ 1080 1090 1100 1110 1120 1130 1150 1160 1170 1180 1190 pF1KE4 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL 1140 1150 1160 1170 1180 1190 >>NP_001007027 (OMIM: 125370,607462) atrophin-1 [Homo sa (1190 aa) initn: 5167 init1: 5167 opt: 8372 Z-score: 2671.1 bits: 506.2 E(85289): 4.9e-142 Smith-Waterman score: 8372; 99.9% identity (99.9% similar) in 1191 aa overlap (1-1191:1-1190) 10 20 30 40 50 60 pF1KE4 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 MKTRQNKDSMSMRSGRKKEAPGPREELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 EASTPKVNKQGRSEEISESESEETNAPKKTKTEQELPRPQSPSDLDSLDGRSLNDDGSSD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PRDIDQDNRSTSPSIYSPGSVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 ASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGAPPPHPQLYPGGTGGVLSGPPMGPKGGGA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 ASSVGGPNGGKQHPPPTTPISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LPPPPALRPLNNASASPPGLGAQPLPGHLPSPHAMGQGMGGLPPGPEKGPTLAPSPHSLP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PASSSAPAPPMRFPYSSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SNQPPKYTQPSLPSQAVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 HHHQQQQQQQQQQQQQQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL :::::::::::::::::::::: ::::::::::::::::::::::::::::::::::::: NP_001 HHHQQQQQQQQQQQQQQQQQQQ-HHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL 490 500 510 520 530 550 560 570 580 590 600 pF1KE4 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 RPYPPGPAHLPPPHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPY 540 550 560 570 580 590 610 620 630 640 650 660 pF1KE4 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PFPPVPTVTTSSATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKP 600 610 620 630 640 650 670 680 690 700 710 720 pF1KE4 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 GSPPSFRTGTPPGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGP 660 670 680 690 700 710 730 740 750 760 770 780 pF1KE4 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 PLSATQIKQEPAEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCAR 720 730 740 750 760 770 790 800 810 820 830 840 pF1KE4 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 SDLYFVPLEGSKLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSV 780 790 800 810 820 830 850 860 870 880 890 900 pF1KE4 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 KLAQEGRAPVECPSLGPVPHRPPFEPGSAVATVPPYLGPDTPALRTLSEYARPHVMSPGN 840 850 860 870 880 890 910 920 930 940 950 960 pF1KE4 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 RNHPFYVPLGAVDPGLLGYNVPALYSSDPAAREREREARERDLRDRLKPGFEVKPSELEP 900 910 920 930 940 950 970 980 990 1000 1010 1020 pF1KE4 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LHGVPGPGLDPFPRHGGLALQPGPPGLHPFPFHPSLGPLERERLALAAGPALRPDMSYAE 960 970 980 990 1000 1010 1030 1040 1050 1060 1070 1080 pF1KE4 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 RLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASASVHPL 1020 1030 1040 1050 1060 1070 1090 1100 1110 1120 1130 1140 pF1KE4 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 IDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPYRDLPASLSAPMSAAHQ 1080 1090 1100 1110 1120 1130 1150 1160 1170 1180 1190 pF1KE4 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::::::::::::::::::::::::::::::::: NP_001 LQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL 1140 1150 1160 1170 1180 1190 >>NP_001036147 (OMIM: 605226,616975) arginine-glutamic a (1012 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 590.6 bits: 121.1 E(85289): 3.7e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:18-1012) 10 20 30 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP-------REELRSRGRASP :.::... ::: .::::::. .: :..:: :: :: NP_001 MFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSPINEDIRSSGRNSP 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 GGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESESEETNAPKKTKTEQ ...::::.:.::: ...:::.. ::::.: : ::. : . :..: . .. ::::: : NP_001 SAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEEADRTSSKKTKT-Q 70 80 90 100 110 100 110 120 130 140 150 pF1KE4 ELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPGSVENDSDSSSGLS :. ::.:::. . : :.::.::.:::::.::::::::::::: :: . :.:::::. . NP_001 EISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQDNESDSDSSAQQQ 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE4 QGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPMEPPTSRMFQAPPGA . :.: :. : : . ::: :: .: NP_001 MLQAQP--------PALQAPTG--------------VTP----------------APSSA 180 190 200 220 230 240 250 260 270 pF1KE4 PPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTTPISVSSSGASGAP :: ::: :: : .. . :: .:. .::.. :: : ::.: : . . :: NP_001 PPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTAP--VPHTHIQQAP 210 220 230 240 250 280 290 300 310 320 pF1KE4 PTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP--PGLGAQPLPGHL .: : :: :: :: .:. :: :.::......: :. . :: :. NP_001 ALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPSAPSHAQPPLHGQG 260 270 280 290 330 340 350 360 370 380 pF1KE4 P-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPYSSSSSSSAAASSS : .::.. : ::: :.: .::: .:.. :: ..: ::: NP_001 PPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP--------LGTSPAAAYPH 300 310 320 330 340 390 400 410 420 430 440 pF1KE4 SSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQAVWSQGPPPPPPY .: . .:::: ..:. :.:::. :: :. . . ::: NP_001 TSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAPLAMPHIKPPPTT- 350 360 370 380 450 460 470 480 490 500 pF1KE4 GRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQQQQQQQQQHHGNS :.: . :. ::: : . . .. :. NP_001 ------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--------------NA 390 400 510 520 530 540 550 560 pF1KE4 GPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPPPHSQVSYSQAGPN . ::: :. .:: . :.:: : : : : . .: : .::. :: .: :: : NP_001 NLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PPGLTQ---SQNLP- 410 420 430 440 450 460 570 580 590 600 610 620 pF1KE4 GPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTSSATLSTVIATVAS :: : ::: :. : :: : : : : NP_001 -PP----------------PASHP-PTGLHQVAPQPPFAQHPFV---------------- 470 480 630 640 650 660 670 680 pF1KE4 SPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTPPGYRGTSPPAGPG : :::: ::: . :: : :::::: NP_001 ---------PGGPPPI-------------TPP-----TCPSTST----------PPAGPG 490 500 690 700 710 720 730 740 pF1KE4 TFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEPAEEYETPESPVPP : .. : : :. :: : .:. :: ..:::.: .. : :::: :: NP_001 T------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEALDDAEEPESPPPP 510 520 530 540 550 750 760 770 780 790 800 pF1KE4 ARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGSKLAKKRADLVEKV ::::: : :::.:::::::::: ::::::.:::::.::::.:: :::::::: . .::. NP_001 PRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGSKLAKKREEAIEKA 560 570 580 590 600 610 810 820 830 840 850 860 pF1KE4 RREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRAPVECPSL-GPVPH .:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: . :.: :: NP_001 KREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR--LSDPQLSGPGHM 620 630 640 650 660 670 870 880 890 900 910 pF1KE4 RPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFYVPLGAVDPGLLGY :: ::: ...:.::::.::::::::::::::::::::: :::::::.::. .:: ::.: NP_001 RPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFYMPLNPTDP-LLAY 680 690 700 710 720 730 920 930 940 950 960 970 pF1KE4 NVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSELEPLHGVPGPGLDP ..:.::. ::. :::: :: :::.::.:.:::::::: ::.::: . .: .. NP_001 HMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPELDPLHPAANP-MEH 740 750 760 770 780 790 980 990 1000 1010 1020 1030 pF1KE4 FPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMSYAERLAAERQHAE : ::..:.. : : ::: :::.:.:::::::::: :: :::.::: .:::::: ::: NP_001 FARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMSYPDRLAAERIHAE 800 810 820 830 840 850 1040 1050 1060 1070 1080 pF1KE4 RVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS-VHPLIDPLASGSH :.:.: .::::::::.:::::::::::::::::::::: .: .::. ::::.:::..: : NP_001 RMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGPVHPLVDPLTAGPH 860 870 880 890 900 910 1090 1100 1110 1120 1130 1140 pF1KE4 LTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPMSAAHQLQAMHAQS :.:.::: :::::::: .: ::.:.::: .:..:: ::::... ::::::::::::::: NP_001 LARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPMSAAHQLQAMHAQS 920 930 940 950 960 970 1150 1160 1170 1180 1190 pF1KE4 AELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL :::::::.::: :::.: .:. ::.::::::.::::.:: : NP_001 AELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 980 990 1000 1010 >>XP_005263523 (OMIM: 605226,616975) PREDICTED: arginine (1298 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 589.0 bits: 121.1 E(85289): 4.5e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:304-1298) 10 20 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------ :.::... ::: .::::::. .: XP_005 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP 280 290 300 310 320 330 30 40 50 60 70 80 pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES :..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..: XP_005 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE 340 350 360 370 380 390 90 100 110 120 130 pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG . .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: :: XP_005 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ 400 410 420 430 440 450 140 150 160 170 180 190 pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME . :.:::::. .. :.: :. : : . ::: XP_005 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP-------- 460 470 480 200 210 220 230 240 250 pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT :: .::: ::: :: : .. . :: .:. .::.. :: : ::. XP_005 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA 490 500 510 520 260 270 280 290 300 310 pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP- : : . . :: .: : :: :: :: .:. :: :.::......: XP_005 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS 530 540 550 560 320 330 340 350 360 370 pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY :. . :: :. : .::.. : ::: :.: .::: .:.. :: XP_005 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------ 570 580 590 600 610 380 390 400 410 420 430 pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ ..: ::: .: . .:::: ..:. :.:::. :: :. XP_005 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP 620 630 640 650 440 450 460 470 480 490 pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ . . ::: :.: . :. ::: : . . .. XP_005 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--- 660 670 680 690 500 510 520 530 540 550 pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP :.. ::: :. .:: . :.:: : : : : . .: : .::. :: XP_005 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP 700 710 720 730 560 570 580 590 600 610 pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS .: :: : :: : ::: :. : :: : : : : XP_005 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV--- 740 750 760 770 620 630 640 650 660 670 pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP : :::: ::: . :: : XP_005 ----------------------PGGPPPI-------------TPP-----TCPSTST--- 780 680 690 700 710 720 730 pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP ::::::: .. : : :. :: : .:. :: ..:::.: XP_005 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA 790 800 810 820 740 750 760 770 780 790 pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS .. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: :: XP_005 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS 830 840 850 860 870 880 800 810 820 830 840 pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA :::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: XP_005 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR- 890 900 910 920 930 940 850 860 870 880 890 900 pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY . :.: :: :: ::: ...:.::::.::::::::::::::::::::: ::::::: XP_005 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY 950 960 970 980 990 1000 910 920 930 940 950 pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL .::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: :: XP_005 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL 1010 1020 1030 1040 1050 1060 960 970 980 990 1000 1010 pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS .::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.:: XP_005 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS 1070 1080 1090 1100 1110 1120 1020 1030 1040 1050 1060 1070 pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS- : .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::. XP_005 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP 1130 1140 1150 1160 1170 1180 1080 1090 1100 1110 1120 1130 pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM ::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... :: XP_005 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM 1190 1200 1210 1220 1230 1240 1140 1150 1160 1170 1180 1190 pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: : XP_005 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 1250 1260 1270 1280 1290 >>XP_011539812 (OMIM: 605226,616975) PREDICTED: arginine (1524 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 588.0 bits: 121.2 E(85289): 5.2e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:530-1524) 10 20 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------ :.::... ::: .::::::. .: XP_011 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP 500 510 520 530 540 550 30 40 50 60 70 80 pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES :..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..: XP_011 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE 560 570 580 590 600 610 90 100 110 120 130 pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG . .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: :: XP_011 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ 620 630 640 650 660 670 140 150 160 170 180 190 pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME . :.:::::. .. :.: :. : : . ::: XP_011 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP-------- 680 690 700 200 210 220 230 240 250 pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT :: .::: ::: :: : .. . :: .:. .::.. :: : ::. XP_011 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA 710 720 730 740 750 260 270 280 290 300 310 pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP- : : . . :: .: : :: :: :: .:. :: :.::......: XP_011 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS 760 770 780 790 320 330 340 350 360 370 pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY :. . :: :. : .::.. : ::: :.: .::: .:.. :: XP_011 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------ 800 810 820 830 840 380 390 400 410 420 430 pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ ..: ::: .: . .:::: ..:. :.:::. :: :. XP_011 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP 850 860 870 880 440 450 460 470 480 490 pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ . . ::: :.: . :. ::: : . . .. XP_011 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--- 890 900 910 500 510 520 530 540 550 pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP :.. ::: :. .:: . :.:: : : : : . .: : .::. :: XP_011 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP 920 930 940 950 960 560 570 580 590 600 610 pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS .: :: : :: : ::: :. : :: : : : : XP_011 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV--- 970 980 990 620 630 640 650 660 670 pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP : :::: ::: . :: : XP_011 ----------------------PGGPPPI-------------TPP-----TCPSTST--- 1000 1010 680 690 700 710 720 730 pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP ::::::: .. : : :. :: : .:. :: ..:::.: XP_011 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA 1020 1030 1040 1050 740 750 760 770 780 790 pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS .. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: :: XP_011 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS 1060 1070 1080 1090 1100 1110 800 810 820 830 840 pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA :::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: XP_011 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR- 1120 1130 1140 1150 1160 1170 850 860 870 880 890 900 pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY . :.: :: :: ::: ...:.::::.::::::::::::::::::::: ::::::: XP_011 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY 1180 1190 1200 1210 1220 1230 910 920 930 940 950 pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL .::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: :: XP_011 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL 1240 1250 1260 1270 1280 1290 960 970 980 990 1000 1010 pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS .::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.:: XP_011 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS 1300 1310 1320 1330 1340 1020 1030 1040 1050 1060 1070 pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS- : .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::. XP_011 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP 1350 1360 1370 1380 1390 1400 1080 1090 1100 1110 1120 1130 pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM ::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... :: XP_011 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM 1410 1420 1430 1440 1450 1460 1140 1150 1160 1170 1180 1190 pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: : XP_011 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 1470 1480 1490 1500 1510 1520 >>NP_036234 (OMIM: 605226,616975) arginine-glutamic acid (1566 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566) 10 20 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------ :.::... ::: .::::::. .: NP_036 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP 550 560 570 580 590 600 30 40 50 60 70 80 pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES :..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..: NP_036 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE 610 620 630 640 650 660 90 100 110 120 130 pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG . .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: :: NP_036 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ 670 680 690 700 710 140 150 160 170 180 190 pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME . :.:::::. .. :.: :. : : . ::: NP_036 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP-------- 720 730 740 200 210 220 230 240 250 pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT :: .::: ::: :: : .. . :: .:. .::.. :: : ::. NP_036 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA 750 760 770 780 790 260 270 280 290 300 310 pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP- : : . . :: .: : :: :: :: .:. :: :.::......: NP_036 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS 800 810 820 830 320 330 340 350 360 370 pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY :. . :: :. : .::.. : ::: :.: .::: .:.. :: NP_036 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------ 840 850 860 870 880 380 390 400 410 420 430 pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ ..: ::: .: . .:::: ..:. :.:::. :: :. NP_036 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP 890 900 910 920 440 450 460 470 480 490 pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ . . ::: :.: . :. ::: : . . .. NP_036 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--- 930 940 950 500 510 520 530 540 550 pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP :.. ::: :. .:: . :.:: : : : : . .: : .::. :: NP_036 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP 960 970 980 990 1000 560 570 580 590 600 610 pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS .: :: : :: : ::: :. : :: : : : : NP_036 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV--- 1010 1020 1030 1040 620 630 640 650 660 670 pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP : :::: ::: . :: : NP_036 ----------------------PGGPPPI-------------TPP-----TCPSTST--- 1050 680 690 700 710 720 730 pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP ::::::: .. : : :. :: : .:. :: ..:::.: NP_036 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA 1060 1070 1080 1090 740 750 760 770 780 790 pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS .. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: :: NP_036 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS 1100 1110 1120 1130 1140 1150 800 810 820 830 840 pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA :::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: NP_036 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR- 1160 1170 1180 1190 1200 1210 850 860 870 880 890 900 pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY . :.: :: :: ::: ...:.::::.::::::::::::::::::::: ::::::: NP_036 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY 1220 1230 1240 1250 1260 1270 910 920 930 940 950 pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL .::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: :: NP_036 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL 1280 1290 1300 1310 1320 1330 960 970 980 990 1000 1010 pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS .::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.:: NP_036 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS 1340 1350 1360 1370 1380 1390 1020 1030 1040 1050 1060 1070 pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS- : .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::. NP_036 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP 1400 1410 1420 1430 1440 1450 1080 1090 1100 1110 1120 1130 pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM ::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... :: NP_036 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM 1460 1470 1480 1490 1500 1510 1140 1150 1160 1170 1180 1190 pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: : NP_036 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 1520 1530 1540 1550 1560 >>XP_016856848 (OMIM: 605226,616975) PREDICTED: arginine (1566 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566) 10 20 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------ :.::... ::: .::::::. .: XP_016 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP 550 560 570 580 590 600 30 40 50 60 70 80 pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES :..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..: XP_016 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE 610 620 630 640 650 660 90 100 110 120 130 pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG . .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: :: XP_016 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ 670 680 690 700 710 140 150 160 170 180 190 pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME . :.:::::. .. :.: :. : : . ::: XP_016 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP-------- 720 730 740 200 210 220 230 240 250 pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT :: .::: ::: :: : .. . :: .:. .::.. :: : ::. XP_016 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA 750 760 770 780 790 260 270 280 290 300 310 pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP- : : . . :: .: : :: :: :: .:. :: :.::......: XP_016 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS 800 810 820 830 320 330 340 350 360 370 pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY :. . :: :. : .::.. : ::: :.: .::: .:.. :: XP_016 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------ 840 850 860 870 880 380 390 400 410 420 430 pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ ..: ::: .: . .:::: ..:. :.:::. :: :. XP_016 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP 890 900 910 920 440 450 460 470 480 490 pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ . . ::: :.: . :. ::: : . . .. XP_016 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--- 930 940 950 500 510 520 530 540 550 pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP :.. ::: :. .:: . :.:: : : : : . .: : .::. :: XP_016 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP 960 970 980 990 1000 560 570 580 590 600 610 pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS .: :: : :: : ::: :. : :: : : : : XP_016 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV--- 1010 1020 1030 1040 620 630 640 650 660 670 pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP : :::: ::: . :: : XP_016 ----------------------PGGPPPI-------------TPP-----TCPSTST--- 1050 680 690 700 710 720 730 pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP ::::::: .. : : :. :: : .:. :: ..:::.: XP_016 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA 1060 1070 1080 1090 740 750 760 770 780 790 pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS .. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: :: XP_016 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS 1100 1110 1120 1130 1140 1150 800 810 820 830 840 pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA :::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: XP_016 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR- 1160 1170 1180 1190 1200 1210 850 860 870 880 890 900 pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY . :.: :: :: ::: ...:.::::.::::::::::::::::::::: ::::::: XP_016 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY 1220 1230 1240 1250 1260 1270 910 920 930 940 950 pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL .::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: :: XP_016 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL 1280 1290 1300 1310 1320 1330 960 970 980 990 1000 1010 pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS .::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.:: XP_016 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS 1340 1350 1360 1370 1380 1390 1020 1030 1040 1050 1060 1070 pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS- : .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::. XP_016 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP 1400 1410 1420 1430 1440 1450 1080 1090 1100 1110 1120 1130 pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM ::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... :: XP_016 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM 1460 1470 1480 1490 1500 1510 1140 1150 1160 1170 1180 1190 pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: : XP_016 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 1520 1530 1540 1550 1560 >>XP_005263521 (OMIM: 605226,616975) PREDICTED: arginine (1566 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566) 10 20 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------ :.::... ::: .::::::. .: XP_005 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP 550 560 570 580 590 600 30 40 50 60 70 80 pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES :..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..: XP_005 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE 610 620 630 640 650 660 90 100 110 120 130 pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG . .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: :: XP_005 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ 670 680 690 700 710 140 150 160 170 180 190 pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME . :.:::::. .. :.: :. : : . ::: XP_005 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP-------- 720 730 740 200 210 220 230 240 250 pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT :: .::: ::: :: : .. . :: .:. .::.. :: : ::. XP_005 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA 750 760 770 780 790 260 270 280 290 300 310 pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP- : : . . :: .: : :: :: :: .:. :: :.::......: XP_005 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS 800 810 820 830 320 330 340 350 360 370 pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY :. . :: :. : .::.. : ::: :.: .::: .:.. :: XP_005 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------ 840 850 860 870 880 380 390 400 410 420 430 pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ ..: ::: .: . .:::: ..:. :.:::. :: :. XP_005 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP 890 900 910 920 440 450 460 470 480 490 pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ . . ::: :.: . :. ::: : . . .. XP_005 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--- 930 940 950 500 510 520 530 540 550 pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP :.. ::: :. .:: . :.:: : : : : . .: : .::. :: XP_005 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP 960 970 980 990 1000 560 570 580 590 600 610 pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS .: :: : :: : ::: :. : :: : : : : XP_005 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV--- 1010 1020 1030 1040 620 630 640 650 660 670 pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP : :::: ::: . :: : XP_005 ----------------------PGGPPPI-------------TPP-----TCPSTST--- 1050 680 690 700 710 720 730 pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP ::::::: .. : : :. :: : .:. :: ..:::.: XP_005 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA 1060 1070 1080 1090 740 750 760 770 780 790 pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS .. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: :: XP_005 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS 1100 1110 1120 1130 1140 1150 800 810 820 830 840 pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA :::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: XP_005 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR- 1160 1170 1180 1190 1200 1210 850 860 870 880 890 900 pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY . :.: :: :: ::: ...:.::::.::::::::::::::::::::: ::::::: XP_005 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY 1220 1230 1240 1250 1260 1270 910 920 930 940 950 pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL .::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: :: XP_005 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL 1280 1290 1300 1310 1320 1330 960 970 980 990 1000 1010 pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS .::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.:: XP_005 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS 1340 1350 1360 1370 1380 1390 1020 1030 1040 1050 1060 1070 pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS- : .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::. XP_005 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP 1400 1410 1420 1430 1440 1450 1080 1090 1100 1110 1120 1130 pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM ::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... :: XP_005 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM 1460 1470 1480 1490 1500 1510 1140 1150 1160 1170 1180 1190 pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: : XP_005 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 1520 1530 1540 1550 1560 >>XP_016856847 (OMIM: 605226,616975) PREDICTED: arginine (1566 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566) 10 20 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------ :.::... ::: .::::::. .: XP_016 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP 550 560 570 580 590 600 30 40 50 60 70 80 pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES :..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..: XP_016 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE 610 620 630 640 650 660 90 100 110 120 130 pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG . .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: :: XP_016 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ 670 680 690 700 710 140 150 160 170 180 190 pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME . :.:::::. .. :.: :. : : . ::: XP_016 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP-------- 720 730 740 200 210 220 230 240 250 pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT :: .::: ::: :: : .. . :: .:. .::.. :: : ::. XP_016 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA 750 760 770 780 790 260 270 280 290 300 310 pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP- : : . . :: .: : :: :: :: .:. :: :.::......: XP_016 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS 800 810 820 830 320 330 340 350 360 370 pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY :. . :: :. : .::.. : ::: :.: .::: .:.. :: XP_016 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------ 840 850 860 870 880 380 390 400 410 420 430 pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ ..: ::: .: . .:::: ..:. :.:::. :: :. XP_016 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP 890 900 910 920 440 450 460 470 480 490 pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ . . ::: :.: . :. ::: : . . .. XP_016 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--- 930 940 950 500 510 520 530 540 550 pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP :.. ::: :. .:: . :.:: : : : : . .: : .::. :: XP_016 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP 960 970 980 990 1000 560 570 580 590 600 610 pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS .: :: : :: : ::: :. : :: : : : : XP_016 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV--- 1010 1020 1030 1040 620 630 640 650 660 670 pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP : :::: ::: . :: : XP_016 ----------------------PGGPPPI-------------TPP-----TCPSTST--- 1050 680 690 700 710 720 730 pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP ::::::: .. : : :. :: : .:. :: ..:::.: XP_016 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA 1060 1070 1080 1090 740 750 760 770 780 790 pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS .. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: :: XP_016 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS 1100 1110 1120 1130 1140 1150 800 810 820 830 840 pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA :::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: XP_016 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR- 1160 1170 1180 1190 1200 1210 850 860 870 880 890 900 pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY . :.: :: :: ::: ...:.::::.::::::::::::::::::::: ::::::: XP_016 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY 1220 1230 1240 1250 1260 1270 910 920 930 940 950 pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL .::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: :: XP_016 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL 1280 1290 1300 1310 1320 1330 960 970 980 990 1000 1010 pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS .::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.:: XP_016 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS 1340 1350 1360 1370 1380 1390 1020 1030 1040 1050 1060 1070 pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS- : .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::. XP_016 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP 1400 1410 1420 1430 1440 1450 1080 1090 1100 1110 1120 1130 pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM ::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... :: XP_016 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM 1460 1470 1480 1490 1500 1510 1140 1150 1160 1170 1180 1190 pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: : XP_016 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 1520 1530 1540 1550 1560 >>NP_001036146 (OMIM: 605226,616975) arginine-glutamic a (1566 aa) initn: 1820 init1: 635 opt: 1791 Z-score: 587.8 bits: 121.2 E(85289): 5.3e-26 Smith-Waterman score: 2893; 46.4% identity (62.5% similar) in 1226 aa overlap (1-1191:572-1566) 10 20 pF1KE4 MKTRQNKDSMS-MRSGRKKEAPGP------ :.::... ::: .::::::. .: NP_001 LPPIEKPVDPPPFMFKPVKEEDDGLSGKHSMRTRRSRGSMSTLRSGRKKQPASPDGRTSP 550 560 570 580 590 600 30 40 50 60 70 80 pF1KE4 -REELRSRGRASPGGVSTSSSDGKAEKSRQTAKKARVEEASTP-KVNKQGRSEEISESES :..:: :: ::...::::.:.::: ...:::.. ::::.: : ::. : . :..: NP_001 INEDIRSSGRNSPSAASTSSNDSKAETVKKSAKKVK-EEASSPLKSNKRQREKVASDTEE 610 620 630 640 650 660 90 100 110 120 130 pF1KE4 EETNAPKKTKTEQELPRPQSPSDLD--SLDGRSLNDDGSSDPRDIDQDNRSTSPSIYSPG . .. ::::: ::. ::.:::. . : :.::.::.:::::.::::::::::::: :: NP_001 ADRTSSKKTKT-QEISRPNSPSEGEGESSDSRSVNDEGSSDPKDIDQDNRSTSPSIPSPQ 670 680 690 700 710 140 150 160 170 180 190 pF1KE4 SVENDSDSSSGLSQGPARPYHPPPLFPPSPQPPDSTPRQPEASFEPHPSVTPTGYHAPME . :.:::::. .. :.: :. : : . ::: NP_001 DNESDSDSSAQQQMLQAQP--------PALQAPTG--------------VTP-------- 720 730 740 200 210 220 230 240 250 pF1KE4 PPTSRMFQAPPGAPPPHPQL-YPGGTGGVLSGPPMGPKGGGAASSVGGPNGGKQHPPPTT :: .::: ::: :: : .. . :: .:. .::.. :: : ::. NP_001 --------APSSAPPGTPQLPTPGPTPSATAVPP---QGSPTASQA--PN---QPQAPTA 750 760 770 780 790 260 270 280 290 300 310 pF1KE4 PISVSSSGASGAPPTKPPTTPVGGGNLPSAPPPANFPHVTPNLPPPPALRPLNNASASP- : : . . :: .: : :: :: :: .:. :: :.::......: NP_001 P--VPHTHIQQAPALHPQR-P------PSPHPP---PHPSPH-PP---LQPLTGSAGQPS 800 810 820 830 320 330 340 350 360 370 pF1KE4 -PGLGAQPLPGHLP-SPHAMGQGMGGLPPGPEKGPTLAPSPHSLPPASSSAPAPPMRFPY :. . :: :. : .::.. : ::: :.: .::: .:.. :: NP_001 APSHAQPPLHGQGPPGPHSLQAGPLLQHPGP-------PQPFGLPPQASQGQAP------ 840 850 860 870 880 380 390 400 410 420 430 pF1KE4 SSSSSSSAAASSSSSSSSSSASPFPASQALPSYPHSFPPPTSLSVSNQPPKYTQPSLPSQ ..: ::: .: . .:::: ..:. :.:::. :: :. NP_001 --LGTSPAAAYPHTSLQ------LPASQ------------SALQ-SQQPPR-EQPLPPAP 890 900 910 920 440 450 460 470 480 490 pF1KE4 AVWSQGPPPPPPYGRLLANSNAHPGPFPPSTGAQSTAHPPVSTHHHHHQQQQQQQQQQQQ . . ::: :.: . :. ::: : . . .. NP_001 LAMPHIKPPPTT-------------PIPQLPAPQAHKHPP-------HLSGPSPFSM--- 930 940 950 500 510 520 530 540 550 pF1KE4 QQQQQQQQHHGNSGPPPPGAFPHPLEGGSSHHAHPYAMSPSLGSL---RPYPPGPAHLPP :.. ::: :. .:: . :.:: : : : : . .: : .::. :: NP_001 -----------NANLPPPPAL-KPLSSLSTHHP-PSAHPPPLQLMPQSQPLPSSPAQ-PP 960 970 980 990 1000 560 570 580 590 600 610 pF1KE4 PHSQVSYSQAGPNGPPVSSSSNSSSSTSQGSYPCSHPSPSQGPQGAPYP-FPPVPTVTTS .: :: : :: : ::: :. : :: : : : : NP_001 GLTQ---SQNLP--PP----------------PASHP-PTGLHQVAPQPPFAQHPFV--- 1010 1020 1030 1040 620 630 640 650 660 670 pF1KE4 SATLSTVIATVASSPAGYKTASPPGPPPYGKRAPSPGAYKTATPPGYKPGSPPSFRTGTP : :::: ::: . :: : NP_001 ----------------------PGGPPPI-------------TPP-----TCPSTST--- 1050 680 690 700 710 720 730 pF1KE4 PGYRGTSPPAGPGTFKPGSPTVGPGPLPPAGPSGLPSLPPPPAAPASGPPLSATQIKQEP ::::::: .. : : :. :: : .:. :: ..:::.: NP_001 -------PPAGPGT------SAQP-PCSGAAASG------GSIAGGSSCPLPTVQIKEEA 1060 1070 1080 1090 740 750 760 770 780 790 pF1KE4 AEEYETPESPVPPARSPSPPPKVVDVPSHASQSARFNKHLDRGFNSCARSDLYFVPLEGS .. : :::: :: ::::: : :::.:::::::::: ::::::.:::::.::::.:: :: NP_001 LDDAEEPESPPPPPRSPSPEPTVVDTPSHASQSARFYKHLDRGYNSCARTDLYFMPLAGS 1100 1110 1120 1130 1140 1150 800 810 820 830 840 pF1KE4 KLAKKRADLVEKVRREAEQRAREEKEREREREREKEREREKERELERSVKL---AQEGRA :::::: . .::..:::::.::::.:::.:.:.:.:::::.::: ::..: :.::: NP_001 KLAKKREEAIEKAKREAEQKAREEREREKEKEKEREREREREREAERAAKASSSAHEGR- 1160 1170 1180 1190 1200 1210 850 860 870 880 890 900 pF1KE4 PVECPSL-GPVPHRPPFEPG-SAVATVPPYLGPDTPALRTLSEYARPHVMSPGNRNHPFY . :.: :: :: ::: ...:.::::.::::::::::::::::::::: ::::::: NP_001 -LSDPQLSGPGHMRPSFEPPPTTIAAVPPYIGPDTPALRTLSEYARPHVMSPTNRNHPFY 1220 1230 1240 1250 1260 1270 910 920 930 940 950 pF1KE4 VPLGAVDPGLLGYNVPALYSSDPAARERE--------REARERDLRDRLKPGFEVKPSEL .::. .:: ::.:..:.::. ::. :::: :: :::.::.:.:::::::: :: NP_001 MPLNPTDP-LLAYHMPGLYNVDPTIRERELREREIREREIRERELRERMKPGFEVKPPEL 1280 1290 1300 1310 1320 1330 960 970 980 990 1000 1010 pF1KE4 EPLHGVPGPGLDPFPRHGGLALQPGPPGLHPFP-FHPSLGPLERERLALAAGPALRPDMS .::: . .: .. : ::..:.. : : ::: :::.:.:::::::::: :: :::.:: NP_001 DPLHPAANP-MEHFARHSALTIPP-TAGPHPFASFHPGLNPLERERLALA-GPQLRPEMS 1340 1350 1360 1370 1380 1390 1020 1030 1040 1050 1060 1070 pF1KE4 YAERLAAERQHAERVAALGNDPLARLQMLNVTPHHHQHSHIHSHLHLHQQDAIHAASAS- : .:::::: ::::.:.: .::::::::.:::::::::::::::::::::: .: .::. NP_001 YPDRLAAERIHAERMASLTSDPLARLQMFNVTPHHHQHSHIHSHLHLHQQDPLHQGSAGP 1400 1410 1420 1430 1440 1450 1080 1090 1100 1110 1120 1130 pF1KE4 VHPLIDPLASGSHLTRIPYPAGTLPNPLLPHPLHENEVLRHQLFAAPY-RDLPASLSAPM ::::.:::..: ::.:.::: :::::::: .: ::.:.::: .:..:: ::::... :: NP_001 VHPLVDPLTAGPHLARFPYPPGTLPNPLLGQPPHEHEMLRHPVFGTPYPRDLPGAIPPPM 1460 1470 1480 1490 1500 1510 1140 1150 1160 1170 1180 1190 pF1KE4 SAAHQLQAMHAQSAELQRLALEQQQWLHAHHPLHSVPLPAQEDYYSHLKKESDKPL ::::::::::::::::::::.::: :::.: .:. ::.::::::.::::.:: : NP_001 SAAHQLQAMHAQSAELQRLAMEQQ-WLHGHPHMHGGHLPSQEDYYSRLKKEGDKQL 1520 1530 1540 1550 1560 1191 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:58:43 2016 done: Mon Nov 7 16:58:46 2016 Total Scan time: 20.200 Total Display time: 0.410 Function used was FASTA [36.3.4 Apr, 2011]