FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2774, 705 aa 1>>>pF1KE2774 705 - 705 aa - 705 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7953+/-0.00118; mu= 18.9347+/- 0.071 mean_var=141.1112+/-26.496, 0's: 0 Z-trim(107.5): 89 B-trim: 33 in 1/49 Lambda= 0.107968 statistics sampled from 9677 (9760) to 9677 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.292), width: 16 Scan time: 1.720 The best scores are: opt bits E(33420) CCDS5515.1 EGFR gene_id:1956|Hs109|chr7 ( 705) 5002 791.8 0 CCDS5514.1 EGFR gene_id:1956|Hs109|chr7 (1210) 4447 705.6 1.1e-202 CCDS5516.1 EGFR gene_id:1956|Hs109|chr7 ( 628) 4443 704.7 1.1e-202 CCDS87507.1 EGFR gene_id:1956|Hs109|chr7 (1091) 3246 518.5 2.1e-146 CCDS87506.1 EGFR gene_id:1956|Hs109|chr7 (1165) 3246 518.5 2.2e-146 CCDS47587.1 EGFR gene_id:1956|Hs109|chr7 ( 405) 2815 450.8 1.8e-126 CCDS42811.1 ERBB4 gene_id:2066|Hs109|chr2 (1292) 2195 354.9 4.5e-97 CCDS2394.1 ERBB4 gene_id:2066|Hs109|chr2 (1308) 2195 354.9 4.5e-97 CCDS31833.1 ERBB3 gene_id:2065|Hs109|chr12 (1342) 2085 337.8 6.6e-92 CCDS77017.1 ERBB2 gene_id:2064|Hs109|chr17 ( 603) 1721 280.6 4.7e-75 CCDS77016.1 ERBB2 gene_id:2064|Hs109|chr17 (1055) 1721 281.0 6.6e-75 CCDS45667.1 ERBB2 gene_id:2064|Hs109|chr17 (1225) 1721 281.0 7.3e-75 CCDS74052.1 ERBB2 gene_id:2064|Hs109|chr17 (1240) 1721 281.0 7.3e-75 CCDS32642.1 ERBB2 gene_id:2064|Hs109|chr17 (1255) 1721 281.0 7.4e-75 >>CCDS5515.1 EGFR gene_id:1956|Hs109|chr7 (705 aa) initn: 5002 init1: 5002 opt: 5002 Z-score: 4222.4 bits: 791.8 E(33420): 0 Smith-Waterman score: 5002; 99.9% identity (100.0% similar) in 705 aa overlap (1-705:1-705) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 GENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSHQSGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSHQSGS 610 620 630 640 650 660 670 680 690 700 pF1KE2 PAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH ::::::::::::::::::::::::::::::::::::::::::::: CCDS55 PAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH 670 680 690 700 >>CCDS5514.1 EGFR gene_id:1956|Hs109|chr7 (1210 aa) initn: 4443 init1: 4443 opt: 4447 Z-score: 3752.6 bits: 705.6 E(33420): 1.1e-202 Smith-Waterman score: 4447; 99.2% identity (99.4% similar) in 634 aa overlap (1-631:1-634) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 GENNTLVWKYADAGHVCHLCHPNCTYG---PGNESLKAMLFCLFKLSSCNQSNDGSVSHQ ::::::::::::::::::::::::::: :: : CCDS55 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV 610 620 630 640 650 660 660 670 680 690 700 pF1KE2 SGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH CCDS55 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS 670 680 690 700 710 720 >>CCDS5516.1 EGFR gene_id:1956|Hs109|chr7 (628 aa) initn: 4443 init1: 4443 opt: 4443 Z-score: 3752.4 bits: 704.7 E(33420): 1.1e-202 Smith-Waterman score: 4443; 99.8% identity (100.0% similar) in 627 aa overlap (1-627:1-627) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 GENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSHQSGS ::::::::::::::::::::::::::: CCDS55 GENNTLVWKYADAGHVCHLCHPNCTYGS 610 620 >>CCDS87507.1 EGFR gene_id:1956|Hs109|chr7 (1091 aa) initn: 4110 init1: 3228 opt: 3246 Z-score: 2742.1 bits: 518.5 E(33420): 2.1e-146 Smith-Waterman score: 4026; 92.1% identity (92.3% similar) in 634 aa overlap (1-631:1-589) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF ::::::::::::::::::::: : CCDS87 VLSNYDANKTGLKELPMRNLQ----G---------------------------------- 130 140 190 200 210 220 230 240 pF1KE2 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 -------QKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 150 160 170 180 190 250 260 270 280 290 300 pF1KE2 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 200 210 220 230 240 250 310 320 330 340 350 360 pF1KE2 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 260 270 280 290 300 310 370 380 390 400 410 420 pF1KE2 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 320 330 340 350 360 370 430 440 450 460 470 480 pF1KE2 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 380 390 400 410 420 430 490 500 510 520 530 540 pF1KE2 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS87 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 440 450 460 470 480 490 550 560 570 580 590 600 pF1KE2 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 500 510 520 530 540 550 610 620 630 640 650 pF1KE2 GENNTLVWKYADAGHVCHLCHPNCTYG---PGNESLKAMLFCLFKLSSCNQSNDGSVSHQ ::::::::::::::::::::::::::: :: : CCDS87 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV 560 570 580 590 600 610 660 670 680 690 700 pF1KE2 SGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH CCDS87 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS 620 630 640 650 660 670 >>CCDS87506.1 EGFR gene_id:1956|Hs109|chr7 (1165 aa) initn: 4110 init1: 3228 opt: 3246 Z-score: 2741.8 bits: 518.5 E(33420): 2.2e-146 Smith-Waterman score: 4026; 92.1% identity (92.3% similar) in 634 aa overlap (1-631:1-589) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF ::::::::::::::::::::: : CCDS87 VLSNYDANKTGLKELPMRNLQ----G---------------------------------- 130 140 190 200 210 220 230 240 pF1KE2 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 -------QKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 150 160 170 180 190 250 260 270 280 290 300 pF1KE2 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 200 210 220 230 240 250 310 320 330 340 350 360 pF1KE2 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 260 270 280 290 300 310 370 380 390 400 410 420 pF1KE2 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF 320 330 340 350 360 370 430 440 450 460 470 480 pF1KE2 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL 380 390 400 410 420 430 490 500 510 520 530 540 pF1KE2 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN ::::::::::::::::::::::::::::::::::::::::.::::::::::::::::::: CCDS87 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN 440 450 460 470 480 490 550 560 570 580 590 600 pF1KE2 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS87 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM 500 510 520 530 540 550 610 620 630 640 650 pF1KE2 GENNTLVWKYADAGHVCHLCHPNCTYG---PGNESLKAMLFCLFKLSSCNQSNDGSVSHQ ::::::::::::::::::::::::::: :: : CCDS87 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV 560 570 580 590 600 610 660 670 680 690 700 pF1KE2 SGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH CCDS87 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS 620 630 640 650 660 670 >>CCDS47587.1 EGFR gene_id:1956|Hs109|chr7 (405 aa) initn: 2904 init1: 2815 opt: 2815 Z-score: 2384.1 bits: 450.8 E(33420): 1.8e-126 Smith-Waterman score: 2815; 99.8% identity (100.0% similar) in 404 aa overlap (1-404:1-404) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF :::::::::::::::::::::::::::::::::::::::::::. CCDS47 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGLS 370 380 390 400 430 440 450 460 470 480 pF1KE2 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL >>CCDS42811.1 ERBB4 gene_id:2066|Hs109|chr2 (1292 aa) initn: 1728 init1: 967 opt: 2195 Z-score: 1856.5 bits: 354.9 E(33420): 4.5e-97 Smith-Waterman score: 2195; 47.4% identity (76.1% similar) in 631 aa overlap (1-627:1-624) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :.:. :. . ..::.: . . . ..:: :: :::..:. .:... .:.....:::: CCDS42 MKPA-TGLWVWVSLLVA-AGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS42 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA 60 70 80 90 100 110 130 140 150 160 170 pF1KE2 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS42 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS42 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS42 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS42 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS42 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS42 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDK ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS42 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 CNLLEGEPREFVENSECIQCHPEC--LPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP ::: .:: ::: ..: :..: :.: . ... .:: : ::::: .:.:. :::.::. :: CCDS42 CNLYDGEFREFENGSICVECDPQCEKMEDGL-LTCHGPGPDNCTKCSHFKDGPNCVEKCP 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSH :..: : ....:::: . :: :::::: : CCDS42 DGLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLI 600 610 620 630 640 650 660 670 680 690 700 pF1KE2 QSGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH CCDS42 AAGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRIL 660 670 680 690 700 710 >>CCDS2394.1 ERBB4 gene_id:2066|Hs109|chr2 (1308 aa) initn: 1728 init1: 967 opt: 2195 Z-score: 1856.4 bits: 354.9 E(33420): 4.5e-97 Smith-Waterman score: 2195; 47.4% identity (76.1% similar) in 631 aa overlap (1-627:1-624) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV :.:. :. . ..::.: . . . ..:: :: :::..:. .:... .:.....:::: CCDS23 MKPA-TGLWVWVSLLVA-AGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. :::: CCDS23 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA 60 70 80 90 100 110 130 140 150 160 170 pF1KE2 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM .. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::... CCDS23 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA : ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::. CCDS23 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN ::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.: CCDS23 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH .:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: . CCDS23 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH : :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::. CCDS23 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK .: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .:::: CCDS23 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDK ::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :... CCDS23 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 CNLLEGEPREFVENSECIQCHPEC--LPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP ::: .:: ::: ..: :..: :.: . ... .:: : ::::: .:.:. :::.::. :: CCDS23 CNLYDGEFREFENGSICVECDPQCEKMEDGL-LTCHGPGPDNCTKCSHFKDGPNCVEKCP 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSH :..: : ....:::: . :: :::::: : CCDS23 DGLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLI 600 610 620 630 640 650 660 670 680 690 700 pF1KE2 QSGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH CCDS23 AAGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRIL 660 670 680 690 700 710 >>CCDS31833.1 ERBB3 gene_id:2065|Hs109|chr12 (1342 aa) initn: 1670 init1: 539 opt: 2085 Z-score: 1763.7 bits: 337.8 E(33420): 6.6e-92 Smith-Waterman score: 2085; 45.2% identity (74.4% similar) in 621 aa overlap (11-627:9-620) 10 20 30 40 50 60 pF1KE2 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV .:.:: .: .:.. . . :: :: : :. : :... .: .... ::: CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA :.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:. CCDS31 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF 60 70 80 90 100 110 130 140 150 160 170 pF1KE2 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD :. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . . CCDS31 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG ... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.: CCDS31 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY :.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:. CCDS31 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH :: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....:: CCDS31 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE2 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH : :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . .. CCDS31 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE2 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW .: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...:: CCDS31 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 KKLF-GTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECV :.. : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: :: CCDS31 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE2 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP .::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..:: CCDS31 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE2 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSH ::.: .. ..:: :. . :. :: ::: : CCDS31 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI 600 610 620 630 640 660 670 680 690 700 pF1KE2 QSGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH CCDS31 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETEL 650 660 670 680 690 700 >>CCDS77017.1 ERBB2 gene_id:2064|Hs109|chr17 (603 aa) initn: 1414 init1: 1137 opt: 1721 Z-score: 1461.2 bits: 280.6 E(33420): 4.7e-75 Smith-Waterman score: 1982; 44.0% identity (71.8% similar) in 602 aa overlap (37-626:2-602) 10 20 30 40 50 60 pF1KE2 AGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLE :: .. : :. :......:.:: :::: CCDS77 MKLRLPASPETHLDMLRHLYQGCQVVQGNLE 10 20 30 70 80 90 100 110 120 pF1KE2 ITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYD .::. : .::::. :::: :::::: : :...::. :.:.::.. .:..::::::.: : CCDS77 LTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGD 40 50 60 70 80 90 130 140 150 160 170 pF1KE2 ----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNM :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: .. . CCDS77 PLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLAL 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE2 SMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQC .. :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.::::.:: CCDS77 TLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTDCCHEQC 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE2 AAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCP :::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::.:: :: CCDS77 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE2 RNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATN ::. :: :::. .: . :. :::...:.:: :: .:: :.:. .... .....: CCDS77 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE2 IKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRT :..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.:::.. CCDS77 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE2 DLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTI :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .::...:. CCDS77 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV 400 410 420 430 440 450 480 490 500 510 520 530 pF1KE2 NWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGREC : .:: . : .:: :. : . : .:: ::. :::: : .::.: . ::.:: CCDS77 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC 460 470 480 490 500 510 540 550 560 570 580 590 pF1KE2 VDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTC :..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : : :: : CCDS77 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC 520 530 540 550 560 570 600 610 620 630 640 650 pF1KE2 PAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSV :.:: . . . .::. : .:. : :::. CCDS77 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHS 580 590 600 660 670 680 690 700 pF1KE2 SHQSGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH 705 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Feb 19 20:38:17 2021 done: Fri Feb 19 20:38:18 2021 Total Scan time: 1.720 Total Display time: 0.160 Function used was FASTA [36.3.4 Apr, 2011]