FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4458, 1210 aa
1>>>pF1KB4458 1210 - 1210 aa - 1210 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.7879+/-0.00184; mu= 7.9146+/- 0.108
mean_var=459.7766+/-102.695, 0's: 0 Z-trim(107.5): 526 B-trim: 0 in 0/51
Lambda= 0.059814
statistics sampled from 9002 (9608) to 9002 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.643), E-opt: 0.2 (0.295), width: 16
Scan time: 5.000
The best scores are: opt bits E(32554)
CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 8383 740.4 6.2e-213
CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 4447 400.4 8.2e-111
CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 4443 400.0 9.9e-111
CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 3748 340.4 1.6e-92
CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 3748 340.5 1.6e-92
CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 3748 340.5 1.6e-92
CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 3698 336.0 2.9e-91
CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 3423 312.5 4.6e-84
CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 3184 291.8 7.3e-78
CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 3162 289.9 2.7e-77
CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 2815 259.2 1.5e-68
CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1721 165.0 4.9e-40
CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 739 80.7 2.1e-14
CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 739 80.7 2.1e-14
CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 739 80.7 2.2e-14
CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 717 78.7 7.6e-14
CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 706 77.8 1.5e-13
CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 698 76.8 1.9e-13
CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 702 77.4 1.9e-13
CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 698 76.8 1.9e-13
CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 695 76.9 3e-13
CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 695 76.9 3e-13
CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 694 76.8 3.1e-13
CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 694 76.8 3.1e-13
CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 694 76.8 3.1e-13
CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 694 76.8 3.1e-13
CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 694 76.8 3.1e-13
CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 688 75.8 3.2e-13
CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 693 76.7 3.2e-13
CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 692 76.6 3.4e-13
CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 691 76.6 4e-13
CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 691 76.6 4e-13
CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 691 76.6 4e-13
CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 688 76.3 4.5e-13
CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 688 76.3 4.5e-13
CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 688 76.3 4.5e-13
CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 688 76.3 4.6e-13
CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 682 75.7 6.2e-13
CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 682 75.7 6.2e-13
CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 682 75.8 6.5e-13
CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 677 75.3 8.3e-13
CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 677 75.3 8.5e-13
CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 666 73.6 8.9e-13
CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 673 74.9 1.1e-12
CCDS33254.1 ZAP70 gene_id:7535|Hs108|chr2 ( 619) 666 74.0 1.3e-12
CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 667 74.5 1.6e-12
CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 667 74.5 1.7e-12
CCDS5031.1 EPHA7 gene_id:2045|Hs108|chr6 ( 998) 663 74.1 2e-12
CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 661 74.1 2.6e-12
CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 661 74.2 2.6e-12
>>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa)
initn: 8383 init1: 8383 opt: 8383 Z-score: 3936.3 bits: 740.4 E(32554): 6.2e-213
Smith-Waterman score: 8383; 99.9% identity (100.0% similar) in 1210 aa overlap (1-1210:1-1210)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN
::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::
CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 GAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGI
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 CLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 CLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAA
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB4 RNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSY
850 860 870 880 890 900
910 920 930 940 950 960
pF1KB4 GVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPK
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KB4 FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQ
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KB4 QGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTED
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KB4 SIDDTFLPVPEYINQSVPKRPAGSVQNPVYHNQPLNPAPSRDPHYQDPHSTAVGNPEYLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SIDDTFLPVPEYINQSVPKRPAGSVQNPVYHNQPLNPAPSRDPHYQDPHSTAVGNPEYLN
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KB4 TVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRV
1150 1160 1170 1180 1190 1200
1210
pF1KB4 APQSSEFIGA
::::::::::
CCDS55 APQSSEFIGA
1210
>>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa)
initn: 4443 init1: 4443 opt: 4447 Z-score: 2102.9 bits: 400.4 E(32554): 8.2e-111
Smith-Waterman score: 4447; 99.2% identity (99.4% similar) in 634 aa overlap (1-634:1-631)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN
::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::
CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV
:::::::::::::::::::::::::: ::: :
CCDS55 GENNTLVWKYADAGHVCHLCHPNCTY---GPGNESLKAMLFCLFKLSSCNQSNDGSVSHQ
610 620 630 640 650
670 680 690 700 710 720
pF1KB4 ALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGS
CCDS55 SGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH
660 670 680 690 700
>>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa)
initn: 4443 init1: 4443 opt: 4443 Z-score: 2101.5 bits: 400.0 E(32554): 9.9e-111
Smith-Waterman score: 4443; 99.8% identity (100.0% similar) in 627 aa overlap (1-627:1-627)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLSNYDANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGC
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDKCN
::::::::::::::::::::::::::::::::::::::::.:::::::::::::::::::
CCDS55 FGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCN
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVM
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 GENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIPSIATGMVGALLLLLVV
:::::::::::::::::::::::::::
CCDS55 GENNTLVWKYADAGHVCHLCHPNCTYGS
610 620
>>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa)
initn: 3258 init1: 1784 opt: 3748 Z-score: 1774.6 bits: 340.4 E(32554): 1.6e-92
Smith-Waterman score: 4092; 50.5% identity (72.5% similar) in 1231 aa overlap (37-1198:2-1219)
10 20 30 40 50 60
pF1KB4 AGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLE
:: .. : :. :......:.:: ::::
CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLE
10 20 30
70 80 90 100 110 120
pF1KB4 ITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYD
.::. : .::::. :::: :::::: : :...::. :.:.::.. .:..::::::.: :
CCDS45 LTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGD
40 50 60 70 80 90
130 140 150 160 170
pF1KB4 ----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNM
:. ::.:: .:.: :::.:.: .. :: :: ..: :.:: .. .
CCDS45 PLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLAL
100 110 120 130 140 150
180 190 200 210 220 230
pF1KB4 SMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQC
.. :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.::::.::
CCDS45 TLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTDCCHEQC
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB4 AAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCP
:::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::.:: ::
CCDS45 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB4 RNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATN
::. :: :::. .: . :. :::...:.:: :: .:: :.:. .... .....:
CCDS45 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB4 IKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRT
:..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.:::..
CCDS45 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP
340 350 360 370 380 390
420 430 440 450 460 470
pF1KB4 DLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTI
:: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .::...:.
CCDS45 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV
400 410 420 430 440 450
480 490 500 510 520 530
pF1KB4 NWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGREC
: .:: . : .:: :. : . : .:: ::. :::: : .::.: . ::.::
CCDS45 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC
460 470 480 490 500 510
540 550 560 570 580 590
pF1KB4 VDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTC
:..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : : :: :
CCDS45 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC
520 530 540 550 560 570
600 610 620 630 640 650
pF1KB4 PAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SIATGMVG
:.:: . . . .::. : .:. : :::..:. .:::.. : :: ...::
CCDS45 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG
580 590 600 610 620 630
660 670 680 690 700
pF1KB4 ALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKE
.::::.::. :....::. .:: :.:::::: :::::::::: :::: .:::::
CCDS45 ---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKE
640 650 660 670 680
710 720 730 740 750 760
pF1KB4 TEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASV
::..:.::::::::::::::.:::.::.:::::::: ::: :::::::::::::::::.:
CCDS45 TELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGV
690 700 710 720 730 740
770 780 790 800 810 820
pF1KB4 DNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLE
.:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.::::::.:::
CCDS45 GSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLE
750 760 770 780 790 800
830 840 850 860 870 880
pF1KB4 DRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHR
: :::::::::::::::.:.::::::::::.:: .: ::::.:::::::::::::::.:
CCDS45 DVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRR
810 820 830 840 850 860
890 900 910 920 930 940
pF1KB4 IYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVK
.::::::::::::::::::::.:::::::: :: ..:::::::::::::::::::::::
CCDS45 RFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVK
870 880 890 900 910 920
950 960 970 980 990 1000
pF1KB4 CWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDD
:::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:....:: :
CCDS45 CWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLEDDDMGD
930 940 950 960 970 980
1010 1020 1030
pF1KB4 VVDADEYLIPQQGFF-----------------SSPSTS-----------------RTPLL
.:::.:::.:::::: :: . : :.::
CCDS45 LVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLA
990 1000 1010 1020 1030 1040
1040 1050 1060 1070 1080
pF1KB4 SSLSATSN--NSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----IDDTFLPV
: .: :. .. .. .:::: : .. : ::::: ::: : .. : :
CCDS45 PSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQ
1050 1060 1070 1080 1090 1100
1090 1100 1110 1120 1130
pF1KB4 PEYINQ-SVPKRPAGSVQNPVYHNQPLN-----P---APSRDPHYQD--PHSTAVGNPEY
:::.:: .: .: . ..:. .: . : .:... .: . :: ::::
CCDS45 PEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEY
1110 1120 1130 1140 1150 1160
1140 1150 1160 1170 1180 1190
pF1KB4 LNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-TAENAEY
: : : . . :: . ..:: : .. :... : . :::. :::: ::
CCDS45 L-TPQGGAAPQPHPPPAF-------SPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEY
1170 1180 1190 1200 1210
1200 1210
pF1KB4 LRVAPQSSEFIGA
:
CCDS45 LGLDVPV
1220
>>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa)
initn: 3288 init1: 1784 opt: 3748 Z-score: 1774.6 bits: 340.5 E(32554): 1.6e-92
Smith-Waterman score: 4123; 50.4% identity (72.4% similar) in 1245 aa overlap (23-1198:3-1234)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
:. . .:: ::. :: .. : :. :......:.:
CCDS74 MPRGSWKPQVCTGTDMKLRLPASPETHLDMLRHLYQGCQV
10 20 30 40
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
: ::::.::. : .::::. :::: :::::: : :...::. :.:.::.. .:..::::
CCDS74 VQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALA
50 60 70 80 90 100
130 140 150 160 170
pF1KB4 VLSNYD----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSS
::.: : :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: .
CCDS74 VLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB4 DFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSD
. ... :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.:
CCDS74 NNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTD
170 180 190 200 210
240 250 260 270 280 290
pF1KB4 CCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGAT
:::.:::::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::.
CCDS74 CCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGAS
220 230 240 250 260 270
300 310 320 330 340
pF1KB4 CVKKCPRNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSL
:: :: ::. :: :::. .: . :. :::...:.:: :: .:: :.:. ....
CCDS74 CVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVR
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB4 SINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQA
.....::..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.:
CCDS74 AVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISA
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB4 WPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNL
::.. :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .:
CCDS74 WPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHL
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB4 CYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNV
:...:. : .:: . : .:: :. : . : .:: ::. :::: : .::.: .
CCDS74 CFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB4 SRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGP
::.:::..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : :
CCDS74 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP
520 530 540 550 560 570
590 600 610 620 630 640
pF1KB4 HCVKTCPAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SI
:: ::.:: . . . .::. : .:. : :::..:. .:::.. : ::
CCDS74 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSI
580 590 600 610 620 630
650 660 670 680 690 700
pF1KB4 ATGMVGALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQAL
...:: .::::.::. :....::. .:: :.:::::: :::::::::: ::::
CCDS74 ISAVVG---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQ
640 650 660 670 680 690
710 720 730 740 750 760
pF1KB4 LRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEA
.:::::::..:.::::::::::::::.:::.::.:::::::: ::: :::::::::::::
CCDS74 MRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEA
700 710 720 730 740 750
770 780 790 800 810 820
pF1KB4 YVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAK
::::.: .:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.::::
CCDS74 YVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAK
760 770 780 790 800 810
830 840 850 860 870 880
pF1KB4 GMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMAL
::.:::: :::::::::::::::.:.::::::::::.:: .: ::::.:::::::::::
CCDS74 GMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMAL
820 830 840 850 860 870
890 900 910 920 930 940
pF1KB4 ESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDV
::::.: .::::::::::::::::::::.:::::::: :: ..:::::::::::::::::
CCDS74 ESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDV
880 890 900 910 920 930
950 960 970 980 990 1000
pF1KB4 YMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMD
:::::::::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:..
CCDS74 YMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLE
940 950 960 970 980 990
1010 1020 1030
pF1KB4 EEDMDDVVDADEYLIPQQGFF-----------------SSPSTS----------------
..:: :.:::.:::.:::::: :: . :
CCDS74 DDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEA
1000 1010 1020 1030 1040 1050
1040 1050 1060 1070 1080
pF1KB4 -RTPLLSSLSATSN--NSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----ID
:.:: : .: :. .. .. .:::: : .. : ::::: ::: : ..
CCDS74 PRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAP
1060 1070 1080 1090 1100 1110
1090 1100 1110 1120 1130
pF1KB4 DTFLPVPEYINQ-SVPKRPAGSVQNPVYHNQPLN-----P---APSRDPHYQD--PHSTA
: : :::.:: .: .: . ..:. .: . : .:... .: . :
CCDS74 LTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGA
1120 1130 1140 1150 1160 1170
1140 1150 1160 1170 1180 1190
pF1KB4 VGNPEYLNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-T
: ::::: : : . . :: . ..:: : .. :... : . :::. :
CCDS74 VENPEYL-TPQGGAAPQPHPPPAF-------SPAFDNLYYWDQDPPERGAPPSTFKGTPT
1180 1190 1200 1210 1220
1200 1210
pF1KB4 AENAEYLRVAPQSSEFIGA
::: :::
CCDS74 AENPEYLGLDVPV
1230 1240
>>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa)
initn: 3288 init1: 1784 opt: 3748 Z-score: 1774.5 bits: 340.5 E(32554): 1.6e-92
Smith-Waterman score: 4134; 50.4% identity (72.2% similar) in 1254 aa overlap (14-1198:11-1249)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
:: :: : . : .:: ::. :: .. : :. :......:.:
CCDS32 MELAALCRWGLLLALLPPGAA--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQV
10 20 30 40 50
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
: ::::.::. : .::::. :::: :::::: : :...::. :.:.::.. .:..::::
CCDS32 VQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALA
60 70 80 90 100 110
130 140 150 160 170
pF1KB4 VLSNYD----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSS
::.: : :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: .
CCDS32 VLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB4 DFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSD
. ... :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.:
CCDS32 NNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTD
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 CCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGAT
:::.:::::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::.
CCDS32 CCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGAS
240 250 260 270 280 290
300 310 320 330 340
pF1KB4 CVKKCPRNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSL
:: :: ::. :: :::. .: . :. :::...:.:: :: .:: :.:. ....
CCDS32 CVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVR
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB4 SINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQA
.....::..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.:
CCDS32 AVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISA
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB4 WPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNL
::.. :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .:
CCDS32 WPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHL
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB4 CYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNV
:...:. : .:: . : .:: :. : . : .:: ::. :::: : .::.: .
CCDS32 CFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB4 SRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGP
::.:::..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : :
CCDS32 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB4 HCVKTCPAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SI
:: ::.:: . . . .::. : .:. : :::..:. .:::.. : ::
CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSI
600 610 620 630 640 650
650 660 670 680 690 700
pF1KB4 ATGMVGALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQAL
...:: .::::.::. :....::. .:: :.:::::: :::::::::: ::::
CCDS32 ISAVVG---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQ
660 670 680 690 700 710
710 720 730 740 750 760
pF1KB4 LRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEA
.:::::::..:.::::::::::::::.:::.::.:::::::: ::: :::::::::::::
CCDS32 MRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEA
720 730 740 750 760 770
770 780 790 800 810 820
pF1KB4 YVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAK
::::.: .:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.::::
CCDS32 YVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAK
780 790 800 810 820 830
830 840 850 860 870 880
pF1KB4 GMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMAL
::.:::: :::::::::::::::.:.::::::::::.:: .: ::::.:::::::::::
CCDS32 GMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMAL
840 850 860 870 880 890
890 900 910 920 930 940
pF1KB4 ESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDV
::::.: .::::::::::::::::::::.:::::::: :: ..:::::::::::::::::
CCDS32 ESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDV
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KB4 YMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMD
:::::::::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:..
CCDS32 YMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLE
960 970 980 990 1000 1010
1010 1020 1030
pF1KB4 EEDMDDVVDADEYLIPQQGFF-----------------SSPSTS----------------
..:: :.:::.:::.:::::: :: . :
CCDS32 DDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEA
1020 1030 1040 1050 1060 1070
1040 1050 1060 1070 1080
pF1KB4 -RTPLLSSLSATSN--NSTVACIDRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----ID
:.:: : .: :. .. .. .:::: : .. : ::::: ::: : ..
CCDS32 PRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAP
1080 1090 1100 1110 1120 1130
1090 1100 1110 1120 1130
pF1KB4 DTFLPVPEYINQ-SVPKRPAGSVQNPVYHNQPLN-----P---APSRDPHYQD--PHSTA
: : :::.:: .: .: . ..:. .: . : .:... .: . :
CCDS32 LTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGA
1140 1150 1160 1170 1180 1190
1140 1150 1160 1170 1180 1190
pF1KB4 VGNPEYLNTVQPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-T
: ::::: : : . . :: . ..:: : .. :... : . :::. :
CCDS32 VENPEYL-TPQGGAAPQPHPPPAF-------SPAFDNLYYWDQDPPERGAPPSTFKGTPT
1200 1210 1220 1230 1240
1200 1210
pF1KB4 AENAEYLRVAPQSSEFIGA
::: :::
CCDS32 AENPEYLGLDVPV
1250
>>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa)
initn: 3476 init1: 1779 opt: 3698 Z-score: 1751.9 bits: 336.0 E(32554): 2.9e-91
Smith-Waterman score: 4001; 55.3% identity (78.0% similar) in 1028 aa overlap (14-1024:11-1031)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
:: :: : . : .:: ::. :: .. : :. :......:.:
CCDS77 MELAALCRWGLLLALLPPGAA--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQV
10 20 30 40 50
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
: ::::.::. : .::::. :::: :::::: : :...::. :.:.::.. .:..::::
CCDS77 VQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALA
60 70 80 90 100 110
130 140 150 160 170
pF1KB4 VLSNYD----------ANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSS
::.: : :. ::.:: .:.: :::.:.: .. :: :: ..: :.:: .
CCDS77 VLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB4 DFLSNMSMDFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSD
. ... :. .:. :.: : .. ::: . :.::.::. .:: :. ::.: :.:
CCDS77 NNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTD
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 CCHNQCAAGCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGAT
:::.:::::::::..::::.: .: . :. :: :. :: :.. ::::.:.:::.
CCDS77 CCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGAS
240 250 260 270 280 290
300 310 320 330 340
pF1KB4 CVKKCPRNYVVTDHGSCVRACGADSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSL
:: :: ::. :: :::. .: . :. :::...:.:: :: .:: :.:. ....
CCDS77 CVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVR
300 310 320 330 340 350
350 360 370 380 390 400
pF1KB4 SINATNIKHFKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQA
.....::..: .: .: :.: .:: .: :: ..: ::.:..:....:..::::.: :.:
CCDS77 AVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISA
360 370 380 390 400 410
410 420 430 440 450 460
pF1KB4 WPENRTDLHAFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNL
::.. :: .:.::..:::: ..: .::.. .:.:. ::::::.:...: ..: : .:
CCDS77 WPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHL
420 430 440 450 460 470
470 480 490 500 510 520
pF1KB4 CYANTINWKKLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNV
:...:. : .:: . : .:: :. : . : .:: ::. :::: : .::.: .
CCDS77 CFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF
480 490 500 510 520 530
530 540 550 560 570 580
pF1KB4 SRGRECVDKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGP
::.:::..: .:.: :::.:. .:. ::::: :: ..:: : :.:. :::: : :
CCDS77 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KB4 HCVKTCPAGVMGENNTL-VWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SI
:: ::.:: . . . .::. : .:. : :::..:. .:::.. : ::
CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSI
600 610 620 630 640 650
650 660 670 680 690 700
pF1KB4 ATGMVGALLLLLVVALGI--GLFMRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQAL
...:: .::::.::. :....::. .:: :.:::::: :::::::::: ::::
CCDS77 ISAVVG---ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQ
660 670 680 690 700 710
710 720 730 740 750 760
pF1KB4 LRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEA
.:::::::..:.::::::::::::::.:::.::.:::::::: ::: :::::::::::::
CCDS77 MRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEA
720 730 740 750 760 770
770 780 790 800 810 820
pF1KB4 YVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAK
::::.: .:.: :::::::::::::.:::::.:::::.:::.. .::: :::::.::::
CCDS77 YVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAK
780 790 800 810 820 830
830 840 850 860 870 880
pF1KB4 GMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMAL
::.:::: :::::::::::::::.:.::::::::::.:: .: ::::.:::::::::::
CCDS77 GMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMAL
840 850 860 870 880 890
890 900 910 920 930 940
pF1KB4 ESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDV
::::.: .::::::::::::::::::::.:::::::: :: ..:::::::::::::::::
CCDS77 ESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDV
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KB4 YMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMD
:::::::::::.. ::.::::. :::.:::::::..::: .: . :: ::.:::.:..
CCDS77 YMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLE
960 970 980 990 1000 1010
1010 1020 1030 1040 1050 1060
pF1KB4 EEDMDDVVDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKED
..:: :.:::.:::.::::::
CCDS77 DDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM
1020 1030 1040 1050
>>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa)
initn: 2901 init1: 1213 opt: 3423 Z-score: 1622.7 bits: 312.5 E(32554): 4.6e-84
Smith-Waterman score: 3423; 47.3% identity (75.0% similar) in 1014 aa overlap (11-1014:9-1012)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
.:.:: .: .:.. . . :: :: : :. : :... .: .... :::
CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV
10 20 30 40 50
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
:.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:.
CCDS31 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF
60 70 80 90 100 110
130 140 150 160 170
pF1KB4 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD
:. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . .
CCDS31 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB4 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG
... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.:
CCDS31 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY
:.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:.
CCDS31 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH
:: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....::
CCDS31 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
: :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . ..
CCDS31 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB4 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW
.: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...::
CCDS31 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB4 KKLF-GTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECV
:.. : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: ::
CCDS31 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB4 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP
.::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..::
CCDS31 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP
540 550 560 570 580 590
600 610 620 630 640 650
pF1KB4 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTN-----GPKIPSIATGMV
::.: .. ..:: :. . :. :: ::: :: :: :. : . : ..: ..
CCDS31 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI
600 610 620 630 640
660 670 680 690 700 710
pF1KB4 GALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETE
..:...... : :. : :.: ::..:: :.. : .::: :: : :..: ::.::::
CCDS31 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANKVLARIFKETE
650 660 670 680 690 700
720 730 740 750 760 770
pF1KB4 FKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDN
..:.::::::.::::.::.::::::..:::: :: ... .. .. . . :. ...:.:.
CCDS31 LRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDH
710 720 730 740 750 760
780 790 800 810 820 830
pF1KB4 PHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDR
:. ::::.: :..::.:: .:.: :::.::.:. .: : :::: ::::::: :::..
CCDS31 AHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEH
770 780 790 800 810 820
840 850 860 870 880 890
pF1KB4 RLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIY
.:::.:::::::.:.:..:...:::.: :: ..:. .:.:::::::::: :
CCDS31 GMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKY
830 840 850 860 870 880
900 910 920 930 940 950
pF1KB4 THQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCW
::::::::::::::::::::..:: :. .:. ..::::::: :: ::::::::.:::::
CCDS31 THQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCW
890 900 910 920 930 940
960 970 980 990 1000 1010
pF1KB4 MIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHL-PSPTDSNFYRALMDEEDMDDV
::: . :: :.:: ::..::::: :::::. . . :.: .. ..: ...
CCDS31 MIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPE
950 960 970 980 990 1000
1020 1030 1040 1050 1060 1070
pF1KB4 VDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYS
.: :
CCDS31 LDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQE
1010 1020 1030 1040 1050 1060
>>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa)
initn: 2954 init1: 1893 opt: 3184 Z-score: 1511.4 bits: 291.8 E(32554): 7.3e-78
Smith-Waterman score: 4325; 51.2% identity (75.3% similar) in 1253 aa overlap (1-1176:1-1246)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
:.:. :. . ..::.: . . . ..:: :: :::..:. .:... .:.....::::
CCDS42 MKPA-TGLWVWVSLLVA-AGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
10 20 30 40 50
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS42 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
60 70 80 90 100 110
130 140 150 160 170
pF1KB4 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS42 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB4 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS42 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS42 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS42 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS42 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB4 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS42 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB4 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDK
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS42 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB4 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA
::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. ::
CCDS42 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD
540 550 560 570 580 590
600 610 620 630 640
pF1KB4 GVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSIA
:..: : ....:::: . :: :::::: ::.:: . : : .: : . : ::
CCDS42 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA
600 610 620 630 640 650
650 660 670 680 690 700
pF1KB4 TGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRIL
.:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: ::::
CCDS42 AGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL
660 670 680 690 700 710
710 720 730 740 750 760
pF1KB4 KETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMA
::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .::
CCDS42 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA
720 730 740 750 760 770
770 780 790 800 810 820
pF1KB4 SVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNY
:.:.::. ::::.::. :.::.::::: ::::.::.::::::::: :::::::::::: :
CCDS42 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY
780 790 800 810 820 830
830 840 850 860 870 880
pF1KB4 LEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESIL
::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: :
CCDS42 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH
840 850 860 870 880 890
890 900 910 920 930 940
pF1KB4 HRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIM
.: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::.:
CCDS42 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KB4 VKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDM
::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.::::.
CCDS42 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL
960 970 980 990 1000 1010
1010 1020 1030 1040
pF1KB4 DDVVDADEYLIPQ-------------------------QGFFSSPSTSRTPLLSSLSA--
.:..::.:::.:: .: :.. . .: . :.
CCDS42 EDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIP
1020 1030 1040 1050 1060 1070
1050 1060 1070 1080
pF1KB4 ---TSNNSTVACIDR---NGLQSCPI----KEDSFLQRYSSDPT---------GALTEDS
.....:. .: :: :. .::: ::::.::: : : :..
CCDS42 EAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEG
1080 1090 1100 1110 1120 1130
1090 1100 1110 1120
pF1KB4 IDDTFLPVP--EYINQS-----VPKRPAGSVQ---NPVYHNQPLNPAPSRD-----PHYQ
. : ::.: : .: :..: :: ::: .: ..: : :
CCDS42 YMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLYL
1140 1150 1160 1170 1180 1190
1130 1140 1150 1160 1170 1180
pF1KB4 DPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISLDNPDYQQDFFPKEAKP
. ....:. ::: :.. .: ....::.: .: .. . .:..::: :..
CCDS42 NTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYK
1200 1210 1220 1230 1240 1250
1190 1200 1210
pF1KB4 NGIFKGSTAENAEYLRVAPQSSEFIGA
CCDS42 QNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
1260 1270 1280 1290
>>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa)
initn: 2954 init1: 1893 opt: 3162 Z-score: 1501.1 bits: 289.9 E(32554): 2.7e-77
Smith-Waterman score: 4261; 51.1% identity (74.2% similar) in 1250 aa overlap (1-1157:1-1243)
10 20 30 40 50 60
pF1KB4 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
:.:. :. . ..::.: . . . ..:: :: :::..:. .:... .:.....::::
CCDS23 MKPA-TGLWVWVSLLVA-AGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
10 20 30 40 50
70 80 90 100 110 120
pF1KB4 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS23 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
60 70 80 90 100 110
130 140 150 160 170
pF1KB4 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS23 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB4 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS23 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS23 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS23 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS23 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB4 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS23 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB4 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPKDCVSCRNVSRGRECVDK
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS23 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB4 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA
::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. ::
CCDS23 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD
540 550 560 570 580 590
600 610 620 630 640
pF1KB4 GVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSIA
:..: : ....:::: . :: :::::: ::.:: . : : .: : . : ::
CCDS23 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA
600 610 620 630 640 650
650 660 670 680 690 700
pF1KB4 TGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRIL
.:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: ::::
CCDS23 AGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL
660 670 680 690 700 710
710 720 730 740 750 760
pF1KB4 KETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMA
::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .::
CCDS23 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA
720 730 740 750 760 770
770 780 790 800 810 820
pF1KB4 SVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNY
:.:.::. ::::.::. :.::.::::: ::::.::.::::::::: :::::::::::: :
CCDS23 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY
780 790 800 810 820 830
830 840 850 860 870 880
pF1KB4 LEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESIL
::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: :
CCDS23 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH
840 850 860 870 880 890
890 900 910 920 930 940
pF1KB4 HRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIM
.: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::.:
CCDS23 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KB4 VKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDM
::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.::::.
CCDS23 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL
960 970 980 990 1000 1010
1010 1020 1030 1040 1050
pF1KB4 DDVVDADEYLIPQQGFFSSP-STSRTPLLSSLSATSNNSTVACIDRNGLQ----------
.:..::.:::.:: . : :::. . :. : ... : .: :
CCDS23 EDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAA
1020 1030 1040 1050 1060 1070
1060 1070
pF1KB4 -------------------------------SC-------PI----KEDSFLQRYSSDPT
:: :. .::: ::::.:::
CCDS23 EQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPT
1080 1090 1100 1110 1120 1130
1080 1090 1100 1110
pF1KB4 ---------GALTEDSIDDTFLPVP--EYINQS-----VPKRPAGSVQ---NPVYHNQPL
: : :.. . : ::.: : .: :..: :: :::
CCDS23 VFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASN
1140 1150 1160 1170 1180 1190
1120 1130 1140 1150 1160
pF1KB4 NPAPSRD-----PHYQDPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISL
.: ..: : : . ....:. ::: :.. .: ....::.: .:
CCDS23 GPPKAEDEYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTL
1200 1210 1220 1230 1240 1250
1170 1180 1190 1200 1210
pF1KB4 DNPDYQQDFFPKEAKPNGIFKGSTAENAEYLRVAPQSSEFIGA
CCDS23 QHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
1260 1270 1280 1290 1300
1210 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 23:40:51 2016 done: Sun Nov 6 23:40:52 2016
Total Scan time: 5.000 Total Display time: 0.610
Function used was FASTA [36.3.4 Apr, 2011]