FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3024, 1352 aa
1>>>pF1KB3024 1352 - 1352 aa - 1352 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.6462+/-0.00127; mu= 12.9761+/- 0.076
mean_var=469.1342+/-102.548, 0's: 0 Z-trim(113.1): 435 B-trim: 777 in 1/52
Lambda= 0.059214
statistics sampled from 13279 (13779) to 13279 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.739), E-opt: 0.2 (0.423), width: 16
Scan time: 5.420
The best scores are: opt bits E(32554)
CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 8835 771.1 0
CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 8696 759.3 1.5e-218
CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 8630 753.6 7.4e-217
CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 7402 648.6 2.6e-185
CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 4364 388.7 2.6e-107
CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 3921 351.4 9.6e-96
CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 3812 342.1 6.1e-93
CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3748 336.5 2.6e-91
CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 2998 272.5 5.3e-72
CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 1721 162.9 2.5e-39
CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 1721 163.0 2.6e-39
CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 948 96.6 1.5e-19
CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 743 79.7 4.4e-14
CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 727 78.3 1.1e-13
CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 724 78.1 1.4e-13
CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 718 77.6 2e-13
CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 718 77.6 2e-13
CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 709 76.8 3.4e-13
CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 709 76.8 3.4e-13
CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 709 76.8 3.4e-13
CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 709 76.8 3.4e-13
CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 709 76.8 3.4e-13
CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 705 76.4 4.2e-13
CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 705 76.5 4.3e-13
CCDS3268.1 EPHB3 gene_id:2049|Hs108|chr3 ( 998) 704 76.4 4.5e-13
CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 703 76.3 4.7e-13
CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 703 76.3 4.7e-13
CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 703 76.3 4.9e-13
CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 700 76.1 5.8e-13
CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 700 76.1 5.8e-13
CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 700 76.1 6e-13
CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 696 75.7 7.1e-13
CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 686 74.4 9.6e-13
CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 690 75.2 1e-12
CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 688 75.0 1.2e-12
CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 688 75.0 1.2e-12
CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 688 75.0 1.2e-12
CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 688 75.1 1.2e-12
CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 688 75.1 1.3e-12
CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 688 75.1 1.3e-12
CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 688 75.1 1.3e-12
CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 671 73.2 2.5e-12
CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 671 73.2 2.5e-12
CCDS5031.1 EPHA7 gene_id:2045|Hs108|chr6 ( 998) 674 73.8 2.7e-12
CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 670 73.6 3.6e-12
CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 670 73.6 3.6e-12
CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 666 73.4 5.1e-12
CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 666 73.4 5.1e-12
CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 658 72.4 6.8e-12
CCDS82777.1 MST1R gene_id:4486|Hs108|chr3 (1294) 660 72.8 7e-12
>>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa)
initn: 8835 init1: 8835 opt: 8835 Z-score: 4101.3 bits: 771.1 E(32554): 0
Smith-Waterman score: 8835; 100.0% identity (100.0% similar) in 1255 aa overlap (98-1352:1-1255)
70 80 90 100 110 120
pF1KB3 PGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAASTQVCTGTD
::::::::::::::::::::::::::::::
CCDS32 MELAALCRWGLLLALLPPGAASTQVCTGTD
10 20 30
130 140 150 160 170 180
pF1KB3 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ
40 50 60 70 80 90
190 200 210 220 230 240
pF1KB3 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK
100 110 120 130 140 150
250 260 270 280 290 300
pF1KB3 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE
160 170 180 190 200 210
310 320 330 340 350 360
pF1KB3 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA
220 230 240 250 260 270
370 380 390 400 410 420
pF1KB3 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR
280 290 300 310 320 330
430 440 450 460 470 480
pF1KB3 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA
340 350 360 370 380 390
490 500 510 520 530 540
pF1KB3 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI
400 410 420 430 440 450
550 560 570 580 590 600
pF1KB3 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA
460 470 480 490 500 510
610 620 630 640 650 660
pF1KB3 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ
520 530 540 550 560 570
670 680 690 700 710 720
pF1KB3 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC
580 590 600 610 620 630
730 740 750 760 770 780
pF1KB3 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL
640 650 660 670 680 690
790 800 810 820 830 840
pF1KB3 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV
700 710 720 730 740 750
850 860 870 880 890 900
pF1KB3 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV
760 770 780 790 800 810
910 920 930 940 950 960
pF1KB3 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL
820 830 840 850 860 870
970 980 990 1000 1010 1020
pF1KB3 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE
880 890 900 910 920 930
1030 1040 1050 1060 1070 1080
pF1KB3 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ
940 950 960 970 980 990
1090 1100 1110 1120 1130 1140
pF1KB3 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS
1000 1010 1020 1030 1040 1050
1150 1160 1170 1180 1190 1200
pF1KB3 STRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 STRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQ
1060 1070 1080 1090 1100 1110
1210 1220 1230 1240 1250 1260
pF1KB3 RYSEDPTVPLPSETDGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RYSEDPTVPLPSETDGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERP
1120 1130 1140 1150 1160 1170
1270 1280 1290 1300 1310 1320
pF1KB3 KTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPER
1180 1190 1200 1210 1220 1230
1330 1340 1350
pF1KB3 GAPPSTFKGTPTAENPEYLGLDVPV
:::::::::::::::::::::::::
CCDS32 GAPPSTFKGTPTAENPEYLGLDVPV
1240 1250
>>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa)
initn: 8696 init1: 8696 opt: 8696 Z-score: 4037.1 bits: 759.3 E(32554): 1.5e-218
Smith-Waterman score: 8696; 99.5% identity (99.8% similar) in 1240 aa overlap (113-1352:1-1240)
90 100 110 120 130 140
pF1KB3 AGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAASTQVCTGTDMKLRLPASPETHLDM
.: :. . ::::::::::::::::::::::
CCDS74 MPRGSWKPQVCTGTDMKLRLPASPETHLDM
10 20 30
150 160 170 180 190 200
pF1KB3 LRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 LRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGT
40 50 60 70 80 90
210 220 230 240 250 260
pF1KB3 QLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 QLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQD
100 110 120 130 140 150
270 280 290 300 310 320
pF1KB3 TILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 TILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCA
160 170 180 190 200 210
330 340 350 360 370 380
pF1KB3 RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNP
220 230 240 250 260 270
390 400 410 420 430 440
pF1KB3 EGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 EGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGL
280 290 300 310 320 330
450 460 470 480 490 500
pF1KB3 GMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 GMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEE
340 350 360 370 380 390
510 520 530 540 550 560
pF1KB3 ITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 ITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGL
400 410 420 430 440 450
570 580 590 600 610 620
pF1KB3 ALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 ALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGP
460 470 480 490 500 510
630 640 650 660 670 680
pF1KB3 TQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 TQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCV
520 530 540 550 560 570
690 700 710 720 730 740
pF1KB3 ACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 ACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAE
580 590 600 610 620 630
750 760 770 780 790 800
pF1KB3 QRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 QRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGA
640 650 660 670 680 690
810 820 830 840 850 860
pF1KB3 MPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 MPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANK
700 710 720 730 740 750
870 880 890 900 910 920
pF1KB3 EILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 EILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNW
760 770 780 790 800 810
930 940 950 960 970 980
pF1KB3 CMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 CMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVP
820 830 840 850 860 870
990 1000 1010 1020 1030 1040
pF1KB3 IKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 IKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPP
880 890 900 910 920 930
1050 1060 1070 1080 1090 1100
pF1KB3 ICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 ICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFY
940 950 960 970 980 990
1110 1120 1130 1140 1150 1160
pF1KB3 RSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 RSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEP
1000 1010 1020 1030 1040 1050
1170 1180 1190 1200 1210 1220
pF1KB3 SEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 SEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETD
1060 1070 1080 1090 1100 1110
1230 1240 1250 1260 1270 1280
pF1KB3 GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVF
1120 1130 1140 1150 1160 1170
1290 1300 1310 1320 1330 1340
pF1KB3 AFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS74 AFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAEN
1180 1190 1200 1210 1220 1230
1350
pF1KB3 PEYLGLDVPV
::::::::::
CCDS74 PEYLGLDVPV
1240
>>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa)
initn: 8630 init1: 8630 opt: 8630 Z-score: 4006.7 bits: 753.6 E(32554): 7.4e-217
Smith-Waterman score: 8630; 100.0% identity (100.0% similar) in 1225 aa overlap (128-1352:1-1225)
100 110 120 130 140 150
pF1KB3 MELAALCRWGLLLALLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNL
::::::::::::::::::::::::::::::
CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNL
10 20 30
160 170 180 190 200 210
pF1KB3 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG
40 50 60 70 80 90
220 230 240 250 260 270
pF1KB3 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA
100 110 120 130 140 150
280 290 300 310 320 330
pF1KB3 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC
160 170 180 190 200 210
340 350 360 370 380 390
pF1KB3 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP
220 230 240 250 260 270
400 410 420 430 440 450
pF1KB3 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN
280 290 300 310 320 330
460 470 480 490 500 510
pF1KB3 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP
340 350 360 370 380 390
520 530 540 550 560 570
pF1KB3 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV
400 410 420 430 440 450
580 590 600 610 620 630
pF1KB3 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC
460 470 480 490 500 510
640 650 660 670 680 690
pF1KB3 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC
520 530 540 550 560 570
700 710 720 730 740 750
pF1KB3 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG
580 590 600 610 620 630
760 770 780 790 800 810
pF1KB3 ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETEL
640 650 660 670 680 690
820 830 840 850 860 870
pF1KB3 RKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 RKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSP
700 710 720 730 740 750
880 890 900 910 920 930
pF1KB3 YVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 YVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVR
760 770 780 790 800 810
940 950 960 970 980 990
pF1KB3 LVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFT
820 830 840 850 860 870
1000 1010 1020 1030 1040 1050
pF1KB3 HQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 HQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWM
880 890 900 910 920 930
1060 1070 1080 1090 1100 1110
pF1KB3 IDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFYRSLLEDDDMGDLVDA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 IDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFYRSLLEDDDMGDLVDA
940 950 960 970 980 990
1120 1130 1140 1150 1160 1170
pF1KB3 EEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 EEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEG
1000 1010 1020 1030 1040 1050
1180 1190 1200 1210 1220 1230
pF1KB3 AGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQPEYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 AGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQPEYV
1060 1070 1080 1090 1100 1110
1240 1250 1260 1270 1280 1290
pF1KB3 NQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 NQPDVRPQPPSPREGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQ
1120 1130 1140 1150 1160 1170
1300 1310 1320 1330 1340 1350
pF1KB3 GGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEYLGLDVPV
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 GGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEYLGLDVPV
1180 1190 1200 1210 1220
>>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa)
initn: 7591 init1: 7402 opt: 7402 Z-score: 3440.4 bits: 648.6 E(32554): 2.6e-185
Smith-Waterman score: 7402; 99.9% identity (100.0% similar) in 1054 aa overlap (98-1151:1-1054)
70 80 90 100 110 120
pF1KB3 PGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAASTQVCTGTD
::::::::::::::::::::::::::::::
CCDS77 MELAALCRWGLLLALLPPGAASTQVCTGTD
10 20 30
130 140 150 160 170 180
pF1KB3 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQ
40 50 60 70 80 90
190 200 210 220 230 240
pF1KB3 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILK
100 110 120 130 140 150
250 260 270 280 290 300
pF1KB3 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 GGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSE
160 170 180 190 200 210
310 320 330 340 350 360
pF1KB3 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPA
220 230 240 250 260 270
370 380 390 400 410 420
pF1KB3 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQR
280 290 300 310 320 330
430 440 450 460 470 480
pF1KB3 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 CEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTA
340 350 360 370 380 390
490 500 510 520 530 540
pF1KB3 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGI
400 410 420 430 440 450
550 560 570 580 590 600
pF1KB3 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLA
460 470 480 490 500 510
610 620 630 640 650 660
pF1KB3 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 CHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQ
520 530 540 550 560 570
670 680 690 700 710 720
pF1KB3 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 NGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINC
580 590 600 610 620 630
730 740 750 760 770 780
pF1KB3 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 THSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIRKYTMRRL
640 650 660 670 680 690
790 800 810 820 830 840
pF1KB3 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPV
700 710 720 730 740 750
850 860 870 880 890 900
pF1KB3 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHV
760 770 780 790 800 810
910 920 930 940 950 960
pF1KB3 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 RENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLL
820 830 840 850 860 870
970 980 990 1000 1010 1020
pF1KB3 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPARE
880 890 900 910 920 930
1030 1040 1050 1060 1070 1080
pF1KB3 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 IPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQ
940 950 960 970 980 990
1090 1100 1110 1120 1130 1140
pF1KB3 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSS
1000 1010 1020 1030 1040 1050
1150 1160 1170 1180 1190 1200
pF1KB3 STRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQ
:::.
CCDS77 STRNM
>>CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 (603 aa)
initn: 4364 init1: 4364 opt: 4364 Z-score: 2040.0 bits: 388.7 E(32554): 2.6e-107
Smith-Waterman score: 4364; 100.0% identity (100.0% similar) in 603 aa overlap (128-730:1-603)
100 110 120 130 140 150
pF1KB3 MELAALCRWGLLLALLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNL
::::::::::::::::::::::::::::::
CCDS77 MKLRLPASPETHLDMLRHLYQGCQVVQGNL
10 20 30
160 170 180 190 200 210
pF1KB3 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNG
40 50 60 70 80 90
220 230 240 250 260 270
pF1KB3 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLA
100 110 120 130 140 150
280 290 300 310 320 330
pF1KB3 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 LTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQC
160 170 180 190 200 210
340 350 360 370 380 390
pF1KB3 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACP
220 230 240 250 260 270
400 410 420 430 440 450
pF1KB3 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 YNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSAN
280 290 300 310 320 330
460 470 480 490 500 510
pF1KB3 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 IQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLP
340 350 360 370 380 390
520 530 540 550 560 570
pF1KB3 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 DLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV
400 410 420 430 440 450
580 590 600 610 620 630
pF1KB3 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 PWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQEC
460 470 480 490 500 510
640 650 660 670 680 690
pF1KB3 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARC
520 530 540 550 560 570
700 710 720 730 740 750
pF1KB3 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG
:::::::::::::::::::::::::::::::::
CCDS77 PSGVKPDLSYMPIWKFPDEEGACQPCPINCTHS
580 590 600
760 770 780 790 800 810
pF1KB3 ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETEL
>>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa)
initn: 3387 init1: 1682 opt: 3921 Z-score: 1832.4 bits: 351.4 E(32554): 9.6e-96
Smith-Waterman score: 3966; 47.6% identity (71.0% similar) in 1287 aa overlap (106-1346:10-1269)
80 90 100 110 120 130
pF1KB3 PAPRALPAGSSRSHGAGAAVSTMELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRL
: .::.: . : . : .::.::. ::
CCDS42 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSS
10 20 30
140 150 160 170 180 190
pF1KB3 PASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVP
.. : . ::. :..:.::.::::.: . : .::::....:: ::::.: :: : .:
CCDS42 LSDLEQQYRALRKYYENCEVVMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLP
40 50 60 70 80 90
200 210 220 230 240 250
pF1KB3 LQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLI
:. :::.:::.:.:: ::::.. : .: ::.:: :..:::::.::: .
CCDS42 LENLRIIRGTKLYEDRYALAIFLNYRKDGNF---------GLQELGLKNLTEILNGGVYV
100 110 120 130 140
260 270 280 290 300 310
pF1KB3 QRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSL
..: ::: ::: :.:: .. :::..:: : .: : : : :::: . . ::.:
CCDS42 DQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTL
150 160 170 180 190 200
320 330 340 350 360 370
pF1KB3 TRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTY
:::::: : .:: :: .::::..::.::.::: .::.::..:: :: : .:: .:
CCDS42 TRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVY
210 220 230 240 250 260
380 390 400 410 420 430
pF1KB3 NTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKC
: ::. : ...::.:: :: ::.:.. .: .::. .:: ..:: :.: . :. :
CCDS42 NPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPC
270 280 290 300 310 320
440 450 460 470 480 490
pF1KB3 SKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQP
. : ..: :.: : ...: :.::..: .: :: :.: :: .. ::: . ..:
CCDS42 TDICPKACDGIGTGSLMSAQTVDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDP
330 340 350 360 370 380
500 510 520 530 540 550
pF1KB3 EQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLG
:.:.::.:..::::.: :..:: .. :.:::.:: .: ::.:..: : :. ::. :
CCDS42 EKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQ
390 400 410 420 430 440
560 570 580 590 600 610
pF1KB3 LRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQL
..::.:...: : :..::. ::. : :: . .: .. :: ..:..::..:..:
CCDS42 FQSLKEISAGNIYITDNSNLCYYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHL
450 460 470 480 490 500
620 630 640 650 660 670
pF1KB3 CARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGS
:. :::::: ::..: .: ::. :.: : . .: ::. :. :. : :.:. ..:
CCDS42 CSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGL
510 520 530 540 550 560
680 690 700 710 720 730
pF1KB3 VTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHS
.:: :: :.:. :.:.:: : :: .::.:.. :. :.:. : . :.:: :::..
CCDS42 LTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQG
570 580 590 600 610 620
740 750 760 770
pF1KB3 CVDLDDKGC-----------PAEQRASPLTSIISAVVGILLV-VVLGVVFGILIKRRQQK
: .. : : . : .:: : ..:.: :.. :..:..:.. ..:.. :
CCDS42 CNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK
630 640 650 660 670 680
780 790 800 810 820 830
pF1KB3 IRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIP
.: ..::.: ::::::::::::. :::::.::::::::..:::::::::::::::::.:
CCDS42 -KKRALRRFL-ETELVEPLTPSGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVP
690 700 710 720 730
840 850 860 870 880 890
pF1KB3 DGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLM
.::.::::::::.: :.:.:::: :..::: .::.. :.. ::::.::. :.:::::::
CCDS42 EGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLM
740 750 760 770 780 790
900 910 920 930 940 950
pF1KB3 PYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKI
:.::::..:.:.. .::: :::::.:::::: :::. ::::::::::::::::::::::
CCDS42 PHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKI
800 810 820 830 840 850
960 970 980 990 1000 1010
pF1KB3 TDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAK
:::::::::. :: ::.:::::.:::::::: : :.:::::::::::::.:::::::.:
CCDS42 TDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGK
860 870 880 890 900 910
1020 1030 1040 1050 1060 1070
pF1KB3 PYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMAR
::::::.:::::::::::::::::::::::::.::::::::.. ::.:.::..:::::::
CCDS42 PYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMAR
920 930 940 950 960 970
1080 1090 1100 1110 1120 1130
pF1KB3 DPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAG
::::..:::..: . :: :: :...::...:. :..::::::::: .: : : .
CCDS42 DPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSR
980 990 1000 1010 1020 1030
1140 1150 1160 1170 1180 1190
pF1KB3 GMVHHRHRSSSTRSGGGDLTLGLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGL
. . . . :.:: :. : . . : :: ..:: ...:: . :. .
CCDS42 ARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKP
1040 1050 1060 1070 1080 1090
1200 1210 1220 1230 1240
pF1KB3 QSLPTHDPSPLQRYSEDPTVPLPSET-------DGYVAPLTCSPQPEYVNQPDVRPQPPS
. ... : :::: :::: : .. .::..:. .:. ::.: . :
CCDS42 VAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSR
1100 1110 1120 1130 1140 1150
1250 1260 1270 1280 1290 1300
pF1KB3 PREGPLPAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPH
..: : : : .:. ::. . : . . .:.... . ::: . . :.
CCDS42 RKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA
1160 1170 1180 1190 1200 1210
1310 1320 1330 1340
pF1KB3 PPPAFSPAFDNLYYWDQDPPERGA--PPSTFKGTPT--------------AENPEYLGLD
. :::: ::... : :.. :. .. : :::::::
CCDS42 -----KKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEF
1220 1230 1240 1250 1260 1270
1350
pF1KB3 VPV
CCDS42 SLKPGTVLPPPPYRHRNTVV
1280 1290
>>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa)
initn: 3489 init1: 1665 opt: 3812 Z-score: 1782.0 bits: 342.1 E(32554): 6.1e-93
Smith-Waterman score: 3932; 47.2% identity (70.6% similar) in 1303 aa overlap (106-1346:10-1285)
80 90 100 110 120 130
pF1KB3 PAPRALPAGSSRSHGAGAAVSTMELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRL
: .::.: . : . : .::.::. ::
CCDS23 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSS
10 20 30
140 150 160 170 180 190
pF1KB3 PASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVP
.. : . ::. :..:.::.::::.: . : .::::....:: ::::.: :: : .:
CCDS23 LSDLEQQYRALRKYYENCEVVMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLP
40 50 60 70 80 90
200 210 220 230 240 250
pF1KB3 LQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLI
:. :::.:::.:.:: ::::.. : .: ::.:: :..:::::.::: .
CCDS23 LENLRIIRGTKLYEDRYALAIFLNYRKDGNF---------GLQELGLKNLTEILNGGVYV
100 110 120 130 140
260 270 280 290 300 310
pF1KB3 QRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSL
..: ::: ::: :.:: .. :::..:: : .: : : : :::: . . ::.:
CCDS23 DQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTL
150 160 170 180 190 200
320 330 340 350 360 370
pF1KB3 TRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTY
:::::: : .:: :: .::::..::.::.::: .::.::..:: :: : .:: .:
CCDS23 TRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVY
210 220 230 240 250 260
380 390 400 410 420 430
pF1KB3 NTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKC
: ::. : ...::.:: :: ::.:.. .: .::. .:: ..:: :.: . :. :
CCDS23 NPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPC
270 280 290 300 310 320
440 450 460 470 480 490
pF1KB3 SKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQP
. : ..: :.: : ...: :.::..: .: :: :.: :: .. ::: . ..:
CCDS23 TDICPKACDGIGTGSLMSAQTVDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDP
330 340 350 360 370 380
500 510 520 530 540 550
pF1KB3 EQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLG
:.:.::.:..::::.: :..:: .. :.:::.:: .: ::.:..: : :. ::. :
CCDS23 EKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQ
390 400 410 420 430 440
560 570 580 590 600 610
pF1KB3 LRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQL
..::.:...: : :..::. ::. : :: . .: .. :: ..:..::..:..:
CCDS23 FQSLKEISAGNIYITDNSNLCYYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHL
450 460 470 480 490 500
620 630 640 650 660 670
pF1KB3 CARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGS
:. :::::: ::..: .: ::. :.: : . .: ::. :. :. : :.:. ..:
CCDS23 CSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGL
510 520 530 540 550 560
680 690 700 710 720 730
pF1KB3 VTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHS
.:: :: :.:. :.:.:: : :: .::.:.. :. :.:. : . :.:: :::..
CCDS23 LTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQG
570 580 590 600 610 620
740 750 760 770
pF1KB3 CVDLDDKGC-----------PAEQRASPLTSIISAVVGILLV-VVLGVVFGILIKRRQQK
: .. : : . : .:: : ..:.: :.. :..:..:.. ..:.. :
CCDS23 CNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK
630 640 650 660 670 680
780 790 800 810 820 830
pF1KB3 IRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIP
.: ..::.: ::::::::::::. :::::.::::::::..:::::::::::::::::.:
CCDS23 -KKRALRRFL-ETELVEPLTPSGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVP
690 700 710 720 730
840 850 860 870 880 890
pF1KB3 DGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLM
.::.::::::::.: :.:.:::: :..::: .::.. :.. ::::.::. :.:::::::
CCDS23 EGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLM
740 750 760 770 780 790
900 910 920 930 940 950
pF1KB3 PYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKI
:.::::..:.:.. .::: :::::.:::::: :::. ::::::::::::::::::::::
CCDS23 PHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKI
800 810 820 830 840 850
960 970 980 990 1000 1010
pF1KB3 TDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAK
:::::::::. :: ::.:::::.:::::::: : :.:::::::::::::.:::::::.:
CCDS23 TDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGK
860 870 880 890 900 910
1020 1030 1040 1050 1060 1070
pF1KB3 PYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMAR
::::::.:::::::::::::::::::::::::.::::::::.. ::.:.::..:::::::
CCDS23 PYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMAR
920 930 940 950 960 970
1080 1090 1100 1110 1120 1130
pF1KB3 DPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPA----
::::..:::..: . :: :: :...::...:. :..::::::::: .: : :
CCDS23 DPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSR
980 990 1000 1010 1020 1030
1140 1150 1160 1170
pF1KB3 ---PGAGGMVHHRHRSSSTRSGGGDLTL--GLEPSEE------EAPRS--PLAP-SEGAG
. . . : . : .:.... : .:. .:: : : :: ..::
CCDS23 ARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGAT
1040 1050 1060 1070 1080 1090
1180 1190 1200 1210 1220 1230
pF1KB3 SDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDPTVPLPSET-------DGYVAPLTCSP
...:: . :. . . ... : :::: :::: : .. .::..:. .:
CCDS23 AEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKP
1100 1110 1120 1130 1140 1150
1240 1250 1260 1270 1280
pF1KB3 QPEYVNQPDVRPQPPSPREGPLPAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVE
. ::.: . : ..: : : : .:. ::. . : . . .:....
CCDS23 KQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLG
1160 1170 1180 1190 1200 1210
1290 1300 1310 1320 1330
pF1KB3 NPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGA--PPSTFKGTPT--------
. ::: . . :. . :::: ::... : :.. :. .. :
CCDS23 KAEYLKNNILSMPEKA-----KKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNG
1220 1230 1240 1250 1260 1270
1340 1350
pF1KB3 ------AENPEYLGLDVPV
:::::::
CCDS23 RIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
1280 1290 1300
>>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa)
initn: 3288 init1: 1784 opt: 3748 Z-score: 1752.8 bits: 336.5 E(32554): 2.6e-91
Smith-Waterman score: 4136; 50.1% identity (71.8% similar) in 1274 aa overlap (88-1346:4-1198)
60 70 80 90 100 110
pF1KB3 FPRGPLLRRAPGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGA
: ::::. .. ::::: : .
CCDS55 MRPSGTAGAALLAL-LAALC---------PASR
10 20
120 130 140 150 160 170
pF1KB3 A--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQ
: .:: ::. :: .. : :. :......:.:: ::::.::. : .::::. ::
CCDS55 ALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLEITYVQRNYDLSFLKTIQ
30 40 50 60 70 80
180 190 200 210 220 230
pF1KB3 EVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLR
:: :::::: : :...::. :.:.::.. .:..::::::.: : :. ::.
CCDS55 EVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYD----------ANKTGLK
90 100 110 120 130
240 250 260 270 280 290
pF1KB3 ELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPM
:: .:.: :::.:.: .. :: :: ..: :.:: .. ... :. .:. :.:
CCDS55 ELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDFQNHLGSCQKCDPS
140 150 160 170 180 190
300 310 320 330 340 350
pF1KB3 CKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLH
: .. ::: . :.::.::. .:: :. ::.: :.::::.:::::::::..::::.: .
CCDS55 CPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGCTGPRESDCLVCRK
200 210 220 230 240 250
360 370 380 390 400 410
pF1KB3 FNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPL
: . :. :: :. :: :.. ::::.:.:::.:: :: ::. :: :::. .:
CCDS55 FRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYVVTDHGSCVRACGA
260 270 280 290 300 310
420 430 440 450 460 470
pF1KB3 HNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFL
. :. :::...:.:: :: .:: :.:. .... .....::..: .: .: :.: .:
CCDS55 DSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFKNCTSISGDLHIL
320 330 340 350 360 370
480 490 500 510 520 530
pF1KB3 PESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILH
: .: :: ..: ::.:..:....:..::::.: :.:::.. :: .:.::..:::: .
CCDS55 PVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAFENLEIIRGRTKQ
380 390 400 410 420 430
540 550 560 570 580 590
pF1KB3 NGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTA
.: .::.. .:.:. ::::::.:...: ..: : .::...:. : .:: . : .
CCDS55 HGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKLFGTSGQKTKIIS
440 450 460 470 480 490
600 610 620 630 640 650
pF1KB3 NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNA
:: :. : . : .:: ::. :::: : .::.: . ::.:::..: .:.: :::.:.
CCDS55 NRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCNLLEGEPREFVEN
500 510 520 530 540 550
660 670 680 690 700 710
pF1KB3 RHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFP
.:. ::::: :: ..:: : :.:. :::: : : :: ::.:: . . . .::.
CCDS55 SECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVMGENNTL-VWKYA
560 570 580 590 600 610
720 730 740 750 760 770
pF1KB3 DEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVG---ILLVVVLGVVFGIL
: .:. : :::..:. .:::.. : :: ...:: .::::.::. :..
CCDS55 DAGHVCHLCHPNCTYGCTGPGLEGCPTNGPKIP--SIATGMVGALLLLLVVALGI--GLF
620 630 640 650 660
780 790 800 810 820 830
pF1KB3 IKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTV
..::. .:: :.:::::: :::::::::: :::: .:::::::..:.:::::::::::
CCDS55 MRRRHI-VRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETEFKKIKVLGSGAFGTV
670 680 690 700 710 720
840 850 860 870 880 890
pF1KB3 YKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTV
:::.:::.::.:::::::: ::: :::::::::::::::::.: .:.: :::::::::::
CCDS55 YKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTSTV
730 740 750 760 770 780
900 910 920 930 940 950
pF1KB3 QLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVK
::.:::::.:::::.:::.. .::: :::::.::::::.:::: :::::::::::::::
CCDS55 QLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAARNVLVK
790 800 810 820 830 840
960 970 980 990 1000 1010
pF1KB3 SPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWE
.:.::::::::::.:: .: ::::.:::::::::::::::.: .:::::::::::::::
CCDS55 TPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWE
850 860 870 880 890 900
1020 1030 1040 1050 1060 1070
pF1KB3 LMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVS
:::::.:::::::: :: ..::::::::::::::::::::::::::::.. ::.::::.
CCDS55 LMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPKFRELII
910 920 930 940 950 960
1080 1090 1100 1110 1120 1130
pF1KB3 EFSRMARDPQRFVVIQ-NEDLGPASPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCP
:::.:::::::..::: .: . :: ::.:::.:....:: :.:::.:::.::::::
CCDS55 EFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQQGFF--
970 980 990 1000 1010 1020
1140 1150 1160 1170 1180 1190
pF1KB3 DPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMG
:: . : :.:: : .: :. .. ..
CCDS55 ---------------SSPSTS-----------------RTPLLSSLSATSN--NSTVACI
1030 1040 1050
1200 1210 1220 1230 1240 1250
pF1KB3 AAKGLQSLPTHDPSPLQRYSEDPTVPLPSETDGYVAPLTCSPQPEYVNQPDVRPQPPSPR
.:::: : .. : ::::: ::: : .. : : :::.:: .: .: .
CCDS55 DRNGLQSCPIKEDSFLQRYSSDPTGALTEDS----IDDTFLPVPEYINQ-SVPKRPAGSV
1060 1070 1080 1090 1100
1260 1270 1280 1290 1300
pF1KB3 EGPLPAARPAGATLERPKTLSPGKNGVVKDVFAFGGAVENPEYL-TPQGGAAPQPHPPPA
..:. .: . : .:... .: . :: ::::: : : . . ::
CCDS55 QNPVYHNQPLN-----P---APSRDPHYQD--PHSTAVGNPEYLNTVQPTCVNSTFDSPA
1110 1120 1130 1140 1150
1310 1320 1330 1340 1350
pF1KB3 F-------SPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEYLGLDVPV
. ..:: : .. :... : . :::. :::: :::
CCDS55 HWAQKGSHQISLDNPDYQQDFFPKEAKPNGIFKGS-TAENAEYLRVAPQSSEFIGA
1160 1170 1180 1190 1200 1210
>>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa)
initn: 2546 init1: 1647 opt: 2998 Z-score: 1406.1 bits: 272.5 E(32554): 5.3e-72
Smith-Waterman score: 3259; 43.6% identity (69.3% similar) in 1187 aa overlap (102-1272:6-1148)
80 90 100 110 120
pF1KB3 PSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGAA--STQVCTGTDMK
:: :::..: . . : :: ::
CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNG
10 20 30
130 140 150 160 170 180
pF1KB3 LRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVR
: . .. :.. . : .::. :.::.::::.. ::.::::: :.:: ::::.: :.
CCDS31 LSVTGDAENQYQTLYKLYERCEVVMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFS
40 50 60 70 80 90
190 200 210 220 230 240
pF1KB3 QVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGG
.:: ::.:::::... ..:. :. :: .: : .::.:.: .:::::.::
CCDS31 TLPLPNLRVVRGTQVYDGKFAIFVM-----LNYNT----NSSHALRQLRLTQLTEILSGG
100 110 120 130 140
250 260 270 280 290 300
pF1KB3 VLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDC
: :..: .::..::: :.:: .. . ... :..:: : :: .::: :::: .::::
CCDS31 VYIEKNDKLCHMDTIDWRDIV-RDRDAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDC
150 160 170 180 190 200
310 320 330 340 350 360
pF1KB3 QSLTRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPAL
:.::.:.:: : ..: :: :..:::..::.::.::. .::.:: ::: :: : .::
CCDS31 QTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQP
210 220 230 240 250 260
370 380 390 400 410 420
pF1KB3 VTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRC
..:: ::. :::. .: .:. ::..::.:.. .: ::. .:: ..:: ..: . :
CCDS31 LVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMC
270 280 290 300 310 320
430 440 450 460 470 480
pF1KB3 EKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAP
: :. : ..: : : . ..: :.::. :..: ::.:.: :: ...::: .
CCDS31 EPCGGLCPKACEGTGSG--SRFQTVDSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPA
330 340 350 360 370
490 500 510 520 530 540
pF1KB3 LQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGI
:.::.:.::.:..:::::: :..:: . ..:::.:: .: :: :.: ..:: ...:..
CCDS31 LDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNV
380 390 400 410 420 430
550 560 570 580 590 600
pF1KB3 SWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGL
. ::.:::.:...: : : .::. :.. : ...:.: . : :::. .::.::
CCDS31 TSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGK
440 450 460 470 480 490
610 620 630 640 650 660
pF1KB3 ACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQP
.: ::. : :::::: ::..: .. :: :: .: :.: :::... .:. :::::::
CCDS31 VCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQP
500 510 520 530 540 550
670 680 690 700 710 720
pF1KB3 QNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPIN
..:..:: : .: :. :::..: : ::. :: :: . ::.:.:: .. :.:: :
CCDS31 MEGTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHEN
560 570 580 590 600 610
730 740 750 760 770 780
pF1KB3 CTHSCVDLDDKGCPAEQRA----SPLTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-K
::..: . . : .. . . :: .....: :::.. .. : .. : ..:. :
CCDS31 CTQGCKGPELQDCLGQTLVLIGKTHLTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNK
620 630 640 650 660 670
790 800 810 820 830 840
pF1KB3 YTMRRLLQETELVEPLTPSGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGE
.::: :.. : .::: :: :.. ::.:::::::.::::::.::::.::.:::.::
CCDS31 RAMRRYLERGESIEPLDPS-EKANKVLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGE
680 690 700 710 720 730
850 860 870 880 890 900
pF1KB3 NVKIPVAIKVLRENTSPKANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYG
..:::: :::...... .. . . :. ..... .. ::::.: :..::::: .: :
CCDS31 SIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLG
740 750 760 770 780 790
910 920 930 940 950 960
pF1KB3 CLLDHVRENRGRLGSQDLLNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDF
::::::..:: :: : :::: .:::::: :::. .:::.:::::::.:::..:...::
CCDS31 SLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADF
800 810 820 830 840 850
970 980 990 1000 1010 1020
pF1KB3 GLARLLDIDETEYHADGGKVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYD
:.: :: :. . . .:.:::::::::: ..:::::::::::::::::::::.::
CCDS31 GVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYA
860 870 880 890 900 910
1030 1040 1050 1060 1070 1080
pF1KB3 GIPAREIPDLLEKGERLPQPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQ
:. :.:::::::::: :: ::::::::.:::::::: . :: :.::..::.::::::
CCDS31 GLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCWMIDENIRPTFKELANEFTRMARDPP
920 930 940 950 960 970
1090 1100 1110 1120 1130
pF1KB3 RFVVIQNEDLGPA---SPLDSTFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGG
:..::. :. ::. .: . . ::. .. .: . : ..
CCDS31 RYLVIKRES-GPGIAPGPEPHGLTNKKLEEVELEPELDLDLDLEAEED------------
980 990 1000 1010 1020
1140 1150 1160 1170 1180 1190
pF1KB3 MVHHRHRSSSTRSGGGDLTLGLEPSEEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSL
. ...: ... .: .: .. .. .: :.:: : . .:.:: . .. :
CCDS31 -----NLATTTLGSALSLPVGTL-NRPRGSQSLLSPSSGY-MPMNQGNLGESCQESAVSG
1030 1040 1050 1060 1070
1200 1210 1220 1230 1240 1250
pF1KB3 PTHD-PSPLQRYSEDPTVPLPSET-DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPA
.. : :.. . : : ::. .:.:. : : :.. : . ::: :
CCDS31 SSERCPRPVSLHPM-PRGCLASESSEGHVTGSEAELQ-EKVSMCRSRSRSRSPRPRGDSA
1080 1090 1100 1110 1120 1130
1260 1270 1280 1290 1300 1310
pF1KB3 ARPAGATLERPKT-LSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFD
. .: : : :::
CCDS31 YHSQRHSLLTPVTPLSPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEE
1140 1150 1160 1170 1180 1190
>>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa)
initn: 1444 init1: 1137 opt: 1721 Z-score: 819.6 bits: 162.9 E(32554): 2.5e-39
Smith-Waterman score: 2026; 43.6% identity (70.4% similar) in 645 aa overlap (88-729:4-626)
60 70 80 90 100 110
pF1KB3 FPRGPLLRRAPGPHPSQHPAPRALPAGSSRSHGAGAAVSTMELAALCRWGLLLALLPPGA
: ::::. .. ::::: : .
CCDS55 MRPSGTAGAALLAL-LAALC---------PASR
10 20
120 130 140 150 160 170
pF1KB3 A--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQ
: .:: ::. :: .. : :. :......:.:: ::::.::. : .::::. ::
CCDS55 ALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEVVLGNLEITYVQRNYDLSFLKTIQ
30 40 50 60 70 80
180 190 200 210 220 230
pF1KB3 EVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLR
:: :::::: : :...::. :.:.::.. .:..::::::.: : :. ::.
CCDS55 EVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALAVLSNYD----------ANKTGLK
90 100 110 120 130
240 250 260 270 280 290
pF1KB3 ELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPM
:: .:.: :::.:.: .. :: :: ..: :.:: .. ... :. .:. :.:
CCDS55 ELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMDFQNHLGSCQKCDPS
140 150 160 170 180 190
300 310 320 330 340 350
pF1KB3 CKGSRCWGESSEDCQSLTRTVCAGGCA-RCKGPLPTDCCHEQCAAGCTGPKHSDCLACLH
: .. ::: . :.::.::. .:: :. ::.: :.::::.:::::::::..::::.: .
CCDS55 CPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAGCTGPRESDCLVCRK
200 210 220 230 240 250
360 370 380 390 400 410
pF1KB3 FNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPL
: . :. :: :. :: :.. ::::.:.:::.:: :: ::. :: :::. .:
CCDS55 FRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNYVVTDHGSCVRACGA
260 270 280 290 300 310
420 430 440 450 460 470
pF1KB3 HNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFL
. :. :::...:.:: :: .:: :.:. .... .....::..: .: .: :.: .:
CCDS55 DSYEME-EDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKHFKNCTSISGDLHIL
320 330 340 350 360 370
480 490 500 510 520 530
pF1KB3 PESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILH
: .: :: ..: ::.:..:....:..::::.: :.:::.. :: .:.::..:::: .
CCDS55 PVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLHAFENLEIIRGRTKQ
380 390 400 410 420 430
540 550 560 570 580 590
pF1KB3 NGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTA
.: .::.. .:.:. ::::::.:...: ..: : .::...:. : .:: . : .
CCDS55 HGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWKKLFGTSGQKTKIIS
440 450 460 470 480 490
600 610 620 630 640 650
pF1KB3 NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNA
:: :. : . : .:: ::. :::: : .::.: . ::.:::..: .:.: :::.:.
CCDS55 NRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDKCNLLEGEPREFVEN
500 510 520 530 540 550
660 670 680 690 700 710
pF1KB3 RHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFP
.:. ::::: :: ..:: : :.:. :::: : : :: ::.:: . . . .::.
CCDS55 SECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCPAGVMGENNTL-VWKYA
560 570 580 590 600 610
720 730 740 750 760 770
pF1KB3 DEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLTSIISAVVGILLVVVLGVVFGILIKR
: .:. : :::.
CCDS55 DAGHVCHLCHPNCTYGS
620
1352 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 20:48:54 2016 done: Sat Nov 5 20:48:55 2016
Total Scan time: 5.420 Total Display time: 0.660
Function used was FASTA [36.3.4 Apr, 2011]