FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2310, 1308 aa
1>>>pF1KE2310 1308 - 1308 aa - 1308 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.4396+/-0.00166; mu= 9.0243+/- 0.098
mean_var=391.1409+/-85.889, 0's: 0 Z-trim(108.5): 549 B-trim: 0 in 0/51
Lambda= 0.064850
statistics sampled from 9614 (10276) to 9614 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.659), E-opt: 0.2 (0.316), width: 16
Scan time: 5.010
The best scores are: opt bits E(32554)
CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 9147 872.5 0
CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 7348 704.2 5.9e-202
CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 3812 373.3 2.2e-102
CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 3808 372.9 2.9e-102
CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 3798 371.9 5.1e-102
CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 3776 369.9 2.3e-101
CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 3601 353.6 2e-96
CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3166 312.8 3.4e-84
CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 2194 221.5 5.7e-57
CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 2194 221.6 6.1e-57
CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1655 171.0 8.4e-42
CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 1353 142.5 2.2e-33
CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 767 88.3 1.1e-16
CCDS56557.1 PTK2 gene_id:5747|Hs108|chr8 (1065) 766 88.2 1.3e-16
CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 756 87.3 2.4e-16
CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 731 84.5 8.4e-16
CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 732 85.0 1.1e-15
CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 732 85.0 1.1e-15
CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 731 84.9 1.2e-15
CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 731 84.9 1.2e-15
CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 731 84.9 1.2e-15
CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 731 84.9 1.2e-15
CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 731 84.9 1.2e-15
CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 731 85.0 1.2e-15
CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 731 85.0 1.2e-15
CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 731 85.0 1.3e-15
CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 731 85.0 1.3e-15
CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 731 85.0 1.3e-15
CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 715 83.1 2.5e-15
CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 719 83.8 2.5e-15
CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 715 83.1 2.6e-15
CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 717 83.7 3.1e-15
CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 717 83.7 3.1e-15
CCDS2447.1 EPHA4 gene_id:2043|Hs108|chr2 ( 986) 710 82.9 4.5e-15
CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 704 82.4 6.7e-15
CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 687 80.0 1.1e-14
CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 695 81.5 1.2e-14
CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 695 81.5 1.2e-14
CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 695 81.5 1.2e-14
CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 695 81.6 1.2e-14
CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 695 81.6 1.2e-14
CCDS5884.1 EPHA1 gene_id:2041|Hs108|chr7 ( 976) 691 81.1 1.5e-14
CCDS33254.1 ZAP70 gene_id:7535|Hs108|chr2 ( 619) 687 80.5 1.6e-14
CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 687 80.8 2e-14
CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 687 80.8 2e-14
CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 687 80.8 2e-14
CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 687 80.8 2.1e-14
CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 685 80.8 2.8e-14
CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 685 80.8 2.8e-14
CCDS3481.1 TEC gene_id:7006|Hs108|chr4 ( 631) 678 79.6 2.8e-14
>>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa)
initn: 9147 init1: 9147 opt: 9147 Z-score: 4648.8 bits: 872.5 E(32554): 0
Smith-Waterman score: 9147; 100.0% identity (100.0% similar) in 1308 aa overlap (1-1308:1-1308)
10 20 30 40 50 60
pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE2 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE2 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE2 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300
pF1KE2 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS23 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
1270 1280 1290 1300
>>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa)
initn: 7328 init1: 7328 opt: 7348 Z-score: 3739.2 bits: 704.2 E(32554): 5.9e-202
Smith-Waterman score: 8988; 98.8% identity (98.8% similar) in 1308 aa overlap (1-1308:1-1292)
10 20 30 40 50 60
pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 NSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIAAGVIGG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 LFILVIVGLTFAVYVRRKSIKKKRALRRFLETELVEPLTPSGTAPNQAQLRILKETELKR
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASMDHPHL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 VRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLEERRLV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 HRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYRKFTHQ
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVKCWMID
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 ADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDLEDMMDAE
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE2 EYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAAEQGVSVP
::::::::::::::::::::::::: :::::::::::::::::::
CCDS42 EYLVPQAFNIPPPIYTSRARIDSNR----------------NQFVYRDGGFAAEQGVSVP
1030 1040 1050 1060
1090 1100 1110 1120 1130 1140
pF1KE2 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 YRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPTVFAPERS
1070 1080 1090 1100 1110 1120
1150 1160 1170 1180 1190 1200
pF1KE2 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAED
1130 1140 1150 1160 1170 1180
1210 1220 1230 1240 1250 1260
pF1KE2 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQ
1190 1200 1210 1220 1230 1240
1270 1280 1290 1300
pF1KE2 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
1250 1260 1270 1280 1290
>>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa)
initn: 3489 init1: 1665 opt: 3812 Z-score: 1951.4 bits: 373.3 E(32554): 2.2e-102
Smith-Waterman score: 3932; 47.2% identity (70.3% similar) in 1303 aa overlap (10-1285:9-1249)
10 20 30 40 50
pF1KE2 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV
: .::.: . : . : .::.::. :: .. : . ::. :..:.::
CCDS32 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI
.::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.
CCDS32 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP
. : .: ::.:: :..:::::.::: ...: ::: ::: :.:: ..
CCDS32 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN
120 130 140 150 160 170
180 190 200 210 220
pF1KE2 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC
:::..:: : .: : : : :::: . . ::.::::::: : .:: :: .::
CCDS32 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC
::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: :
CCDS32 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT
: ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...
CCDS32 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW
: :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:
CCDS32 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE2 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC
: .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::
CCDS32 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE2 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS
. ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .:
CCDS32 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE2 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP
::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: :
CCDS32 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KE2 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP
:: .::.:.. :. :.:. : . :.:: :::..: .. : :
CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P
600 610 620 630 640
650 660 670 680 690 700
pF1KE2 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP
. : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: ::::::::::
CCDS32 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP
650 660 670 680 690 700
710 720 730 740 750 760
pF1KE2 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK
::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.::
CCDS32 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK
710 720 730 740 750 760
770 780 790 800 810 820
pF1KE2 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL
:: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :
CCDS32 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL
770 780 790 800 810 820
830 840 850 860 870 880
pF1KE2 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG
::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.::::
CCDS32 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG
830 840 850 860 870 880
890 900 910 920 930 940
pF1KE2 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP
:.:::::::: : :.:::::::::::::.:::::::.:::::::.::::::::::::::
CCDS32 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP
890 900 910 920 930 940
950 960 970 980 990 1000
pF1KE2 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND
:::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: :
CCDS32 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD
950 960 970 980 990 1000
1010 1020 1030 1040 1050
pF1KE2 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPM
: :...::...:. :..::::::::: .: : : . . . : . :
CCDS32 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPA-------PGAGGMVHHRHRSSST--
1010 1020 1030 1040 1050
1060 1070 1080 1090 1100 1110
pF1KE2 SGNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHV
:.:: :. : . . : :: ..:: ...:: . :. . . .
CCDS32 -------RSGGGDLTLGLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPT
1060 1070 1080 1090 1100
1120 1130 1140 1150 1160 1170
pF1KE2 QEDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGD
.. : :::: :::: : .: : ::..:. .:. ::.: . : ..:
CCDS32 HDPSPLQRYSEDPTVPLP-----SETD--GYVAPLTCSPQPEYVNQPDVRPQPPSPREGP
1110 1120 1130 1140 1150
1180 1190 1200 1210 1220 1230
pF1KE2 LQALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----
: : : .:. ::. . : . . .:.... . ::: . . :.
CCDS32 LPAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAF
1160 1170 1180 1190 1200 1210
1240 1250 1260 1270 1280 1290
pF1KE2 KKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPG
. :::: ::... : :.. :. .. : :::::::
CCDS32 SPAFDNLYYWDQDPPERGA--PPSTFKGTPT--------------AENPEYLGLDVPV
1220 1230 1240 1250
1300
pF1KE2 TVLPPPPYRHRNTVV
>>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa)
initn: 3485 init1: 1665 opt: 3808 Z-score: 1949.5 bits: 372.9 E(32554): 2.9e-102
Smith-Waterman score: 3928; 47.3% identity (70.7% similar) in 1294 aa overlap (18-1285:4-1234)
10 20 30 40 50 60
pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
:. .: .::.::. :: .. : . ::. :..:.::.
CCDS74 MPRGSWKP----QVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ
10 20 30 40
70 80 90 100 110 120
pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::..
CCDS74 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL
50 60 70 80 90 100
130 140 150 160 170
pF1KE2 LNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPW
: .: ::.:: :..:::::.::: ...: ::: ::: :.:: ..
CCDS74 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE2 PSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCC
:::..:: : .: : : : :::: . . ::.::::::: : .:: :: .:::
CCDS74 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE2 HRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCV
:..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: ::
CCDS74 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV
230 240 250 260 270 280
300 310 320 330 340
pF1KE2 KKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTV
::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...:
CCDS74 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE2 DSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWP
:.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..::
CCDS74 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE2 PNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCY
.. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::.
CCDS74 DSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCF
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE2 YHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSR
::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .: :
CCDS74 VHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLR
470 480 490 500 510 520
530 540 550 560 570 580
pF1KE2 GRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPN
:. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: :
CCDS74 GQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPF
530 540 550 560 570 580
590 600 610 620 630 640
pF1KE2 CVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQ
:: .::.:.. :. :.:. : . :.:: :::..: .. : :
CCDS74 CVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PA
590 600 610 620
650 660 670 680 690 700
pF1KE2 HAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPS
. : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: :::::::::::
CCDS74 EQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPS
630 640 650 660 670 680
710 720 730 740 750 760
pF1KE2 GTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKA
:. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.:::
CCDS74 GAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKA
690 700 710 720 730 740
770 780 790 800 810 820
pF1KE2 NVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLL
: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: ::
CCDS74 NKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLL
750 760 770 780 790 800
830 840 850 860 870 880
pF1KE2 NWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGK
:::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.:::::
CCDS74 NWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGK
810 820 830 840 850 860
890 900 910 920 930 940
pF1KE2 MPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQ
.:::::::: : :.:::::::::::::.:::::::.:::::::.:::::::::::::::
CCDS74 VPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQ
870 880 890 900 910 920
950 960 970 980 990 1000
pF1KE2 PPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDS
::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: ::
CCDS74 PPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDS
930 940 950 960 970 980
1010 1020 1030 1040 1050 1060
pF1KE2 KFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMS
:...::...:. :..::::::::: .: : : . . . : . : .
CCDS74 TFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPA-------PGAGGMVHHRHRSSSTRSG
990 1000 1010 1020 1030 1040
1070 1080 1090 1100 1110 1120
pF1KE2 GNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQ
:.... : .:. .:: : : :: ..:: ...:: . :. . . ..
CCDS74 GGDLTL--GLEPSEE------EAPRS--PLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTH
1050 1060 1070 1080
1130 1140 1150 1160 1170 1180
pF1KE2 EDSSTQRYSADPTVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDL
. : :::: :::: : .: : ::..:. .:. ::.: . : ..: :
CCDS74 DPSPLQRYSEDPTVPLP-----SETD--GYVAPLTCSPQPEYVNQPDVRPQPPSPREGPL
1090 1100 1110 1120 1130 1140
1190 1200 1210 1220 1230
pF1KE2 QALDNPEYHNASNGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----K
: : .:. ::. . : . . .:.... . ::: . . :. .
CCDS74 PAA-RPA--GATLERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFS
1150 1160 1170 1180 1190
1240 1250 1260 1270 1280 1290
pF1KE2 KAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGT
:::: ::... : :.. :. .. : :::::::
CCDS74 PAFDNLYYWDQDPPERGA--PPSTFKGTPT--------------AENPEYLGLDVPV
1200 1210 1220 1230 1240
1300
pF1KE2 VLPPPPYRHRNTVV
>>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa)
initn: 3420 init1: 1665 opt: 3798 Z-score: 1945.1 bits: 371.9 E(32554): 5.1e-102
Smith-Waterman score: 3798; 52.6% identity (76.3% similar) in 1045 aa overlap (10-1033:9-1035)
10 20 30 40 50
pF1KE2 MKPATGLWVWVSLLVAAGTVQP-SDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVV
: .::.: . : . : .::.::. :: .. : . ::. :..:.::
CCDS77 MELAALCRW-GLLLA--LLPPGAASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVV
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 MGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAI
.::::.: . : .::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.
CCDS77 QGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 FLNYRKDGNF---------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNP
. : .: ::.:: :..:::::.::: ...: ::: ::: :.:: ..
CCDS77 LDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKN
120 130 140 150 160 170
180 190 200 210 220
pF1KE2 WPSNLTLVSTNGSSGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDC
:::..:: : .: : : : :::: . . ::.::::::: : .:: :: .::
CCDS77 NQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 CHRECAGGCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFC
::..::.::.::: .::.::..:: :: : .:: .:: ::. : ...::.:: :
CCDS77 CHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASC
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 VKKCPHNFV-VDSSSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQT
: ::.:.. .: .::. .:: ..:: :.: . :. :. : ..: :.: : ...
CCDS77 VTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRA
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 VDSSNIDKFINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSW
: :.::..: .: :: :.: :: .. ::: . ..::.:.::.:..::::.: :..:
CCDS77 VTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAW
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE2 PPNMTDFSVFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLC
: .. :.:::.:: .: ::.:..: : :. ::. : ..::.:...: : :..::
CCDS77 PDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLC
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE2 YYHTINWTTLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFS
. ::. : :: . .: .. :: ..:..::..:..::. :::::: ::..: .:
CCDS77 FVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFL
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE2 RGRICIESCNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGP
::. :.: : . .: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: :
CCDS77 RGQECVEECRVLQGLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KE2 NCVEKCPDGLQGANSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLP
:: .::.:.. :. :.:. : . :.:: :::..: .. : :
CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------P
600 610 620 630 640
650 660 670 680 690 700
pF1KE2 QHAR-TPL--IAAGVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTP
. : .:: : ..:.: ....:..:..:.. ..:.. : .: ..::.: ::::::::::
CCDS77 AEQRASPLTSIISAVVG-ILLVVVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTP
650 660 670 680 690 700
710 720 730 740 750 760
pF1KE2 SGTAPNQAQLRILKETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPK
::. :::::.::::::::..:::::::::::::::::.:.::.::::::::.: :.:.::
CCDS77 SGAMPNQAQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPK
710 720 730 740 750 760
770 780 790 800 810 820
pF1KE2 ANVEFMDEALIMASMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLL
:: :..::: .::.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :
CCDS77 ANKEILDEAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDL
770 780 790 800 810 820
830 840 850 860 870 880
pF1KE2 LNWCVQIAKGMMYLEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGG
::::.:::::: :::. :::::::::::::::::::::::::::::::. :: ::.::::
CCDS77 LNWCMQIAKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGG
830 840 850 860 870 880
890 900 910 920 930 940
pF1KE2 KMPIKWMALECIHYRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLP
:.:::::::: : :.:::::::::::::.:::::::.:::::::.::::::::::::::
CCDS77 KVPIKWMALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLP
890 900 910 920 930 940
950 960 970 980 990 1000
pF1KE2 QPPICTIDVYMVMVKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPND
:::::::::::.::::::::.. ::.:.::..:::::::::::..:::..: . :: :
CCDS77 QPPICTIDVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLD
950 960 970 980 990 1000
1010 1020 1030 1040 1050
pF1KE2 SKFFQNLLDEEDLEDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPM
: :...::...:. :..::::::::: .: : :
CCDS77 STFYRSLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM
1010 1020 1030 1040 1050
1060 1070 1080 1090 1100 1110
pF1KE2 SGNQFVYRDGGFAAEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHV
>>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa)
initn: 3454 init1: 1665 opt: 3776 Z-score: 1933.3 bits: 369.9 E(32554): 2.3e-101
Smith-Waterman score: 3896; 47.4% identity (70.4% similar) in 1269 aa overlap (43-1285:10-1219)
20 30 40 50 60 70
pF1KE2 LLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVMGNLEITSIEHNR
: . ::. :..:.::.::::.: . :
CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNA
10 20 30
80 90 100 110 120
pF1KE2 DLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIFLNYRKDGNF---
.::::....:: ::::.: :: : .::. :::.:::.:.:: ::::.. : .:
CCDS45 SLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPV
40 50 60 70 80 90
130 140 150 160 170 180
pF1KE2 ------GLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVSTNGS
::.:: :..:::::.::: ...: ::: ::: :.:: .. :::..:: :
CCDS45 TGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRS
100 110 120 130 140 150
190 200 210 220 230 240
pF1KE2 SGCGRCHKSCTG-RCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSGPK
.: : : : :::: . . ::.::::::: : .:: :: .::::..::.::.:::
CCDS45 RACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCCHEQCAAGCTGPK
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE2 DTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFV-VDS
.::.::..:: :: : .:: .:: ::. : ...::.:: :: ::.:.. .:
CCDS45 HSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDV
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE2 SSCVRACPSSKMEVE-ENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
.::. .:: ..:: :.: . :. :. : ..: :.: : ...: :.::..: .:
CCDS45 GSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCK
280 290 300 310 320 330
370 380 390 400 410 420
pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
:: :.: :: .. ::: . ..::.:.::.:..::::.: :..:: .. :.:::.::
CCDS45 KIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNL
340 350 360 370 380 390
430 440 450 460 470 480
pF1KE2 VTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWTTLFST
.: ::.:..: : :. ::. : ..::.:...: : :..::. ::. : :: .
CCDS45 QVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRN
400 410 420 430 440 450
490 500 510 520 530 540
pF1KE2 INQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNLYD
.: .. :: ..:..::..:..::. :::::: ::..: .: ::. :.: : . .
CCDS45 PHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQ
460 470 480 490 500 510
550 560 570 580 590 600
pF1KE2 GEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQGA
: ::. :. :. : :.:. ..: .:: :: :.:. :.:.:: : :: .::.:..
CCDS45 GLPREYVNARHCLPCHPECQP-QNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPD
520 530 540 550 560 570
610 620 630 640 650
pF1KE2 NSF--IFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHAR-TPL--IAA
:. :.:. : . :.:: :::..: .. : : . : .:: : .
CCDS45 LSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGC-----------PAEQRASPLTSIIS
580 590 600 610 620
660 670 680 690 700 710
pF1KE2 GVIGGLFILVIVGLTFAVYVRRKSIK-KKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL
.:.: :.. :..:..:.. ..:.. : .: ..::.: ::::::::::::. :::::.:::
CCDS45 AVVGILLV-VVLGVVFGILIKRRQQKIRKYTMRRLLQETELVEPLTPSGAMPNQAQMRIL
630 640 650 660 670 680
720 730 740 750 760 770
pF1KE2 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA
:::::..:::::::::::::::::.:.::.::::::::.: :.:.:::: :..::: .::
CCDS45 KETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVMA
690 700 710 720 730 740
780 790 800 810 820 830
pF1KE2 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY
.. :.. ::::.::. :.::::::::.::::..:.:.. .::: :::::.:::::: :
CCDS45 GVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMSY
750 760 770 780 790 800
840 850 860 870 880 890
pF1KE2 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH
::. :::::::::::::::::::::::::::::::. :: ::.:::::.:::::::: :
CCDS45 LEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESIL
810 820 830 840 850 860
900 910 920 930 940 950
pF1KE2 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM
:.:::::::::::::.:::::::.:::::::.:::::::::::::::::::::::::.:
CCDS45 RRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMIM
870 880 890 900 910 920
960 970 980 990 1000 1010
pF1KE2 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL
:::::::.. ::.:.::..:::::::::::..:::..: . :: :: :...::...:.
CCDS45 VKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNED-LGPASPLDSTFYRSLLEDDDM
930 940 950 960 970 980
1020 1030 1040 1050 1060 1070
pF1KE2 EDMMDAEEYLVPQ-AFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFA
:..::::::::: .: : : . . . : . : :.::
CCDS45 GDLVDAEEYLVPQQGFFCPDPA-------PGAGGMVHHRHRSSST---------RSGGGD
990 1000 1010 1020
1080 1090 1100 1110 1120 1130
pF1KE2 AEQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADP
:. : . . : :: ..:: ...:: . :. . . ... : :::: ::
CCDS45 LTLGLE-PSEEEAPRSPLAP-SEGAGSDVFDGDLGMGAAKGLQSLPTHDPSPLQRYSEDP
1030 1040 1050 1060 1070 1080
1140 1150 1160 1170 1180 1190
pF1KE2 TVFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNAS
:: : .. .::..:. .:. ::.: . : ..: : : : .:.
CCDS45 TVPLPSET-------DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAA-RPA--GAT
1090 1100 1110 1120 1130
1200 1210 1220 1230 1240
pF1KE2 NGPPKAEDEYVNEPLY-LNTFANTLGKAEYLKNNILSMPEKA-----KKAFDNPDYWNHS
::. . : . . .:.... . ::: . . :. . :::: ::...
CCDS45 LERPKTLSPGKNGVVKDVFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQD
1140 1150 1160 1170 1180 1190
1250 1260 1270 1280 1290 1300
pF1KE2 LPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNT
: :.. :. .. : :::::::
CCDS45 PPERGA--PPSTFKGTPT--------------AENPEYLGLDVPV
1200 1210 1220
pF1KE2 VV
>>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa)
initn: 2971 init1: 1332 opt: 3601 Z-score: 1844.5 bits: 353.6 E(32554): 2e-96
Smith-Waterman score: 4169; 50.4% identity (72.7% similar) in 1283 aa overlap (1-1244:1-1264)
10 20 30 40 50 60
pF1KE2 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
:. .: : :. : . ..::.:: :: : :: .: :.::..: : :: :::::
CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
:::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. ..
CCDS31 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:.
CCDS31 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD--RDAEIVVKD
130 140 150 160 170
190 200 210 220 230 240
pF1KE2 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
:: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: ::::::::
CCDS31 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE2 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
:.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .::::::::
CCDS31 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE2 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.:::
CCDS31 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE2 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
:: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .:::::::
CCDS31 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL
360 370 380 390 400 410
430 440 450 460 470
pF1KE2 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF
.::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .:
CCDS31 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL
. ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::.
CCDS31 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ
.:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :.
CCDS31 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV
::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: :
CCDS31 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV
600 610 620 630 640
660 670 680 690 700 710
pF1KE2 IGGLFIL-VIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE
:.:: .. ...: :: .: : . :..:::.::.:: : .::: :: : :.. ::.::
CCDS31 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE2 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM
:::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:.
CCDS31 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL
710 720 730 740 750 760
780 790 800 810 820 830
pF1KE2 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE
:: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.:::
CCDS31 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE
770 780 790 800 810 820
840 850 860 870 880 890
pF1KE2 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR
:. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::.
CCDS31 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG
830 840 850 860 870 880
900 910 920 930 940 950
pF1KE2 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK
:.::::::::::::.:::::::..:: :. :.:::::::::: :: ::::::::::::
CCDS31 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK
890 900 910 920 930 940
960 970 980 990 1000 1010
pF1KE2 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE
::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .::
CCDS31 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE
950 960 970 980 990 1000
1020 1030 1040 1050 1060
pF1KE2 DMMDAEEYLVPQAFNIPPPIYTSRARIDS---NR---SEIGHSPPPAYTPMS-GNQFVYR
.: . : . :. : . :: :. :: .: ::. :: . .
CCDS31 PELDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGN--LGE
1010 1020 1030 1040 1050 1060
1070 1080 1090 1100 1110
pF1KE2 DGGFAAEQGVS--VPYRAPTSTIPEAPVAQ--------GATAEIFDD-SCCNGTLRKPVA
. .: .: : : . .:.. .:. :. ::. . : : . :. .
CCDS31 SCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSR-S
1070 1080 1090 1100 1110 1120
1120 1130 1140 1150 1160
pF1KE2 PHVQEDSS--TQRYSADPTVFAPERSPRG--ELDEEGYMTP---MRDKP--KQEYLNPVE
:. . ::. .::.: : .: :: : : : .::. : .. : .. :. :
CCDS31 PRPRGDSAYHSQRHSLLTPV-TPL-SPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVG
1130 1140 1150 1160 1170 1180
1170 1180 1190 1200 1210 1220
pF1KE2 ENPFVSRRKNGD---LQALDNPEYHNASNGP-PKAEDEYVNEPLYLNT-FANTLGKAEYL
. .. ... . . .. . :. . : :.. .: : . ... .. .::...
CCDS31 LSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSC
1190 1200 1210 1220 1230 1240
1230 1240 1250 1260 1270 1280
pF1KE2 K-NNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAEN
. . :: . .. .: :
CCDS31 PLHPVPIMPTAGTTPDEDYEYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQ
1250 1260 1270 1280 1290 1300
>>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa)
initn: 2953 init1: 1893 opt: 3166 Z-score: 1625.0 bits: 312.8 E(32554): 3.4e-84
Smith-Waterman score: 4332; 50.6% identity (73.8% similar) in 1292 aa overlap (1-1285:1-1198)
10 20 30 40 50
pF1KE2 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
:.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD
::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. ::
CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA
:..: : ....:::: . :: :::::: ::.:: . : : .: : . : ::
CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGC---PTNG----P---KIPSIA
600 610 620 630 640
660 670 680 690 700 710
pF1KE2 AGVIGGLFILVIVGLTFAVYVRRKSIKKKRALRRFL-ETELVEPLTPSGTAPNQAQLRIL
.:..:.:..:..:.: .....::. : .::.:::.: : :::::::::: ::::: ::::
CCDS55 TGMVGALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRIL
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE2 KETELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMA
::::.:..::::::::::::::.:.:::: :::::::: : :.:.:::: :..::: .::
CCDS55 KETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMA
710 720 730 740 750 760
780 790 800 810 820 830
pF1KE2 SMDHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMY
:.:.::. ::::.::. :.::.::::: ::::.::.::::::::: :::::::::::: :
CCDS55 SVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNY
770 780 790 800 810 820
840 850 860 870 880 890
pF1KE2 LEERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIH
::.::::::::::::::::.:.::::::::::.:: ..::::.:.:::.:::::::: :
CCDS55 LEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESIL
830 840 850 860 870 880
900 910 920 930 940 950
pF1KE2 YRKFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVM
.: .::::::::::::.:::::::.:::::::. :: ..:::::::::::::::::::.:
CCDS55 HRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIM
890 900 910 920 930 940
960 970 980 990 1000 1010
pF1KE2 VKCWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKLPSPNDSKFFQNLLDEEDL
::::::::::::::.:: :::.::::::::::::::.::.::::.::.:.. :.::::.
CCDS55 VKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDM
950 960 970 980 990 1000
1020 1030 1040 1050 1060 1070
pF1KE2 EDMMDAEEYLVPQAFNIPPPIYTSRARIDSNRSEIGHSPPPAYTPMSGNQFVYRDGGFAA
.:..::.:::.:: . : :::. . :. : ... : .: :
CCDS55 DDVVDADEYLIPQQGFFSSP-STSRTPLLSSLSATSNNSTVACIDRNGLQ----------
1010 1020 1030 1040 1050
1080 1090 1100 1110 1120 1130
pF1KE2 EQGVSVPYRAPTSTIPEAPVAQGATAEIFDDSCCNGTLRKPVAPHVQEDSSTQRYSADPT
:: :. .::: ::::.:::
CCDS55 -------------------------------SC-------PI----KEDSFLQRYSSDPT
1060 1070
1140 1150 1160 1170 1180 1190
pF1KE2 VFAPERSPRGELDEEGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASN
: : :.. . : ::.: : .: :..: :: :::
CCDS55 ---------GALTEDSIDDTFLPVP--EYINQS-----VPKRPAGSVQ---NPVYHNQPL
1080 1090 1100 1110
1200 1210 1220 1230 1240 1250
pF1KE2 GPPKAEDEYVNEPLYLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTL
.: ..: : : . ....:. ::: :.. .: ....::.: .: .. . .:
CCDS55 NPAPSRD-----PHYQDPHSTAVGNPEYL-NTV--QPTCVNSTFDSPAHWAQKGSHQISL
1120 1130 1140 1150 1160
1260 1270 1280 1290 1300
pF1KE2 QHPDYLQEYSTKYFYKQNGRIRPIVAENPEYLSEFSLKPGTVLPPPPYRHRNTVV
..::: :.. : : :: .. .::: :::
CCDS55 DNPDYQQDFFPKE-AKPNGIFKGSTAENAEYLRVAPQSSEFIGA
1170 1180 1190 1200 1210
>>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa)
initn: 1727 init1: 966 opt: 2194 Z-score: 1136.3 bits: 221.5 E(32554): 5.7e-57
Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627)
10 20 30 40 50
pF1KE2 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
:.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD
::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. ::
CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA
:..: : ....:::: . :: :::::: :
CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGS
600 610 620
>>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa)
initn: 1727 init1: 966 opt: 2194 Z-score: 1135.8 bits: 221.6 E(32554): 6.1e-57
Smith-Waterman score: 2194; 47.5% identity (76.0% similar) in 630 aa overlap (1-624:1-627)
10 20 30 40 50
pF1KE2 MKPA-TGLWVWVSLLVAAGTVQPS-DSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEV
:.:. :. . ..::.: .. . . ..:: :: :::..:. .:... .:.....::::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 VMGNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALA
:.:::::: ...: :::::....::.::::.::: . .:::::.::::. ::. ::::
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 IFLNYRKDGN-FGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTL
.. :: :.: ::.:: ..:: :::.:.: ..: :: ...:.:.::: . . ::...
CCDS55 VLSNY--DANKTGLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSM
130 140 150 160 170
180 190 200 210 220 230
pF1KE2 VSTNGSSGCGRCHKSC-TGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAG
: ..: .: :: .: ::: :..:: ::. .::.::.::: : ::::: .::.
CCDS55 DFQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAA
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 GCSGPKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHN
::.::...::..: .: : ..: :: ..:::::.:.. : ..::..:: ::::::.:
CCDS55 GCTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 FVV-DSSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDK
.:: : .:::::: ....:.::.:.. :: : : :.:.::: : . .. .....:: .
CCDS55 YVVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIGEFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE2 FINCTKINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFS
: :::.:.:.: .: ....:: .. .::..:....::.:::::: ::.:: : ::.
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE2 VFSNLVTIGGRVLYSGLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT
.: :: : ::. : : . . .:::: ..:::::: :.. :. :.:::: .::::
CCDS55 AFENLEIIRGRTKQHGQFSLAVVSLNITSLGLRSLKEISDGDVIISGNKNLCYANTINWK
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE2 TLFSTINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIES
::.: .:. : .:: ..: : :.::. ::: .::::: : .:.::: :::: :...
CCDS55 KLFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECVDK
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE2 CNLYDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPD
::: .:: ::: ..: :..: :.: . .. :: : ::::: .:.:. :::.::. ::
CCDS55 CNLLEGEPREFVENSECIQCHPECLPQAMNI-TCTGRGPDNCIQCAHYIDGPHCVKTCPA
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE2 GLQGAN-SFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPLIA
:..: : ....:::: . :: :::::: :
CCDS55 GVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSHQ
600 610 620 630 640 650
1308 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 18:04:16 2016 done: Sun Nov 6 18:04:17 2016
Total Scan time: 5.010 Total Display time: 0.640
Function used was FASTA [36.3.4 Apr, 2011]