FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3459, 1342 aa
1>>>pF1KE3459 1342 - 1342 aa - 1342 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.9728+/-0.00133; mu= 13.1162+/- 0.079
mean_var=368.9033+/-78.995, 0's: 0 Z-trim(111.3): 452 B-trim: 0 in 0/52
Lambda= 0.066776
statistics sampled from 11741 (12279) to 11741 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.713), E-opt: 0.2 (0.377), width: 16
Scan time: 5.960
The best scores are: opt bits E(32554)
CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 9408 922.6 0
CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 3601 363.1 2.8e-99
CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 3589 362.0 6.2e-99
CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3422 345.8 4.2e-94
CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 2998 304.9 7.7e-82
CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 2998 305.0 8.3e-82
CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 2998 305.0 8.4e-82
CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 2998 305.0 8.4e-82
CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 2084 216.5 1.9e-55
CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 2084 216.6 2e-55
CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1698 179.3 2.9e-44
CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 1233 134.2 7.1e-31
CCDS44918.1 ERBB3 gene_id:2065|Hs108|chr12 ( 183) 901 101.7 2e-21
CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 671 80.7 2.3e-14
CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 671 80.7 2.3e-14
CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 671 80.7 2.4e-14
CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 612 75.0 1.2e-12
CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 612 75.0 1.2e-12
CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 612 75.0 1.2e-12
CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 612 75.0 1.2e-12
CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 612 75.1 1.3e-12
CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 612 75.1 1.3e-12
CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 612 75.1 1.3e-12
CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 600 73.4 1.9e-12
CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 601 73.9 2.4e-12
CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 599 73.7 2.8e-12
CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 593 73.1 4.1e-12
CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 588 72.3 4.5e-12
CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 588 72.4 4.6e-12
CCDS82777.1 MST1R gene_id:4486|Hs108|chr3 (1294) 591 73.1 5.5e-12
CCDS58833.1 MST1R gene_id:4486|Hs108|chr3 (1351) 591 73.2 5.6e-12
CCDS2807.1 MST1R gene_id:4486|Hs108|chr3 (1400) 591 73.2 5.7e-12
CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 585 72.5 7.6e-12
CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 585 72.5 7.6e-12
CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 581 72.0 9.1e-12
CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 581 72.0 9.3e-12
CCDS3480.1 TXK gene_id:7294|Hs108|chr4 ( 527) 574 70.9 1.1e-11
CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 575 71.4 1.4e-11
CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 575 71.4 1.4e-11
CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 575 71.4 1.4e-11
CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 575 71.4 1.4e-11
CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 575 71.4 1.4e-11
CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 573 71.2 1.6e-11
CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 573 71.2 1.6e-11
CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 573 71.3 1.6e-11
CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 561 69.3 1.9e-11
CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 572 71.4 2e-11
CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 572 71.4 2e-11
CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 567 70.6 2.3e-11
CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 567 70.7 2.4e-11
>>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa)
initn: 9408 init1: 9408 opt: 9408 Z-score: 4919.1 bits: 922.6 E(32554): 0
Smith-Waterman score: 9408; 100.0% identity (100.0% similar) in 1342 aa overlap (1-1342:1-1342)
10 20 30 40 50 60
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDRDAEIVVKDNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDRDAEIVVKDNG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 RSCPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSGPQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RSCPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSGPQD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 TDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVDQTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVDQTS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 CVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQTVDSSNIDGFVNCTKILGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 CVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQTVDSSNIDGFVNCTKILGN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 LDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNLTTIGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNLTTIGG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 RSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLRGPTEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLRGPTEE
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 RLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNFLNGEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 RLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNFLNGEP
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 REFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVLGAKGPI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 REFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVLGAKGPI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 YKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVIAGLVVIFMMLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 YKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVIAGLVVIFMMLG
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 GTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETELRKLKVLGSGVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETELRKLKVLGSGVF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 GTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDHAHIVRLLGLCPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDHAHIVRLLGLCPG
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 SSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEHGMVHRNLAARNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 SSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEHGMVHRNLAARNV
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 LLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKYTHQSDVWSYGVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKYTHQSDVWSYGVT
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 VWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCWMIDENIRPTFKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 VWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCWMIDENIRPTFKE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 LANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPELDLDLDLEAEED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPELDLDLDLEAEED
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KE3 NLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQESAVSGSSERCPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQESAVSGSSERCPR
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KE3 PVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSRSPRPRGDSAYHSQRHSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSRSPRPRGDSAYHSQRHSLL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KE3 TPVTPLSPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 TPVTPLSPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYM
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KE3 NRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSCPLHPVPIMPTAGTTPDEDY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSCPLHPVPIMPTAGTTPDEDY
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KE3 EYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQAPHVHYARLKTLRSLEATD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 EYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQAPHVHYARLKTLRSLEATD
1270 1280 1290 1300 1310 1320
1330 1340
pF1KE3 SAFDNPDYWHSRLFPKANAQRT
::::::::::::::::::::::
CCDS31 SAFDNPDYWHSRLFPKANAQRT
1330 1340
>>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa)
initn: 2971 init1: 1332 opt: 3601 Z-score: 1895.8 bits: 363.1 E(32554): 2.8e-99
Smith-Waterman score: 4169; 50.4% identity (72.7% similar) in 1283 aa overlap (1-1264:1-1244)
10 20 30 40 50 60
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
:. .: : :. : . ..::.:: :: : :: .: :.::..: : :: :::::
CCDS23 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
:::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. ..
CCDS23 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
70 80 90 100 110 120
130 140 150 160 170
pF1KE3 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDR--DAEIVVKD
::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:.
CCDS23 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE3 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG
:: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: ::::::::
CCDS23 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE3 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD
:.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .::::::::
CCDS23 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE3 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT
..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.:::
CCDS23 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE3 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL
:: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .:::::::
CCDS23 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE3 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR
.::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .:
CCDS23 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF
430 440 450 460 470
480 490 500 510 520 530
pF1KE3 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF
. ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::.
CCDS23 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE3 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL
.:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :.
CCDS23 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ
540 550 560 570 580 590
600 610 620 630 640
pF1KE3 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV
::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: :
CCDS23 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE3 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE
:.:: :....: :: .: : . :..:::.::.:: : .::: :: : :.. ::.::
CCDS23 IGGLF-ILVIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE3 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL
:::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:.
CCDS23 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM
720 730 740 750 760 770
770 780 790 800 810 820
pF1KE3 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE
:: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.:::
CCDS23 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE
780 790 800 810 820 830
830 840 850 860 870 880
pF1KE3 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG
:. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::.
CCDS23 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR
840 850 860 870 880 890
890 900 910 920 930 940
pF1KE3 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK
:.::::::::::::.:::::::..:: :. :.:::::::::: :: ::::::::::::
CCDS23 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KE3 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE
::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .::
CCDS23 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE
960 970 980 990 1000 1010
1010 1020 1030 1040 1050 1060
pF1KE3 PELDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGN--LGE
.: . : . :. : . :: :. :: .: ::. :: . .
CCDS23 DMMDAEEYLVPQAFNIPPPIYTSRARIDS---NR---SEIGHSPPPAYTPMS-GNQFVYR
1020 1030 1040 1050 1060
1070 1080 1090 1100 1110 1120
pF1KE3 SCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSR-S
. .: .: : : . .:.. .:. :. ::. . : : . :. .
CCDS23 DGGFAAEQGVS--VPYRAPTSTIPEAPVAQ--------GATAEIFDD-SCCNGTLRKPVA
1070 1080 1090 1100 1110
1130 1140 1150 1160 1170 1180
pF1KE3 PRPRGDSAYHSQRHSLLTPV-TPL-SPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVG
:. . ::. .::.: : .: :: : : : .::. : .. : .. :. :
CCDS23 PHVQEDSS--TQRYSADPTVFAPERSPRG--ELDEEGYMTP---MRDKP--KQEYLNPVE
1120 1130 1140 1150 1160
1190 1200 1210 1220 1230 1240
pF1KE3 LSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSC
. .. .. . . . .. . :. . : :.. .: : . ... .. .::...
CCDS23 ENPFVSRRK---NGDLQALDNPEYHNASNGP-PKAEDEYVNEPLYLNT-FANTLGKAEYL
1170 1180 1190 1200 1210 1220
1250 1260 1270 1280 1290 1300
pF1KE3 PLHPVPIMPTAGTTPDEDYEYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQ
. . :: . .. .: :
CCDS23 K-NNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAEN
1230 1240 1250 1260 1270 1280
>>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa)
initn: 2971 init1: 1332 opt: 3589 Z-score: 1889.6 bits: 362.0 E(32554): 6.2e-99
Smith-Waterman score: 4157; 52.5% identity (73.9% similar) in 1197 aa overlap (1-1157:1-1188)
10 20 30 40 50 60
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
:. .: : :. : . ..::.:: :: : :: .: :.::..: : :: :::::
CCDS42 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
:::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. ..
CCDS42 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF
70 80 90 100 110 120
130 140 150 160 170
pF1KE3 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDR--DAEIVVKD
::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:.
CCDS42 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE3 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG
:: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: ::::::::
CCDS42 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE3 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD
:.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .::::::::
CCDS42 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE3 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT
..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.:::
CCDS42 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE3 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL
:: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .:::::::
CCDS42 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE3 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR
.::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .:
CCDS42 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF
430 440 450 460 470
480 490 500 510 520 530
pF1KE3 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF
. ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::.
CCDS42 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE3 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL
.:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :.
CCDS42 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ
540 550 560 570 580 590
600 610 620 630 640
pF1KE3 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV
::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: :
CCDS42 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE3 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE
:.:: :....: :: .: : . :..:::.::.:: : .::: :: : :.. ::.::
CCDS42 IGGLF-ILVIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE3 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL
:::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:.
CCDS42 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM
720 730 740 750 760 770
770 780 790 800 810 820
pF1KE3 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE
:: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.:::
CCDS42 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE
780 790 800 810 820 830
830 840 850 860 870 880
pF1KE3 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG
:. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::.
CCDS42 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR
840 850 860 870 880 890
890 900 910 920 930 940
pF1KE3 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK
:.::::::::::::.:::::::..:: :. :.:::::::::: :: ::::::::::::
CCDS42 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KE3 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE
::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .::
CCDS42 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE
960 970 980 990 1000 1010
1010 1020 1030 1040 1050
pF1KE3 PELDLDLDLEAEEDNLATTTLGSALSLPV---------GTLNRPRG-SQSLLSPSSGY--
.: . : . :. : . : . .: : .:.:
CCDS42 DMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPE
1020 1030 1040 1050 1060 1070
1060 1070 1080 1090 1100 1110
pF1KE3 MPMNQGNLGESCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSE----AELQE
:. :: .: ..: .:. . .::. : . . :.. : . : .::.:
CCDS42 APVAQGATAEIFDDSCCNGTLR---KPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDE
1080 1090 1100 1110 1120 1130
1120 1130 1140 1150 1160
pF1KE3 KVSMCRSRSRSRSPR--PRGDSAYHSQR-----HSLLTPV---TPLSPPGLEEEDVNGYV
. : :.. .. : .. . :.: ..: .: . .:: :.: ::
CCDS42 EGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPL
1140 1150 1160 1170 1180 1190
1170 1180 1190 1200 1210 1220
pF1KE3 MPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEEL
CCDS42 YLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYF
1200 1210 1220 1230 1240 1250
>>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa)
initn: 2900 init1: 1213 opt: 3422 Z-score: 1803.0 bits: 345.8 E(32554): 4.2e-94
Smith-Waterman score: 3422; 47.3% identity (75.0% similar) in 1014 aa overlap (9-1012:11-1014)
10 20 30 40 50
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV
.:.:: .: .:.. . . :: :: : :. : :... .: .... :::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF
:.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:.
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV
:. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . .
CCDS55 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD
130 140 150 160 170
180 190 200 210 220 230
pF1KE3 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG
... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.:
CCDS55 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF
:.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:.
CCDS55 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG
:: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....::
CCDS55 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS
: :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . ..
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE3 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW
.: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...::
CCDS55 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE3 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV
:.. : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: ::
CCDS55 KKLF-GTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECV
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE3 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP
.::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..::
CCDS55 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP
540 550 560 570 580 590
600 610 620 630 640
pF1KE3 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI
::.: .. ..:: :. . :. :: ::: :: :: :. : . : ..: ..
CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTN-----GPKIPSIATGMV
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE3 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANKVLARIFKETE
..:...... : :. : :.: ::..:: :.. : .::: :: : :..: ::.::::
CCDS55 GALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETE
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE3 LRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDH
..:.::::::.::::.::.::::::..:::: :: ... .. .. . . :. ...:.:.
CCDS55 FKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDN
720 730 740 750 760 770
770 780 790 800 810 820
pF1KE3 AHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEH
:. ::::.: :..::.:: .:.: :::.::.:. .: : :::: ::::::: :::..
CCDS55 PHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDR
780 790 800 810 820 830
830 840 850 860 870 880
pF1KE3 GMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKY
.:::.:::::::.:.:..:...:::.: :: ..:. .:.:::::::::: :
CCDS55 RLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIY
840 850 860 870 880 890
890 900 910 920 930 940
pF1KE3 THQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCW
::::::::::::::::::::..:: :. .:. ..::::::: :: ::::::::.:::::
CCDS55 THQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCW
900 910 920 930 940 950
950 960 970 980 990 1000
pF1KE3 MIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPE
::: . :: :.:: ::..::::: :::::. . . :.: .. ..: ...
CCDS55 MIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHL-PSPTDSNFYRALMDEEDMDDV
960 970 980 990 1000 1010
1010 1020 1030 1040 1050 1060
pF1KE3 LDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQE
.: :
CCDS55 VDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYS
1020 1030 1040 1050 1060 1070
>>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa)
initn: 2544 init1: 1645 opt: 2998 Z-score: 1582.8 bits: 304.9 E(32554): 7.7e-82
Smith-Waterman score: 3252; 47.7% identity (73.7% similar) in 1002 aa overlap (6-984:5-996)
10 20 30 40 50 60
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
:: :::..: . . : :: :: : . .. :.. . : .::. :.::.
CCDS77 MELAALCRWGLLLALLPPG--AASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ
10 20 30 40 50
70 80 90 100 110 120
pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
::::.. ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :.
CCDS77 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL
60 70 80 90 100 110
130 140 150 160 170
pF1KE3 -----LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDR
:: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: ..
CCDS77 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN
120 130 140 150 160 170
180 190 200 210 220
pF1KE3 DAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCC
. ... :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..::
CCDS77 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE3 HDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCV
:..::.::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. ::
CCDS77 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE3 ASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTV
..::.:.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..:
CCDS77 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE3 DSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWP
:.::. :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..::
CCDS77 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE3 PHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLC
. ..:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .::
CCDS77 DSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLC
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE3 YHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNY
. :.. : ...:.: . : :::. .::.:: .: ::. : :::::: ::..: ..
CCDS77 FVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE3 SRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGP
:: :: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: :
CCDS77 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KE3 HCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTH
::. :: :: . ::.:.:: .. :.:: :::..: . . : .. . .
CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SP
600 610 620 630 640 650
650 660 670 680 690
pF1KE3 LTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANK
:: .....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :.
CCDS77 LTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQ
660 670 680 690 700
700 710 720 730 740 750
pF1KE3 VLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTD
. ::.:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . :
CCDS77 AQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILD
710 720 730 740 750 760
760 770 780 790 800 810
pF1KE3 HMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQI
. ..... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .::
CCDS77 EAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQI
770 780 790 800 810 820
820 830 840 850 860 870
pF1KE3 AKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWM
:::: :::. .:::.:::::::.:::..:...:::.: :: :. . . .:.:::::
CCDS77 AKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWM
830 840 850 860 870 880
880 890 900 910 920 930
pF1KE3 ALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTI
::::: ..:::::::::::::::::::::.:: :. :.:::::::::: :: ::::
CCDS77 ALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTI
890 900 910 920 930 940
940 950 960 970 980 990
pF1KE3 DVYMVMVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTN
::::.:::::::: . :: :.::..::.:::::: :..::. :. ::
CCDS77 DVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFYRSLL
950 960 970 980 990 1000
1000 1010 1020 1030 1040 1050
pF1KE3 KKLEEVELEPELDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPM
CCDS77 EDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM
1010 1020 1030 1040 1050
>>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa)
initn: 2521 init1: 1647 opt: 2998 Z-score: 1582.2 bits: 305.0 E(32554): 8.3e-82
Smith-Waterman score: 3229; 43.7% identity (69.8% similar) in 1157 aa overlap (36-1148:3-1145)
10 20 30 40 50 60
pF1KE3 ALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVMGNLEI
: . .. :.. . : .::. :.::.::::.
CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLEL
10 20 30
70 80 90 100 110 120
pF1KE3 VLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM-----
. ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :.
CCDS45 TYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDP
40 50 60 70 80 90
130 140 150 160 170
pF1KE3 LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDRDAEIV
:: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: .. . ..
CCDS45 LNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALT
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE3 VKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECA
. :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..:::..::
CCDS45 LIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCCHEQCA
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE3 GGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPH
.::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. ::..::.
CCDS45 AGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPY
220 230 240 250 260 270
300 310 320 330 340
pF1KE3 NFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTVDSSNI
:.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..: :.::
CCDS45 NYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANI
280 290 300 310 320 330
350 360 370 380 390 400
pF1KE3 DGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHN
. :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..:: . .
CCDS45 QEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPD
340 350 360 370 380 390
410 420 430 440 450 460
pF1KE3 FSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSL
.:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .::. :..
CCDS45 LSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV
400 410 420 430 440 450
470 480 490 500 510 520
pF1KE3 NWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGV
: ...:.: . : :::. .::.:: .: ::. : :::::: ::..: .. ::
CCDS45 PWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQE
460 470 480 490 500
530 540 550 560 570 580
pF1KE3 CVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSS
:: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: : ::.
CCDS45 CVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVAR
510 520 530 540 550 560
590 600 610 620 630 640
pF1KE3 CPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMAL
:: :: . ::.:.:: .. :.:: :::..: . . : .. . . :: .
CCDS45 CPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SPLTSII
570 580 590 600 610 620
650 660 670 680 690 700
pF1KE3 TVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANKVLARI
....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :.. ::
CCDS45 SAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQAQMRI
630 640 650 660 670 680
710 720 730 740 750 760
pF1KE3 FKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAI
.:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . :. ..
CCDS45 LKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVM
690 700 710 720 730 740
770 780 790 800 810 820
pF1KE3 GSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMY
... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .::::::
CCDS45 AGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMS
750 760 770 780 790 800
830 840 850 860 870 880
pF1KE3 YLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESI
:::. .:::.:::::::.:::..:...:::.: :: :. . . .:.::::::::::
CCDS45 YLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESI
810 820 830 840 850 860
890 900 910 920 930 940
pF1KE3 HFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMV
..:::::::::::::::::::::.:: :. :.:::::::::: :: ::::::::.
CCDS45 LRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMI
870 880 890 900 910 920
950 960 970 980 990 1000
pF1KE3 MVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTNKKLEE
:::::::: . :: :.::..::.:::::: :..::. :. ::. .: . . ::.
CCDS45 MVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPA---SPLDSTFYRSLLED
930 940 950 960 970 980
1010 1020 1030 1040
pF1KE3 VELEPELDLDLDLEAEED-----------------NLATTTLGSALSLPVGTL-NRPRGS
.. .: . : .. . ...: ... .: .: .. ..
CCDS45 DDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAP
990 1000 1010 1020 1030 1040
1050 1060 1070 1080 1090 1100
pF1KE3 QSLLSPSSGY-MPMNQGNLGESCQESAVSGSSERCPRPVSLHPM-PRGCLASESSEGHVT
.: :.:: : . .:.:: . .. : .. : :.. . : : ::. .:.:.
CCDS45 RSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHD-PSPLQRYSEDPTVPLPSET-DGYVA
1050 1060 1070 1080 1090
1110 1120 1130 1140 1150 1160
pF1KE3 GSEAELQ-EKVSMCRSRSRSRSPRPRGDSAYHSQRHSLLTPVTPLSPPGLEEEDVNGYVM
: : :.. : . ::: : . .: : : :::
CCDS45 PLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKT-LSPGKNGVVKDVFAFG
1100 1110 1120 1130 1140 1150
1170 1180 1190 1200 1210 1220
pF1KE3 PDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEELG
CCDS45 GAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEY
1160 1170 1180 1190 1200 1210
>>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa)
initn: 2543 init1: 1647 opt: 2998 Z-score: 1582.1 bits: 305.0 E(32554): 8.4e-82
Smith-Waterman score: 3252; 43.6% identity (69.4% similar) in 1177 aa overlap (16-1148:1-1160)
10 20 30 40 50 60
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
. ::: . :: :: : . .. :.. . : .::. :.::.
CCDS74 MPRGSW---KPQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ
10 20 30 40
70 80 90 100 110 120
pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
::::.. ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :.
CCDS74 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL
50 60 70 80 90 100
130 140 150 160 170
pF1KE3 -----LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDR
:: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: ..
CCDS74 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN
110 120 130 140 150 160
180 190 200 210 220
pF1KE3 DAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCC
. ... :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..::
CCDS74 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE3 HDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCV
:..::.::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. ::
CCDS74 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE3 ASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTV
..::.:.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..:
CCDS74 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE3 DSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWP
:.::. :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..::
CCDS74 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE3 PHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLC
. ..:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .::
CCDS74 DSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLC
410 420 430 440 450 460
470 480 490 500 510 520
pF1KE3 YHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNY
. :.. : ...:.: . : :::. .::.:: .: ::. : :::::: ::..: ..
CCDS74 FVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF
470 480 490 500 510
530 540 550 560 570 580
pF1KE3 SRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGP
:: :: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: :
CCDS74 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP
520 530 540 550 560 570
590 600 610 620 630 640
pF1KE3 HCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTH
::. :: :: . ::.:.:: .. :.:: :::..: . . : .. . .
CCDS74 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SP
580 590 600 610 620 630
650 660 670 680 690
pF1KE3 LTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANK
:: .....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :.
CCDS74 LTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQ
640 650 660 670 680 690
700 710 720 730 740 750
pF1KE3 VLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTD
. ::.:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . :
CCDS74 AQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILD
700 710 720 730 740 750
760 770 780 790 800 810
pF1KE3 HMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQI
. ..... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .::
CCDS74 EAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQI
760 770 780 790 800 810
820 830 840 850 860 870
pF1KE3 AKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWM
:::: :::. .:::.:::::::.:::..:...:::.: :: :. . . .:.:::::
CCDS74 AKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWM
820 830 840 850 860 870
880 890 900 910 920 930
pF1KE3 ALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTI
::::: ..:::::::::::::::::::::.:: :. :.:::::::::: :: ::::
CCDS74 ALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTI
880 890 900 910 920 930
940 950 960 970 980 990
pF1KE3 DVYMVMVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTN
::::.:::::::: . :: :.::..::.:::::: :..::. :. ::. .: .
CCDS74 DVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPA---SPLDSTFYR
940 950 960 970 980 990
1000 1010 1020 1030
pF1KE3 KKLEEVELEPELDLDLDLEAEED-----------------NLATTTLGSALSLPVGTL-N
. ::. .. .: . : .. . ...: ... .: .: .
CCDS74 SLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPS
1000 1010 1020 1030 1040 1050
1040 1050 1060 1070 1080 1090
pF1KE3 RPRGSQSLLSPSSGY-MPMNQGNLGESCQESAVSGSSERCPRPVSLHPM-PRGCLASESS
. .. .: :.:: : . .:.:: . .. : .. : :.. . : : ::.
CCDS74 EEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHD-PSPLQRYSEDPTVPLPSET-
1060 1070 1080 1090 1100
1100 1110 1120 1130 1140 1150
pF1KE3 EGHVTGSEAELQ-EKVSMCRSRSRSRSPRPRGDSAYHSQRHSLLTPVTPLSPPGLEEEDV
.:.:. : : :.. : . ::: : . .: : : :::
CCDS74 DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKT-LSPGKNGVVKD
1110 1120 1130 1140 1150 1160
1160 1170 1180 1190 1200 1210
pF1KE3 NGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSS
CCDS74 VFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTA
1170 1180 1190 1200 1210 1220
>>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa)
initn: 2546 init1: 1647 opt: 2998 Z-score: 1582.1 bits: 305.0 E(32554): 8.4e-82
Smith-Waterman score: 3259; 43.6% identity (69.3% similar) in 1187 aa overlap (6-1148:5-1175)
10 20 30 40 50 60
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM
:: :::..: . . : :: :: : . .. :.. . : .::. :.::.
CCDS32 MELAALCRWGLLLALLPPGAA--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ
10 20 30 40 50
70 80 90 100 110 120
pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM
::::.. ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :.
CCDS32 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL
60 70 80 90 100 110
130 140 150 160 170
pF1KE3 -----LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDR
:: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: ..
CCDS32 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN
120 130 140 150 160 170
180 190 200 210 220
pF1KE3 DAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCC
. ... :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..::
CCDS32 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE3 HDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCV
:..::.::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. ::
CCDS32 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE3 ASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTV
..::.:.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..:
CCDS32 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE3 DSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWP
:.::. :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..::
CCDS32 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE3 PHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLC
. ..:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .::
CCDS32 DSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLC
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE3 YHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNY
. :.. : ...:.: . : :::. .::.:: .: ::. : :::::: ::..: ..
CCDS32 FVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE3 SRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGP
:: :: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: :
CCDS32 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP
540 550 560 570 580 590
590 600 610 620 630 640
pF1KE3 HCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTH
::. :: :: . ::.:.:: .. :.:: :::..: . . : .. . .
CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SP
600 610 620 630 640 650
650 660 670 680 690
pF1KE3 LTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANK
:: .....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :.
CCDS32 LTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQ
660 670 680 690 700
700 710 720 730 740 750
pF1KE3 VLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTD
. ::.:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . :
CCDS32 AQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILD
710 720 730 740 750 760
760 770 780 790 800 810
pF1KE3 HMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQI
. ..... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .::
CCDS32 EAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQI
770 780 790 800 810 820
820 830 840 850 860 870
pF1KE3 AKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWM
:::: :::. .:::.:::::::.:::..:...:::.: :: :. . . .:.:::::
CCDS32 AKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWM
830 840 850 860 870 880
880 890 900 910 920 930
pF1KE3 ALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTI
::::: ..:::::::::::::::::::::.:: :. :.:::::::::: :: ::::
CCDS32 ALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTI
890 900 910 920 930 940
940 950 960 970 980 990
pF1KE3 DVYMVMVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTN
::::.:::::::: . :: :.::..::.:::::: :..::. :. ::. .: .
CCDS32 DVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPA---SPLDSTFYR
950 960 970 980 990 1000
1000 1010 1020 1030
pF1KE3 KKLEEVELEPELDLDLDLEAEED-----------------NLATTTLGSALSLPVGTL-N
. ::. .. .: . : .. . ...: ... .: .: .
CCDS32 SLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPS
1010 1020 1030 1040 1050 1060
1040 1050 1060 1070 1080 1090
pF1KE3 RPRGSQSLLSPSSGY-MPMNQGNLGESCQESAVSGSSERCPRPVSLHPM-PRGCLASESS
. .. .: :.:: : . .:.:: . .. : .. : :.. . : : ::.
CCDS32 EEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHD-PSPLQRYSEDPTVPLPSET-
1070 1080 1090 1100 1110 1120
1100 1110 1120 1130 1140 1150
pF1KE3 EGHVTGSEAELQ-EKVSMCRSRSRSRSPRPRGDSAYHSQRHSLLTPVTPLSPPGLEEEDV
.:.:. : : :.. : . ::: : . .: : : :::
CCDS32 DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKT-LSPGKNGVVKD
1130 1140 1150 1160 1170 1180
1160 1170 1180 1190 1200 1210
pF1KE3 NGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSS
CCDS32 VFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTA
1190 1200 1210 1220 1230 1240
>>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa)
initn: 1675 init1: 538 opt: 2084 Z-score: 1109.1 bits: 216.5 E(32554): 1.9e-55
Smith-Waterman score: 2084; 45.4% identity (74.2% similar) in 621 aa overlap (9-620:11-627)
10 20 30 40 50
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV
.:.:: .: .:.. . . :: :: : :. : :... .: .... :::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF
:.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:.
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV
:. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . .
CCDS55 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD
130 140 150 160 170
180 190 200 210 220 230
pF1KE3 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG
... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.:
CCDS55 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF
:.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:.
CCDS55 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG
:: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....::
CCDS55 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS
: :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . ..
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE3 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW
.: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...::
CCDS55 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE3 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV
: : : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: ::
CCDS55 KK-LFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECV
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE3 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP
.::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..::
CCDS55 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP
540 550 560 570 580 590
600 610 620 630 640
pF1KE3 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI
::.: .. ..:: :. . :. :: ::: :
CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGS
600 610 620
650 660 670 680 690 700
pF1KE3 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETEL
>>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa)
initn: 1675 init1: 538 opt: 2084 Z-score: 1108.6 bits: 216.6 E(32554): 2e-55
Smith-Waterman score: 2084; 45.4% identity (74.2% similar) in 621 aa overlap (9-620:11-627)
10 20 30 40 50
pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV
.:.:: .: .:.. . . :: :: : :. : :... .: .... :::
CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF
:.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:.
CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV
:. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . .
CCDS55 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD
130 140 150 160 170
180 190 200 210 220 230
pF1KE3 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG
... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.:
CCDS55 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF
:.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:.
CCDS55 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG
:: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....::
CCDS55 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS
: :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . ..
CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE3 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW
.: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...::
CCDS55 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE3 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV
: : : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: ::
CCDS55 KK-LFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECV
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE3 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP
.::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..::
CCDS55 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP
540 550 560 570 580 590
600 610 620 630 640
pF1KE3 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI
::.: .. ..:: :. . :. :: ::: :
CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSH
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE3 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETEL
CCDS55 QSGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH
660 670 680 690 700
1342 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 09:20:10 2016 done: Sun Nov 6 09:20:11 2016
Total Scan time: 5.960 Total Display time: 0.610
Function used was FASTA [36.3.4 Apr, 2011]