FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3459, 1342 aa 1>>>pF1KE3459 1342 - 1342 aa - 1342 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.9728+/-0.00133; mu= 13.1162+/- 0.079 mean_var=368.9033+/-78.995, 0's: 0 Z-trim(111.3): 452 B-trim: 0 in 0/52 Lambda= 0.066776 statistics sampled from 11741 (12279) to 11741 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.713), E-opt: 0.2 (0.377), width: 16 Scan time: 5.960 The best scores are: opt bits E(32554) CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342) 9408 922.6 0 CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308) 3601 363.1 2.8e-99 CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292) 3589 362.0 6.2e-99 CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210) 3422 345.8 4.2e-94 CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055) 2998 304.9 7.7e-82 CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225) 2998 305.0 8.3e-82 CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240) 2998 305.0 8.4e-82 CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255) 2998 305.0 8.4e-82 CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 ( 628) 2084 216.5 1.9e-55 CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 ( 705) 2084 216.6 2e-55 CCDS77017.1 ERBB2 gene_id:2064|Hs108|chr17 ( 603) 1698 179.3 2.9e-44 CCDS47587.1 EGFR gene_id:1956|Hs108|chr7 ( 405) 1233 134.2 7.1e-31 CCDS44918.1 ERBB3 gene_id:2065|Hs108|chr12 ( 183) 901 101.7 2e-21 CCDS33928.1 TNK2 gene_id:10188|Hs108|chr3 (1038) 671 80.7 2.3e-14 CCDS77875.1 TNK2 gene_id:10188|Hs108|chr3 (1040) 671 80.7 2.3e-14 CCDS33927.1 TNK2 gene_id:10188|Hs108|chr3 (1086) 671 80.7 2.4e-14 CCDS53435.1 ABL2 gene_id:27|Hs108|chr1 (1043) 612 75.0 1.2e-12 CCDS53437.1 ABL2 gene_id:27|Hs108|chr1 (1058) 612 75.0 1.2e-12 CCDS44282.1 ABL2 gene_id:27|Hs108|chr1 (1064) 612 75.0 1.2e-12 CCDS53438.1 ABL2 gene_id:27|Hs108|chr1 (1079) 612 75.0 1.2e-12 CCDS53436.1 ABL2 gene_id:27|Hs108|chr1 (1161) 612 75.1 1.3e-12 CCDS41441.2 ABL2 gene_id:27|Hs108|chr1 (1167) 612 75.1 1.3e-12 CCDS30947.1 ABL2 gene_id:27|Hs108|chr1 (1182) 612 75.1 1.3e-12 CCDS44283.1 ABL2 gene_id:27|Hs108|chr1 ( 542) 600 73.4 1.9e-12 CCDS2922.1 EPHA3 gene_id:2042|Hs108|chr3 ( 983) 601 73.9 2.4e-12 CCDS5706.1 EPHB4 gene_id:2050|Hs108|chr7 ( 987) 599 73.7 2.8e-12 CCDS46921.1 EPHB1 gene_id:2047|Hs108|chr3 ( 984) 593 73.1 4.1e-12 CCDS47992.1 SYK gene_id:6850|Hs108|chr9 ( 612) 588 72.3 4.5e-12 CCDS6688.1 SYK gene_id:6850|Hs108|chr9 ( 635) 588 72.4 4.6e-12 CCDS82777.1 MST1R gene_id:4486|Hs108|chr3 (1294) 591 73.1 5.5e-12 CCDS58833.1 MST1R gene_id:4486|Hs108|chr3 (1351) 591 73.2 5.6e-12 CCDS2807.1 MST1R gene_id:4486|Hs108|chr3 (1400) 591 73.2 5.7e-12 CCDS35166.1 ABL1 gene_id:25|Hs108|chr9 (1130) 585 72.5 7.6e-12 CCDS35165.1 ABL1 gene_id:25|Hs108|chr9 (1149) 585 72.5 7.6e-12 CCDS6058.1 PTK2B gene_id:2185|Hs108|chr8 ( 967) 581 72.0 9.1e-12 CCDS6057.1 PTK2B gene_id:2185|Hs108|chr8 (1009) 581 72.0 9.3e-12 CCDS3480.1 TXK gene_id:7294|Hs108|chr4 ( 527) 574 70.9 1.1e-11 CCDS75132.1 EPHA5 gene_id:2044|Hs108|chr4 (1004) 575 71.4 1.4e-11 CCDS3514.1 EPHA5 gene_id:2044|Hs108|chr4 (1015) 575 71.4 1.4e-11 CCDS75131.1 EPHA5 gene_id:2044|Hs108|chr4 (1016) 575 71.4 1.4e-11 CCDS3513.1 EPHA5 gene_id:2044|Hs108|chr4 (1037) 575 71.4 1.4e-11 CCDS75133.1 EPHA5 gene_id:2044|Hs108|chr4 (1038) 575 71.4 1.4e-11 CCDS229.2 EPHB2 gene_id:2048|Hs108|chr1 ( 986) 573 71.2 1.6e-11 CCDS230.1 EPHB2 gene_id:2048|Hs108|chr1 ( 987) 573 71.2 1.6e-11 CCDS81279.1 EPHB2 gene_id:2048|Hs108|chr1 (1055) 573 71.3 1.6e-11 CCDS33255.1 ZAP70 gene_id:7535|Hs108|chr2 ( 312) 561 69.3 1.9e-11 CCDS43636.1 MET gene_id:4233|Hs108|chr7 (1390) 572 71.4 2e-11 CCDS47689.1 MET gene_id:4233|Hs108|chr7 (1408) 572 71.4 2e-11 CCDS169.1 EPHA2 gene_id:1969|Hs108|chr1 ( 976) 567 70.6 2.3e-11 CCDS6381.1 PTK2 gene_id:5747|Hs108|chr8 (1052) 567 70.7 2.4e-11 >>CCDS31833.1 ERBB3 gene_id:2065|Hs108|chr12 (1342 aa) initn: 9408 init1: 9408 opt: 9408 Z-score: 4919.1 bits: 922.6 E(32554): 0 Smith-Waterman score: 9408; 100.0% identity (100.0% similar) in 1342 aa overlap (1-1342:1-1342) 10 20 30 40 50 60 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDRDAEIVVKDNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDRDAEIVVKDNG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 RSCPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSGPQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RSCPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSGPQD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 TDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVDQTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVDQTS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 CVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQTVDSSNIDGFVNCTKILGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 CVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQTVDSSNIDGFVNCTKILGN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 LDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNLTTIGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNLTTIGG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 RSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLRGPTEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLRGPTEE 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 RLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNFLNGEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 RLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNFLNGEP 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 REFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVLGAKGPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 REFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVLGAKGPI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 YKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVIAGLVVIFMMLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 YKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVIAGLVVIFMMLG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 GTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETELRKLKVLGSGVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETELRKLKVLGSGVF 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 GTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDHAHIVRLLGLCPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 GTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDHAHIVRLLGLCPG 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 SSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEHGMVHRNLAARNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 SSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEHGMVHRNLAARNV 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 LLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKYTHQSDVWSYGVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKYTHQSDVWSYGVT 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE3 VWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCWMIDENIRPTFKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 VWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCWMIDENIRPTFKE 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE3 LANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPELDLDLDLEAEED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 LANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPELDLDLDLEAEED 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE3 NLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQESAVSGSSERCPR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQESAVSGSSERCPR 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE3 PVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSRSPRPRGDSAYHSQRHSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 PVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSRSPRPRGDSAYHSQRHSLL 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE3 TPVTPLSPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 TPVTPLSPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYM 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 1250 1260 pF1KE3 NRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSCPLHPVPIMPTAGTTPDEDY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 NRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSCPLHPVPIMPTAGTTPDEDY 1210 1220 1230 1240 1250 1260 1270 1280 1290 1300 1310 1320 pF1KE3 EYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQAPHVHYARLKTLRSLEATD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS31 EYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQAPHVHYARLKTLRSLEATD 1270 1280 1290 1300 1310 1320 1330 1340 pF1KE3 SAFDNPDYWHSRLFPKANAQRT :::::::::::::::::::::: CCDS31 SAFDNPDYWHSRLFPKANAQRT 1330 1340 >>CCDS2394.1 ERBB4 gene_id:2066|Hs108|chr2 (1308 aa) initn: 2971 init1: 1332 opt: 3601 Z-score: 1895.8 bits: 363.1 E(32554): 2.8e-99 Smith-Waterman score: 4169; 50.4% identity (72.7% similar) in 1283 aa overlap (1-1264:1-1244) 10 20 30 40 50 60 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM :. .: : :. : . ..::.:: :: : :: .: :.::..: : :: ::::: CCDS23 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM :::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. .. CCDS23 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDR--DAEIVVKD ::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:. CCDS23 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG :: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: :::::::: CCDS23 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE3 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD :.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .:::::::: CCDS23 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE3 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT ..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.::: CCDS23 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE3 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL :: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .::::::: CCDS23 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE3 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR .::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .: CCDS23 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF 430 440 450 460 470 480 490 500 510 520 530 pF1KE3 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF . ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::. CCDS23 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE3 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL .:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :. CCDS23 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ 540 550 560 570 580 590 600 610 620 630 640 pF1KE3 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV ::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: : CCDS23 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE3 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE :.:: :....: :: .: : . :..:::.::.:: : .::: :: : :.. ::.:: CCDS23 IGGLF-ILVIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE 660 670 680 690 700 710 710 720 730 740 750 760 pF1KE3 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL :::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:. CCDS23 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM 720 730 740 750 760 770 770 780 790 800 810 820 pF1KE3 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE :: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.::: CCDS23 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE 780 790 800 810 820 830 830 840 850 860 870 880 pF1KE3 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG :. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::. CCDS23 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR 840 850 860 870 880 890 890 900 910 920 930 940 pF1KE3 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK :.::::::::::::.:::::::..:: :. :.:::::::::: :: :::::::::::: CCDS23 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KE3 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE ::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .:: CCDS23 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 1060 pF1KE3 PELDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGN--LGE .: . : . :. : . :: :. :: .: ::. :: . . CCDS23 DMMDAEEYLVPQAFNIPPPIYTSRARIDS---NR---SEIGHSPPPAYTPMS-GNQFVYR 1020 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 pF1KE3 SCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSEAELQEKVSMCRSRSRSR-S . .: .: : : . .:.. .:. :. ::. . : : . :. . CCDS23 DGGFAAEQGVS--VPYRAPTSTIPEAPVAQ--------GATAEIFDD-SCCNGTLRKPVA 1070 1080 1090 1100 1110 1130 1140 1150 1160 1170 1180 pF1KE3 PRPRGDSAYHSQRHSLLTPV-TPL-SPPGLEEEDVNGYVMPDTHLKGTPSSREGTLSSVG :. . ::. .::.: : .: :: : : : .::. : .. : .. :. : CCDS23 PHVQEDSS--TQRYSADPTVFAPERSPRG--ELDEEGYMTP---MRDKP--KQEYLNPVE 1120 1130 1140 1150 1160 1190 1200 1210 1220 1230 1240 pF1KE3 LSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEELGYEYMDVGSDLSASLGSTQSC . .. .. . . . .. . :. . : :.. .: : . ... .. .::... CCDS23 ENPFVSRRK---NGDLQALDNPEYHNASNGP-PKAEDEYVNEPLYLNT-FANTLGKAEYL 1170 1180 1190 1200 1210 1220 1250 1260 1270 1280 1290 1300 pF1KE3 PLHPVPIMPTAGTTPDEDYEYMNRQRDGGGPGGDYAAMGACPASEQGYEEMRAFQGPGHQ . . :: . .. .: : CCDS23 K-NNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYFYKQNGRIRPIVAEN 1230 1240 1250 1260 1270 1280 >>CCDS42811.1 ERBB4 gene_id:2066|Hs108|chr2 (1292 aa) initn: 2971 init1: 1332 opt: 3589 Z-score: 1889.6 bits: 362.0 E(32554): 6.2e-99 Smith-Waterman score: 4157; 52.5% identity (73.9% similar) in 1197 aa overlap (1-1157:1-1188) 10 20 30 40 50 60 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM :. .: : :. : . ..::.:: :: : :: .: :.::..: : :: ::::: CCDS42 MKPATGLWVWVSLLVAAGTVQPSDSQSVCAGTENKLSSLSDLEQQYRALRKYYENCEVVM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM :::::. :: :::::. .::::::::::.:.: ::: :::..:::..:. ..:. .. CCDS42 GNLEITSIEHNRDLSFLRSVREVTGYVLVALNQFRYLPLENLRIIRGTKLYEDRYALAIF 70 80 90 100 110 120 130 140 150 160 170 pF1KE3 LNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRDR--DAEIVVKD ::: ... .:..: : .:::::.::::...: ::. ::: :.::::. . .:. CCDS42 LNYRKDGNFGLQELGLKNLTEILNGGVYVDQNKFLCYADTIHWQDIVRNPWPSNLTLVST 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 NGRS-CPPCHEVCKGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGGCSG :: : : ::. : :::::: . :::::.:.:: ::.:.:.:: ..::: :::::::: CCDS42 NGSSGCGRCHKSCTGRCWGPTENHCQTLTRTVCAEQCDGRCYGPYVSDCCHRECAGGCSG 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE3 PQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNFVVD :.::::::: .:::::::: .::: .::: ::::: : ..:: ::. :: .:::::::: CCDS42 PKDTDCFACMNFNDSGACVTQCPQTFVYNPTTFQLEHNFNAKYTYGAFCVKKCPHNFVVD 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE3 QTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRF--QTVDSSNIDGFVNCT ..::::::: .::::..::.:::.:: .:::::.: :.:: . ::::::::: :.::: CCDS42 SSSCVRACPSSKMEVEENGIKMCKPCTDICPKACDGIGTGSLMSAQTVDSSNIDKFINCT 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE3 KILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFSVFSNL :: ::: ::.::..:::.. : :.::::::::::::::::.::::::::.: .::::::: CCDS42 KINGNLIFLVTGIHGDPYNAIEAIDPEKLNVFRTVREITGFLNIQSWPPNMTDFSVFSNL 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE3 TTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNWTKVLR .::::: ::. :.::::.:. ..::: :.:::::::: :::. : .:::.:..::: .: CCDS42 VTIGGRVLYS-GLSLLILKQQGITSLQFQSLKEISAGNIYITDNSNLCYYHTINWT-TLF 430 440 450 460 470 480 490 500 510 520 530 pF1KE3 GPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCVTHCNF . ..:. :. :: ..:.::: ::. :::: ::::::: :::::: .::: .:. ::. CCDS42 STINQRIVIRDNRKAENCTAEGMVCNHLCSSDGCWGPGPDQCLSCRRFSRGRICIESCNL 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE3 LNGEPREFAHEAECFSCHPECQPME-GTATCNGSGSDTCAQCAHFRDGPHCVSSCPHGVL .:: ::: . . : : :.:. :: : ::.: : :.:..:.::.:::.:: .:: :. CCDS42 YDGEFREFENGSICVECDPQCEKMEDGLLTCHGPGPDNCTKCSHFKDGPNCVEKCPDGLQ 540 550 560 570 580 590 600 610 620 630 640 pF1KE3 GAKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCL-----GQ-TLVLIGKTHLTMALTV ::.. :.:: : . ::.::: ::::::.:: .::. :. :: ..: : .: : CCDS42 GANSFIFKYADPDRECHPCHPNCTQGCNGPTSHDCIYYPWTGHSTLPQHARTPL-IAAGV 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE3 IAGLVVIFMMLGGTF-LYWRGRRIQNKRAMRRYLERGESIEPLDPSEKA-NKVLARIFKE :.:: :....: :: .: : . :..:::.::.:: : .::: :: : :.. ::.:: CCDS42 IGGLF-ILVIVGLTFAVYVRRKSIKKKRALRRFLET-ELVEPLTPSGTAPNQAQLRILKE 660 670 680 690 700 710 710 720 730 740 750 760 pF1KE3 TELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSL :::...::::::.::::.::.:.::::..:::: ::.... .: .. :. : ..:. CCDS42 TELKRVKVLGSGAFGTVYKGIWVPEGETVKIPVAIKILNETTGPKANVEFMDEALIMASM 720 730 740 750 760 770 770 780 790 800 810 820 pF1KE3 DHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLE :: :.:::::.: . ..::::: .: : ::..:..:. .: :::::: :::::::.::: CCDS42 DHPHLVRLLGVCLSPTIQLVTQLMPHGCLLEYVHEHKDNIGSQLLLNWCVQIAKGMMYLE 780 790 800 810 820 830 830 840 850 860 870 880 pF1KE3 EHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFG :. .:::.:::::::.:::..:...:::.: :: :.:. . .: :::::::: ::. CCDS42 ERRLVHRDLAARNVLVKSPNHVKITDFGLARLLEGDEKEYNADGGKMPIKWMALECIHYR 840 850 860 870 880 890 890 900 910 920 930 940 pF1KE3 KYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVK :.::::::::::::.:::::::..:: :. :.:::::::::: :: :::::::::::: CCDS42 KFTHQSDVWSYGVTIWELMTFGGKPYDGIPTREIPDLLEKGERLPQPPICTIDVYMVMVK 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KE3 CWMIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELE ::::: . :: ::::: ::.:::::: :::::. .. . :.:. . .. :.: .:: CCDS42 CWMIDADSRPKFKELAAEFSRMARDPQRYLVIQGDDRMKL-PSPNDSKFFQNLLDEEDLE 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 pF1KE3 PELDLDLDLEAEEDNLATTTLGSALSLPV---------GTLNRPRG-SQSLLSPSSGY-- .: . : . :. : . : . .: : .:.: CCDS42 DMMDAEEYLVPQAFNIPPPIYTSRARIDSNRNQFVYRDGGFAAEQGVSVPYRAPTSTIPE 1020 1030 1040 1050 1060 1070 1060 1070 1080 1090 1100 1110 pF1KE3 MPMNQGNLGESCQESAVSGSSERCPRPVSLHPMPRGCLASESSEGHVTGSE----AELQE :. :: .: ..: .:. . .::. : . . :.. : . : .::.: CCDS42 APVAQGATAEIFDDSCCNGTLR---KPVAPHVQEDSSTQRYSADPTVFAPERSPRGELDE 1080 1090 1100 1110 1120 1130 1120 1130 1140 1150 1160 pF1KE3 KVSMCRSRSRSRSPR--PRGDSAYHSQR-----HSLLTPV---TPLSPPGLEEEDVNGYV . : :.. .. : .. . :.: ..: .: . .:: :.: :: CCDS42 EGYMTPMRDKPKQEYLNPVEENPFVSRRKNGDLQALDNPEYHNASNGPPKAEDEYVNEPL 1140 1150 1160 1170 1180 1190 1170 1180 1190 1200 1210 1220 pF1KE3 MPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEEL CCDS42 YLNTFANTLGKAEYLKNNILSMPEKAKKAFDNPDYWNHSLPPRSTLQHPDYLQEYSTKYF 1200 1210 1220 1230 1240 1250 >>CCDS5514.1 EGFR gene_id:1956|Hs108|chr7 (1210 aa) initn: 2900 init1: 1213 opt: 3422 Z-score: 1803.0 bits: 345.8 E(32554): 4.2e-94 Smith-Waterman score: 3422; 47.3% identity (75.0% similar) in 1014 aa overlap (9-1012:11-1014) 10 20 30 40 50 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV .:.:: .: .:.. . . :: :: : :. : :... .: .... ::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF :.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:. CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV :. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . . CCDS55 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG ... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.: CCDS55 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF :.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:. CCDS55 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG :: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....:: CCDS55 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS : :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . .. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE3 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW .: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...:: CCDS55 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE3 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV :.. : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: :: CCDS55 KKLF-GTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECV 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE3 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP .::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..:: CCDS55 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP 540 550 560 570 580 590 600 610 620 630 640 pF1KE3 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI ::.: .. ..:: :. . :. :: ::: :: :: :. : . : ..: .. CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGCTGPGLEGCPTN-----GPKIPSIATGMV 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE3 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANKVLARIFKETE ..:...... : :. : :.: ::..:: :.. : .::: :: : :..: ::.:::: CCDS55 GALLLLLVVALGIGLFMRRRHIVRKRTLRRLLQERELVEPLTPSGEAPNQALLRILKETE 660 670 680 690 700 710 710 720 730 740 750 760 pF1KE3 LRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAIGSLDH ..:.::::::.::::.::.::::::..:::: :: ... .. .. . . :. ...:.:. CCDS55 FKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDN 720 730 740 750 760 770 770 780 790 800 810 820 pF1KE3 AHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMYYLEEH :. ::::.: :..::.:: .:.: :::.::.:. .: : :::: ::::::: :::.. CCDS55 PHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDR 780 790 800 810 820 830 830 840 850 860 870 880 pF1KE3 GMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESIHFGKY .:::.:::::::.:.:..:...:::.: :: ..:. .:.:::::::::: : CCDS55 RLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIY 840 850 860 870 880 890 890 900 910 920 930 940 pF1KE3 THQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMVMVKCW ::::::::::::::::::::..:: :. .:. ..::::::: :: ::::::::.::::: CCDS55 THQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCW 900 910 920 930 940 950 950 960 970 980 990 1000 pF1KE3 MIDENIRPTFKELANEFTRMARDPPRYLVIKRESGPGIAPGPEPHGLTNKKLEEVELEPE ::: . :: :.:: ::..::::: :::::. . . :.: .. ..: ... CCDS55 MIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHL-PSPTDSNFYRALMDEEDMDDV 960 970 980 990 1000 1010 1010 1020 1030 1040 1050 1060 pF1KE3 LDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPMNQGNLGESCQE .: : CCDS55 VDADEYLIPQQGFFSSPSTSRTPLLSSLSATSNNSTVACIDRNGLQSCPIKEDSFLQRYS 1020 1030 1040 1050 1060 1070 >>CCDS77016.1 ERBB2 gene_id:2064|Hs108|chr17 (1055 aa) initn: 2544 init1: 1645 opt: 2998 Z-score: 1582.8 bits: 304.9 E(32554): 7.7e-82 Smith-Waterman score: 3252; 47.7% identity (73.7% similar) in 1002 aa overlap (6-984:5-996) 10 20 30 40 50 60 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM :: :::..: . . : :: :: : . .. :.. . : .::. :.::. CCDS77 MELAALCRWGLLLALLPPG--AASTQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM ::::.. ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :. CCDS77 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL 60 70 80 90 100 110 130 140 150 160 170 pF1KE3 -----LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDR :: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: .. CCDS77 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 DAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCC . ... :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..:: CCDS77 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE3 HDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCV :..::.::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. :: CCDS77 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE3 ASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTV ..::.:.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..: CCDS77 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE3 DSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWP :.::. :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..:: CCDS77 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE3 PHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLC . ..:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .:: CCDS77 DSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLC 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE3 YHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNY . :.. : ...:.: . : :::. .::.:: .: ::. : :::::: ::..: .. CCDS77 FVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE3 SRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGP :: :: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: : CCDS77 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE3 HCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTH ::. :: :: . ::.:.:: .. :.:: :::..: . . : .. . . CCDS77 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SP 600 610 620 630 640 650 650 660 670 680 690 pF1KE3 LTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANK :: .....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :. CCDS77 LTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQ 660 670 680 690 700 700 710 720 730 740 750 pF1KE3 VLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTD . ::.:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . : CCDS77 AQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILD 710 720 730 740 750 760 760 770 780 790 800 810 pF1KE3 HMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQI . ..... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .:: CCDS77 EAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQI 770 780 790 800 810 820 820 830 840 850 860 870 pF1KE3 AKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWM :::: :::. .:::.:::::::.:::..:...:::.: :: :. . . .:.::::: CCDS77 AKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWM 830 840 850 860 870 880 880 890 900 910 920 930 pF1KE3 ALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTI ::::: ..:::::::::::::::::::::.:: :. :.:::::::::: :: :::: CCDS77 ALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTI 890 900 910 920 930 940 940 950 960 970 980 990 pF1KE3 DVYMVMVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTN ::::.:::::::: . :: :.::..::.:::::: :..::. :. :: CCDS77 DVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPASPLDSTFYRSLL 950 960 970 980 990 1000 1000 1010 1020 1030 1040 1050 pF1KE3 KKLEEVELEPELDLDLDLEAEEDNLATTTLGSALSLPVGTLNRPRGSQSLLSPSSGYMPM CCDS77 EDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRNM 1010 1020 1030 1040 1050 >>CCDS45667.1 ERBB2 gene_id:2064|Hs108|chr17 (1225 aa) initn: 2521 init1: 1647 opt: 2998 Z-score: 1582.2 bits: 305.0 E(32554): 8.3e-82 Smith-Waterman score: 3229; 43.7% identity (69.8% similar) in 1157 aa overlap (36-1148:3-1145) 10 20 30 40 50 60 pF1KE3 ALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVMGNLEI : . .. :.. . : .::. :.::.::::. CCDS45 MKLRLPASPETHLDMLRHLYQGCQVVQGNLEL 10 20 30 70 80 90 100 110 120 pF1KE3 VLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM----- . ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :. CCDS45 TYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDP 40 50 60 70 80 90 130 140 150 160 170 pF1KE3 LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDRDAEIV :: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: .. . .. CCDS45 LNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALT 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE3 VKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECA . :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..:::..:: CCDS45 LIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCCHEQCA 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE3 GGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPH .::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. ::..::. CCDS45 AGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPY 220 230 240 250 260 270 300 310 320 330 340 pF1KE3 NFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTVDSSNI :.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..: :.:: CCDS45 NYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANI 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE3 DGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHN . :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..:: . . CCDS45 QEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPD 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE3 FSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSL .:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .::. :.. CCDS45 LSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTV 400 410 420 430 440 450 470 480 490 500 510 520 pF1KE3 NWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGV : ...:.: . : :::. .::.:: .: ::. : :::::: ::..: .. :: CCDS45 PWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQE 460 470 480 490 500 530 540 550 560 570 580 pF1KE3 CVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSS :: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: : ::. CCDS45 CVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVAR 510 520 530 540 550 560 590 600 610 620 630 640 pF1KE3 CPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMAL :: :: . ::.:.:: .. :.:: :::..: . . : .. . . :: . CCDS45 CPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SPLTSII 570 580 590 600 610 620 650 660 670 680 690 700 pF1KE3 TVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANKVLARI ....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :.. :: CCDS45 SAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQAQMRI 630 640 650 660 670 680 710 720 730 740 750 760 pF1KE3 FKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTDHMLAI .:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . :. .. CCDS45 LKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILDEAYVM 690 700 710 720 730 740 770 780 790 800 810 820 pF1KE3 GSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQIAKGMY ... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .:::::: CCDS45 AGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQIAKGMS 750 760 770 780 790 800 830 840 850 860 870 880 pF1KE3 YLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWMALESI :::. .:::.:::::::.:::..:...:::.: :: :. . . .:.:::::::::: CCDS45 YLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWMALESI 810 820 830 840 850 860 890 900 910 920 930 940 pF1KE3 HFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTIDVYMV ..:::::::::::::::::::::.:: :. :.:::::::::: :: ::::::::. CCDS45 LRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTIDVYMI 870 880 890 900 910 920 950 960 970 980 990 1000 pF1KE3 MVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTNKKLEE :::::::: . :: :.::..::.:::::: :..::. :. ::. .: . . ::. CCDS45 MVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPA---SPLDSTFYRSLLED 930 940 950 960 970 980 1010 1020 1030 1040 pF1KE3 VELEPELDLDLDLEAEED-----------------NLATTTLGSALSLPVGTL-NRPRGS .. .: . : .. . ...: ... .: .: .. .. CCDS45 DDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPSEEEAP 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 1090 1100 pF1KE3 QSLLSPSSGY-MPMNQGNLGESCQESAVSGSSERCPRPVSLHPM-PRGCLASESSEGHVT .: :.:: : . .:.:: . .. : .. : :.. . : : ::. .:.:. CCDS45 RSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHD-PSPLQRYSEDPTVPLPSET-DGYVA 1050 1060 1070 1080 1090 1110 1120 1130 1140 1150 1160 pF1KE3 GSEAELQ-EKVSMCRSRSRSRSPRPRGDSAYHSQRHSLLTPVTPLSPPGLEEEDVNGYVM : : :.. : . ::: : . .: : : ::: CCDS45 PLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKT-LSPGKNGVVKDVFAFG 1100 1110 1120 1130 1140 1150 1170 1180 1190 1200 1210 1220 pF1KE3 PDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSSLEELG CCDS45 GAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTAENPEY 1160 1170 1180 1190 1200 1210 >>CCDS74052.1 ERBB2 gene_id:2064|Hs108|chr17 (1240 aa) initn: 2543 init1: 1647 opt: 2998 Z-score: 1582.1 bits: 305.0 E(32554): 8.4e-82 Smith-Waterman score: 3252; 43.6% identity (69.4% similar) in 1177 aa overlap (16-1148:1-1160) 10 20 30 40 50 60 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM . ::: . :: :: : . .. :.. . : .::. :.::. CCDS74 MPRGSW---KPQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ 10 20 30 40 70 80 90 100 110 120 pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM ::::.. ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :. CCDS74 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL 50 60 70 80 90 100 130 140 150 160 170 pF1KE3 -----LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDR :: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: .. CCDS74 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN 110 120 130 140 150 160 180 190 200 210 220 pF1KE3 DAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCC . ... :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..:: CCDS74 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE3 HDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCV :..::.::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. :: CCDS74 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE3 ASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTV ..::.:.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..: CCDS74 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE3 DSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWP :.::. :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..:: CCDS74 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE3 PHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLC . ..:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .:: CCDS74 DSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLC 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE3 YHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNY . :.. : ...:.: . : :::. .::.:: .: ::. : :::::: ::..: .. CCDS74 FVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF 470 480 490 500 510 530 540 550 560 570 580 pF1KE3 SRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGP :: :: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: : CCDS74 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP 520 530 540 550 560 570 590 600 610 620 630 640 pF1KE3 HCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTH ::. :: :: . ::.:.:: .. :.:: :::..: . . : .. . . CCDS74 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SP 580 590 600 610 620 630 650 660 670 680 690 pF1KE3 LTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANK :: .....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :. CCDS74 LTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQ 640 650 660 670 680 690 700 710 720 730 740 750 pF1KE3 VLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTD . ::.:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . : CCDS74 AQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILD 700 710 720 730 740 750 760 770 780 790 800 810 pF1KE3 HMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQI . ..... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .:: CCDS74 EAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQI 760 770 780 790 800 810 820 830 840 850 860 870 pF1KE3 AKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWM :::: :::. .:::.:::::::.:::..:...:::.: :: :. . . .:.::::: CCDS74 AKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWM 820 830 840 850 860 870 880 890 900 910 920 930 pF1KE3 ALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTI ::::: ..:::::::::::::::::::::.:: :. :.:::::::::: :: :::: CCDS74 ALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTI 880 890 900 910 920 930 940 950 960 970 980 990 pF1KE3 DVYMVMVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTN ::::.:::::::: . :: :.::..::.:::::: :..::. :. ::. .: . CCDS74 DVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPA---SPLDSTFYR 940 950 960 970 980 990 1000 1010 1020 1030 pF1KE3 KKLEEVELEPELDLDLDLEAEED-----------------NLATTTLGSALSLPVGTL-N . ::. .. .: . : .. . ...: ... .: .: . CCDS74 SLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPS 1000 1010 1020 1030 1040 1050 1040 1050 1060 1070 1080 1090 pF1KE3 RPRGSQSLLSPSSGY-MPMNQGNLGESCQESAVSGSSERCPRPVSLHPM-PRGCLASESS . .. .: :.:: : . .:.:: . .. : .. : :.. . : : ::. CCDS74 EEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHD-PSPLQRYSEDPTVPLPSET- 1060 1070 1080 1090 1100 1100 1110 1120 1130 1140 1150 pF1KE3 EGHVTGSEAELQ-EKVSMCRSRSRSRSPRPRGDSAYHSQRHSLLTPVTPLSPPGLEEEDV .:.:. : : :.. : . ::: : . .: : : ::: CCDS74 DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKT-LSPGKNGVVKD 1110 1120 1130 1140 1150 1160 1160 1170 1180 1190 1200 1210 pF1KE3 NGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSS CCDS74 VFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTA 1170 1180 1190 1200 1210 1220 >>CCDS32642.1 ERBB2 gene_id:2064|Hs108|chr17 (1255 aa) initn: 2546 init1: 1647 opt: 2998 Z-score: 1582.1 bits: 305.0 E(32554): 8.4e-82 Smith-Waterman score: 3259; 43.6% identity (69.3% similar) in 1187 aa overlap (6-1148:5-1175) 10 20 30 40 50 60 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEVVM :: :::..: . . : :: :: : . .. :.. . : .::. :.::. CCDS32 MELAALCRWGLLLALLPPGAA--STQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQ 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 GNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIFVM ::::.. ::.::::: :.:: ::::.: :. .:: ::.:::::... ..:. :. CCDS32 GNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVL 60 70 80 90 100 110 130 140 150 160 170 pF1KE3 -----LNYNTNSSHA----LRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIV-RDR :: .: . : ::.:.: .:::::.::: :..: .::..::: :.:: .. CCDS32 DNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNN 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 DAEIVVKDNGRS--CPPCHEVCKG-RCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCC . ... :..:: : :: .::: :::: .:::::.::.:.:: : ..: :: :..:: CCDS32 QLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGC-ARCKGPLPTDCC 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE3 HDECAGGCSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCV :..::.::.::. .::.:: ::: :: : .:: ..:: ::. :::. .: .:. :: CCDS32 HEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCV 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE3 ASCPHNFV-VDQTSCVRACPPDKMEVD-KNGLKMCEPCGGLCPKACEGTGSGS--RFQTV ..::.:.. .: ::. .:: ..:: ..: . :: :. : ..: : : . ..: CCDS32 TACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAV 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE3 DSSNIDGFVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWP :.::. :..: ::.:.: :: ...::: . :.::.:.::.:..:::::: :..:: CCDS32 TSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWP 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE3 PHMHNFSVFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLC . ..:::.:: .: :: :.: ..:: ...:... ::.:::.:...: : : .:: CCDS32 DSLPDLSVFQNLQVIRGRILHNGAYSLT-LQGLGISWLGLRSLRELGSGLALIHHNTHLC 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE3 YHHSLNWTKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNY . :.. : ...:.: . : :::. .::.:: .: ::. : :::::: ::..: .. CCDS32 FVHTVPWDQLFRNPHQALLHTA-NRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQF 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE3 SRGGVCVTHCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGP :: :: .: :.: :::... .:. :::::::..:..:: : .: :. :::..: : CCDS32 LRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE3 HCVSSCPHGVLG--AKGPIYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTH ::. :: :: . ::.:.:: .. :.:: :::..: . . : .. . . CCDS32 FCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRA----SP 600 610 620 630 640 650 650 660 670 680 690 pF1KE3 LTMALTVIAG--LVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPS-EKANK :: .....: :::.. .. : .. : ..:. : .::: :.. : .::: :: :. CCDS32 LTSIISAVVGILLVVVLGVVFGILIKRRQQKIR-KYTMRRLLQETELVEPLTPSGAMPNQ 660 670 680 690 700 700 710 720 730 740 750 pF1KE3 VLARIFKETELRKLKVLGSGVFGTVHKGVWIPEGESIKIPVCIKVIEDKSGRQSFQAVTD . ::.:::::::.::::::.::::.::.:::.::..:::: :::...... .. . . : CCDS32 AQMRILKETELRKVKVLGSGAFGTVYKGIWIPDGENVKIPVAIKVLRENTSPKANKEILD 710 720 730 740 750 760 760 770 780 790 800 810 pF1KE3 HMLAIGSLDHAHIVRLLGLCPGSSLQLVTQYLPLGSLLDHVRQHRGALGPQLLLNWGVQI . ..... .. ::::.: :..::::: .: : ::::::..:: :: : :::: .:: CCDS32 EAYVMAGVGSPYVSRLLGICLTSTVQLVTQLMPYGCLLDHVRENRGRLGSQDLLNWCMQI 770 780 790 800 810 820 820 830 840 850 860 870 pF1KE3 AKGMYYLEEHGMVHRNLAARNVLLKSPSQVQVADFGVADLLPPDDKQLLYSEAKTPIKWM :::: :::. .:::.:::::::.:::..:...:::.: :: :. . . .:.::::: CCDS32 AKGMSYLEDVRLVHRDLAARNVLVKSPNHVKITDFGLARLLDIDETEYHADGGKVPIKWM 830 840 850 860 870 880 880 890 900 910 920 930 pF1KE3 ALESIHFGKYTHQSDVWSYGVTVWELMTFGAEPYAGLRLAEVPDLLEKGERLAQPQICTI ::::: ..:::::::::::::::::::::.:: :. :.:::::::::: :: :::: CCDS32 ALESILRRRFTHQSDVWSYGVTVWELMTFGAKPYDGIPAREIPDLLEKGERLPQPPICTI 890 900 910 920 930 940 940 950 960 970 980 990 pF1KE3 DVYMVMVKCWMIDENIRPTFKELANEFTRMARDPPRYLVIKRES-GPGIAPGPEPHGLTN ::::.:::::::: . :: :.::..::.:::::: :..::. :. ::. .: . CCDS32 DVYMIMVKCWMIDSECRPRFRELVSEFSRMARDPQRFVVIQNEDLGPA---SPLDSTFYR 950 960 970 980 990 1000 1000 1010 1020 1030 pF1KE3 KKLEEVELEPELDLDLDLEAEED-----------------NLATTTLGSALSLPVGTL-N . ::. .. .: . : .. . ...: ... .: .: . CCDS32 SLLEDDDMGDLVDAEEYLVPQQGFFCPDPAPGAGGMVHHRHRSSSTRSGGGDLTLGLEPS 1010 1020 1030 1040 1050 1060 1040 1050 1060 1070 1080 1090 pF1KE3 RPRGSQSLLSPSSGY-MPMNQGNLGESCQESAVSGSSERCPRPVSLHPM-PRGCLASESS . .. .: :.:: : . .:.:: . .. : .. : :.. . : : ::. CCDS32 EEEAPRSPLAPSEGAGSDVFDGDLGMGAAKGLQSLPTHD-PSPLQRYSEDPTVPLPSET- 1070 1080 1090 1100 1110 1120 1100 1110 1120 1130 1140 1150 pF1KE3 EGHVTGSEAELQ-EKVSMCRSRSRSRSPRPRGDSAYHSQRHSLLTPVTPLSPPGLEEEDV .:.:. : : :.. : . ::: : . .: : : ::: CCDS32 DGYVAPLTCSPQPEYVNQPDVRPQPPSPREGPLPAARPAGATLERPKT-LSPGKNGVVKD 1130 1140 1150 1160 1170 1180 1160 1170 1180 1190 1200 1210 pF1KE3 NGYVMPDTHLKGTPSSREGTLSSVGLSSVLGTEEEDEDEEYEYMNRRRRHSPPHPPRPSS CCDS32 VFAFGGAVENPEYLTPQGGAAPQPHPPPAFSPAFDNLYYWDQDPPERGAPPSTFKGTPTA 1190 1200 1210 1220 1230 1240 >>CCDS5516.1 EGFR gene_id:1956|Hs108|chr7 (628 aa) initn: 1675 init1: 538 opt: 2084 Z-score: 1109.1 bits: 216.5 E(32554): 1.9e-55 Smith-Waterman score: 2084; 45.4% identity (74.2% similar) in 621 aa overlap (9-620:11-627) 10 20 30 40 50 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV .:.:: .: .:.. . . :: :: : :. : :... .: .... ::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF :.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:. CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV :. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . . CCDS55 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG ... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.: CCDS55 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF :.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:. CCDS55 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG :: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....:: CCDS55 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS : :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . .. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE3 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW .: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...:: CCDS55 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE3 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV : : : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: :: CCDS55 KK-LFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECV 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE3 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP .::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..:: CCDS55 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP 540 550 560 570 580 590 600 610 620 630 640 pF1KE3 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI ::.: .. ..:: :. . :. :: ::: : CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGS 600 610 620 650 660 670 680 690 700 pF1KE3 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETEL >>CCDS5515.1 EGFR gene_id:1956|Hs108|chr7 (705 aa) initn: 1675 init1: 538 opt: 2084 Z-score: 1108.6 bits: 216.6 E(32554): 2e-55 Smith-Waterman score: 2084; 45.4% identity (74.2% similar) in 621 aa overlap (9-620:11-627) 10 20 30 40 50 pF1KE3 MRANDALQVLGLLFSLARGSEVGNSQAVCPGTLNGLSVTGDAENQYQTLYKLYERCEV .:.:: .: .:.. . . :: :: : :. : :... .: .... ::: CCDS55 MRPSGTAGAALLALLAALCPASRALEEKKVCQGTSNKLTQLGTFEDHFLSLQRMFNNCEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 VMGNLEIVLTGHNADLSFLQWIREVTGYVLVAMNEFSTLPLPNLRVVRGTQVYDGKFAIF :.:::::. . .: :::::. :.::.::::.:.: .:: ::...::.. :....:. CCDS55 VLGNLEITYVQRNYDLSFLKTIQEVAGYVLIALNTVERIPLENLQIIRGNMYYENSYALA 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 VMLNYNTNSSHALRQLRLTQLTEILSGGVYIEKNDKLCHMDTIDWRDIVRD---RDAEIV :. ::..:.. .:..: . .: ::: :.: . .: ::....:.::::: . . . CCDS55 VLSNYDANKT-GLKELPMRNLQEILHGAVRFSNNPALCNVESIQWRDIVSSDFLSNMSMD 130 140 150 160 170 180 190 200 210 220 230 pF1KE3 VKDNGRSCPPCHEVC-KGRCWGPGSEDCQTLTKTICAPQCNGHCFGPNPNQCCHDECAGG ... :: : : .: ::: : :.:: ::: ::: ::.:.: : .:..:::..::.: CCDS55 FQNHLGSCQKCDPSCPNGSCWGAGEENCQKLTKIICAQQCSGRCRGKSPSDCCHNQCAAG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE3 CSGPQDTDCFACRHFNDSGACVPRCPQPLVYNKLTFQLEPNPHTKYQYGGVCVASCPHNF :.::...::..::.: : ..: :: ..:: :.:.. ::. ::..:..:: .::.:. CCDS55 CTGPRESDCLVCRKFRDEATCKDTCPPLMLYNPTTYQMDVNPEGKYSFGATCVKKCPRNY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE3 VV-DQTSCVRACPPDKMEVDKNGLKMCEPCGGLCPKACEGTGSGSRFQ---TVDSSNIDG :: :. :::::: :..:....:.. :. : : : :.:.: : : .:. .....:: CCDS55 VVTDHGSCVRACGADSYEMEEDGVRKCKKCEGPCRKVCNGIGIG-EFKDSLSINATNIKH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 FVNCTKILGNLDFLITGLNGDPWHKIPALDPEKLNVFRTVREITGYLNIQSWPPHMHNFS : :::.: :.: .: ... :: . . : :::..:....::.::::.: ::.:: . .. CCDS55 FKNCTSISGDLHILPVAFRGDSFTHTPPLDPQELDILKTVKEITGFLLIQAWPENRTDLH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE3 VFSNLTTIGGRSLYNRGFSLLIMKNLNVTSLGFRSLKEISAGRIYISANRQLCYHHSLNW .: :: : ::. . ::: .. .::.::::.::::::: : . ::.:..::: ...:: CCDS55 AFENLEIIRGRTKQHGQFSLAVV-SLNITSLGLRSLKEISDGDVIISGNKNLCYANTINW 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE3 TKVLRGPTEERLDIKHNRPRRDCVAEGKVCDPLCSSGGCWGPGPGQCLSCRNYSRGGVCV : : : . .. : :: . .: : :.:: ::: ::::: : .:.:::: ::: :: CCDS55 KK-LFGTSGQKTKIISNRGENSCKATGQVCHALCSPEGCWGPEPRDCVSCRNVSRGRECV 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE3 THCNFLNGEPREFAHEAECFSCHPECQPMEGTATCNGSGSDTCAQCAHFRDGPHCVSSCP .::.:.::::::....::..::::: :. . ::.: : :.: ::::. ::::::..:: CCDS55 DKCNLLEGEPREFVENSECIQCHPECLPQAMNITCTGRGPDNCIQCAHYIDGPHCVKTCP 540 550 560 570 580 590 600 610 620 630 640 pF1KE3 HGVLGAKGP-IYKYPDVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVI ::.: .. ..:: :. . :. :: ::: : CCDS55 AGVMGENNTLVWKYADAGHVCHLCHPNCTYGPGNESLKAMLFCLFKLSSCNQSNDGSVSH 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE3 AGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLARIFKETEL CCDS55 QSGSPAAQESCLGWIPSLLPSEFQLGWGGCSHLHAWPSASVIITASSCH 660 670 680 690 700 1342 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 09:20:10 2016 done: Sun Nov 6 09:20:11 2016 Total Scan time: 5.960 Total Display time: 0.610 Function used was FASTA [36.3.4 Apr, 2011]