FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4531, 594 aa 1>>>pF1KE4531 594 - 594 aa - 594 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.2286+/-0.000935; mu= 7.6966+/- 0.057 mean_var=184.3820+/-37.712, 0's: 0 Z-trim(112.9): 75 B-trim: 149 in 2/50 Lambda= 0.094453 statistics sampled from 13513 (13587) to 13513 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.753), E-opt: 0.2 (0.417), width: 16 Scan time: 4.170 The best scores are: opt bits E(32554) CCDS6681.1 SHC3 gene_id:53358|Hs108|chr9 ( 594) 3976 554.1 1.8e-157 CCDS44233.1 SHC1 gene_id:6464|Hs108|chr1 ( 584) 1197 175.4 1.8e-43 CCDS30881.1 SHC1 gene_id:6464|Hs108|chr1 ( 583) 1190 174.5 3.4e-43 CCDS1076.1 SHC1 gene_id:6464|Hs108|chr1 ( 474) 1181 173.2 6.8e-43 CCDS44234.1 SHC1 gene_id:6464|Hs108|chr1 ( 473) 1174 172.2 1.3e-42 CCDS45891.1 SHC2 gene_id:25759|Hs108|chr19 ( 582) 1027 152.3 1.7e-36 CCDS10130.1 SHC4 gene_id:399694|Hs108|chr15 ( 630) 997 148.2 3e-35 >>CCDS6681.1 SHC3 gene_id:53358|Hs108|chr9 (594 aa) initn: 3976 init1: 3976 opt: 3976 Z-score: 2940.5 bits: 554.1 E(32554): 1.8e-157 Smith-Waterman score: 3976; 99.5% identity (99.8% similar) in 594 aa overlap (1-594:1-594) 10 20 30 40 50 60 pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAPVDG ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: :: CCDS66 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAPDDG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 PGSLGHLLHKVSHLKLSSSGLRGLSSAARERAGARLSGSCSAPSLAAPDGSAPSAPRAPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 PGSLGHLLHKVSHLKLSSSGLRGLSSAARERAGARLSGSCSAPSLAAPDGSAPSAPRAPA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 MSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEVLRSMRSLDFSTRTQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 MSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEVLRSMRSLDFSTRTQI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 TREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSISLTISTASLNLRTPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 TREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSISLTISTASLNLRTPD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 SKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACHILECCDGLAQDVIGSIGQA ::::::::::::::::::::::::::::::.::::::::::::::::::::::::::::: CCDS66 SKQIIANHHMRSISFASGGDPDTTDYVAYVAKDPVNRRACHILECCDGLAQDVIGSIGQA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 FELRFKQYLQCPTKIPALHDRMQSLDEPWTEEEGDGSDHPYYNSIPSKMPPPGGFLDTRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 FELRFKQYLQCPTKIPALHDRMQSLDEPWTEEEGDGSDHPYYNSIPSKMPPPGGFLDTRL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 KPRPHAPDTAQFAGKEQTYYQGRHLGDTFGEDWQQTPLRQGSSDIYSTPEGKLHVAPTGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 KPRPHAPDTAQFAGKEQTYYQGRHLGDTFGEDWQQTPLRQGSSDIYSTPEGKLHVAPTGE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 APTYVNTQQIPPQAWPAAVSSAESSPRKDLFDMKPFEDALKNQPLGPVLSKAASVECISP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 APTYVNTQQIPPQAWPAAVSSAESSPRKDLFDMKPFEDALKNQPLGPVLSKAASVECISP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 VSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 VSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQ 490 500 510 520 530 540 550 560 570 580 590 pF1KE4 AKHLLLVDPEGTIQTKDRVFDSISHLINHHLESSLPIVSAGSELCLQQPVERKQ :::::::::::::.:::::::::::::::::::::::::::::::::::::::: CCDS66 AKHLLLVDPEGTIRTKDRVFDSISHLINHHLESSLPIVSAGSELCLQQPVERKQ 550 560 570 580 590 >>CCDS44233.1 SHC1 gene_id:6464|Hs108|chr1 (584 aa) initn: 1524 init1: 960 opt: 1197 Z-score: 894.1 bits: 175.4 E(32554): 1.8e-43 Smith-Waterman score: 1694; 48.8% identity (68.8% similar) in 619 aa overlap (3-593:6-583) 10 20 30 40 50 pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAP :. ::: .::.:..:... :..:.. . .: : : : : CCDS44 MDLLPPKPKYNPLRNESLSSLEE--------GASGSTPPEELPSPSASSL--GPILPPLP 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 VD-GPGSLGHLLHKVSHLKLSS-SGLRGLSSAARERAGARLSGSCSAPSLAAPD-GSAPS : .: .: .. ..:.:.:.. .: : :.. ::. : .: : :: : : CCDS44 GDDSPTTLCSFFPRMSNLRLANPAGGRPGSKGEPGRAADDGEGIVGA---AMPDSGPLPL 60 70 80 90 100 120 130 140 150 160 pF1KE4 APRAPAMSAA--RK-----GRPGDEPLPR-------PPRGAPHASDQVLGPGVTYVVKYL .:.. :. :. : : : : :: : .:.:.::::.:.:.:. CCDS44 LQDMNKLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYM 110 120 130 140 150 160 170 180 190 200 210 220 pF1KE4 GCIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQF ::.:::.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.: CCDS44 GCVEVLQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKF 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE4 AGMSISLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRAC ::: :.::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.::: CCDS44 AGMPITLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRAC 230 240 250 260 270 280 290 300 310 320 330 pF1KE4 HILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDH ::::: .:::::::..:::::::::::::. : :. . :::: ..: : ::: . :: CCDS44 HILECPEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDH 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE4 PYYNSIPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQT :::..:.: :: :: .: ::. . :: .:. : . :: ::: :. :. CCDS44 QYYNDFPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGD 350 360 370 380 390 400 400 410 420 430 440 pF1KE4 P-LRQGSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKD : .:. : :. . :.:::.:.. : : . :.:: : CCDS44 PEVRKQMPPPPPCPAGR----ELFDDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-D 410 420 430 440 450 450 460 470 480 490 500 pF1KE4 LFDMKPFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEA :::::::::::. : : ...: :.:..: :..:..::.:: CCDS44 LFDMKPFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREA 460 470 480 490 510 520 530 540 550 560 pF1KE4 EGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINH :.::. .::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::.. CCDS44 EALLQLNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISY 500 510 520 530 540 550 570 580 590 pF1KE4 HLESSLPIVSAGSELCLQQPVERKQ :... :::.::::::::::::::: CCDS44 HMDNHLPIISAGSELCLQQPVERKL 560 570 580 >>CCDS30881.1 SHC1 gene_id:6464|Hs108|chr1 (583 aa) initn: 1441 init1: 960 opt: 1190 Z-score: 888.9 bits: 174.5 E(32554): 3.4e-43 Smith-Waterman score: 1687; 48.8% identity (68.8% similar) in 619 aa overlap (3-593:6-582) 10 20 30 40 50 pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAP :. ::: .::.:..:... :..:.. . .: : : : : CCDS30 MDLLPPKPKYNPLRNESLSSLEE--------GASGSTPPEELPSPSASSL--GPILPPLP 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 VD-GPGSLGHLLHKVSHLKLSS-SGLRGLSSAARERAGARLSGSCSAPSLAAPD-GSAPS : .: .: .. ..:.:.:.. .: : :.. ::. : .: : :: : : CCDS30 GDDSPTTLCSFFPRMSNLRLANPAGGRPGSKGEPGRAADDGEGIVGA---AMPDSGPLPL 60 70 80 90 100 120 130 140 150 160 pF1KE4 APRAPAMSAA--RK-----GRPGDEPLPR-------PPRGAPHASDQVLGPGVTYVVKYL .:.. :. :. : : : : :: : .:.:.::::.:.:.:. CCDS30 LQDMNKLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYM 110 120 130 140 150 160 170 180 190 200 210 220 pF1KE4 GCIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQF ::.:::.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.: CCDS30 GCVEVLQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKF 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE4 AGMSISLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRAC ::: :.::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.::: CCDS30 AGMPITLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRAC 230 240 250 260 270 280 290 300 310 320 330 pF1KE4 HILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDH ::::: .:::::::..:::::::::::::. : :. . :::: ..: : ::: . :: CCDS30 HILECPEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDH 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE4 PYYNSIPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQT :::..:.: :: :: .: ::. . :: .:. : . :: ::: :. :. CCDS30 QYYNDFPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGD 350 360 370 380 390 400 400 410 420 430 440 pF1KE4 P-LRQGSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKD : .:. : .: . :.:::.:.. : : . :.:: : CCDS30 PEVRKQMPPPPPCPGRELF-----DDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-D 410 420 430 440 450 450 460 470 480 490 500 pF1KE4 LFDMKPFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEA :::::::::::. : : ...: :.:..: :..:..::.:: CCDS30 LFDMKPFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREA 460 470 480 490 510 520 530 540 550 560 pF1KE4 EGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINH :.::. .::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::.. CCDS30 EALLQLNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISY 500 510 520 530 540 550 570 580 590 pF1KE4 HLESSLPIVSAGSELCLQQPVERKQ :... :::.::::::::::::::: CCDS30 HMDNHLPIISAGSELCLQQPVERKL 560 570 580 >>CCDS1076.1 SHC1 gene_id:6464|Hs108|chr1 (474 aa) initn: 1550 init1: 960 opt: 1181 Z-score: 883.6 bits: 173.2 E(32554): 6.8e-43 Smith-Waterman score: 1631; 56.1% identity (75.5% similar) in 469 aa overlap (136-593:33-473) 110 120 130 140 150 160 pF1KE4 AAPDGSAPSAPRAPAMSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEV .: :: : .:.:.::::.:.:.:.::.:: CCDS10 KLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYMGCVEV 10 20 30 40 50 60 170 180 190 200 210 220 pF1KE4 LRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSI :.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.:::: : CCDS10 LQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKFAGMPI 70 80 90 100 110 120 230 240 250 260 270 280 pF1KE4 SLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACHILEC .::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.:::::::: CCDS10 TLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRACHILEC 130 140 150 160 170 180 290 300 310 320 330 340 pF1KE4 CDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDHPYYNS .:::::::..:::::::::::::. : :. . :::: ..: : ::: . :: :::. CCDS10 PEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDHQYYND 190 200 210 220 230 240 350 360 370 380 390 400 pF1KE4 IPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQTP-LRQ .:.: :: :: .: ::. . :: .:. : . :: ::: :. :. : .:. CCDS10 FPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGDPEVRK 250 260 270 280 290 410 420 430 440 450 pF1KE4 GSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKDLFDMK : :. . :.:::.:.. : : . :.:: :::::: CCDS10 QMPPPPPCPAGR----ELFDDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-DLFDMK 300 310 320 330 340 350 460 470 480 490 500 510 pF1KE4 PFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLE ::::::. : : ...: :.:..: :..:..::.:::.::. CCDS10 PFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREAEALLQ 360 370 380 390 520 530 540 550 560 570 pF1KE4 KDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESS .::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::..:... CCDS10 LNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISYHMDNH 400 410 420 430 440 450 580 590 pF1KE4 LPIVSAGSELCLQQPVERKQ :::.::::::::::::::: CCDS10 LPIISAGSELCLQQPVERKL 460 470 >>CCDS44234.1 SHC1 gene_id:6464|Hs108|chr1 (473 aa) initn: 1467 init1: 960 opt: 1174 Z-score: 878.4 bits: 172.2 E(32554): 1.3e-42 Smith-Waterman score: 1624; 56.1% identity (75.5% similar) in 469 aa overlap (136-593:33-472) 110 120 130 140 150 160 pF1KE4 AAPDGSAPSAPRAPAMSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEV .: :: : .:.:.::::.:.:.:.::.:: CCDS44 KLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYMGCVEV 10 20 30 40 50 60 170 180 190 200 210 220 pF1KE4 LRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSI :.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.:::: : CCDS44 LQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKFAGMPI 70 80 90 100 110 120 230 240 250 260 270 280 pF1KE4 SLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACHILEC .::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.:::::::: CCDS44 TLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRACHILEC 130 140 150 160 170 180 290 300 310 320 330 340 pF1KE4 CDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDHPYYNS .:::::::..:::::::::::::. : :. . :::: ..: : ::: . :: :::. CCDS44 PEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDHQYYND 190 200 210 220 230 240 350 360 370 380 390 400 pF1KE4 IPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQTP-LRQ .:.: :: :: .: ::. . :: .:. : . :: ::: :. :. : .:. CCDS44 FPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGDPEVRK 250 260 270 280 290 410 420 430 440 450 pF1KE4 GSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKDLFDMK : .: . :.:::.:.. : : . :.:: :::::: CCDS44 QMPPPPPCPGRELF-----DDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-DLFDMK 300 310 320 330 340 350 460 470 480 490 500 510 pF1KE4 PFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLE ::::::. : : ...: :.:..: :..:..::.:::.::. CCDS44 PFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREAEALLQ 360 370 380 390 520 530 540 550 560 570 pF1KE4 KDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESS .::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::..:... CCDS44 LNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISYHMDNH 400 410 420 430 440 450 580 590 pF1KE4 LPIVSAGSELCLQQPVERKQ :::.::::::::::::::: CCDS44 LPIISAGSELCLQQPVERKL 460 470 >>CCDS45891.1 SHC2 gene_id:25759|Hs108|chr19 (582 aa) initn: 1285 init1: 693 opt: 1027 Z-score: 768.9 bits: 152.3 E(32554): 1.7e-36 Smith-Waterman score: 1548; 50.3% identity (70.5% similar) in 529 aa overlap (80-593:71-581) 50 60 70 80 90 100 pF1KE4 GEALRKAPVDGPGSLGHLLHKVSHLKLSSSGLRGLSSAARERAGARLSGSCSAPSLAAPD :. .:..:. : .. : :.:. CCDS45 GGFLGRGPAAARAAGASGGADPQPEPAGPGGVPALAAAVLGACEPRCAAPCPLPALSRCR 50 60 70 80 90 100 110 120 130 140 150 160 pF1KE4 GSAPSAPRA--------PAMSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLG :.. . :. : .::. : :. . .: .: : . .::::::.:::.:.: CCDS45 GAGSRGSRGGRGAAGSGDAAAAAEWIRKGSF-IHKPAHGWLHPDARVLGPGVSYVVRYMG 110 120 130 140 150 170 180 190 200 210 220 pF1KE4 CIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFA :::::::::::::.::::.:::::.:. :::::..:..:: : :.: :.:.::::::.:: CCDS45 CIEVLRSMRSLDFNTRTQVTREAINRLHEAVPGVRGSWKK-KAPNKALASVLGKSNLRFA 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE4 GMSISLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACH :::::. ::: .:.: .: ..:.:::::: ::::::::: : :::::::.:::.:.:::: CCDS45 GMSISIHISTDGLSLSVPATRQVIANHHMPSISFASGGDTDMTDYVAYVAKDPINQRACH 220 230 240 250 260 270 290 300 310 320 330 340 pF1KE4 ILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLDEP-WTEEEGDGSDHP :::::.::::..:...::::::::::::. : :. .:. . .: : .:: :. .: CCDS45 ILECCEGLAQSIISTVGQAFELRFKQYLHSPPKVALPPERLAGPEESAWGDEE-DSLEHN 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE4 YYNSIPSKMPPPGGFLDTRLKPRPHAPDTAQFAGKEQTYYQGRHLGDTFGEDWQQTPLRQ ::::::.: :: ::..:.:: :: : . .. : : : CCDS45 YYNSIPGKEPPLGGLVDSRLALTQPCALTALDQGPSPSLRDACSLPWDVGSTGTAPP--- 340 350 360 370 380 390 410 420 430 440 450 pF1KE4 GSSDIYSTPEGKLHVAPTGEAPTYVNTQQIP-PQAWPAAVSSAESSPRKDLFDMKPFEDA :.. . . .: : : ::::: . :. : :.::.::::::.::::: CCDS45 GDGYVQADARGP----PDHEEHLYVNTQGLDAPE--P------EDSPKKDLFDMRPFEDA 400 410 420 430 440 460 470 480 490 500 510 pF1KE4 LKNQPLGPVLSKAAS---VECISPVSP--RAPDAKMLEELQAETWYQGEMSRKEAEGLLE :: . . . . .:. .: : : ::: : :.:. : ::.:.:::. :: .:. CCDS45 LKLHECSVAAGVTAAPLPLEDQWPSPPTRRAPVAPTEEQLRQEPWYHGRMSRRAAERMLR 450 460 470 480 490 500 520 530 540 550 560 570 pF1KE4 KDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESS ::::::: :.::::..:::::: :: ::::::::::...::: .:.::::::.:::... CCDS45 ADGDFLVRDSVTNPGQYVLTGMHAGQPKHLLLVDPEGVVRTKDVLFESISHLIDHHLQNG 510 520 530 540 550 560 580 590 pF1KE4 LPIVSAGSELCLQQPVERKQ :::.: ::: :. : :. CCDS45 QPIVAAESELHLRGVVSREP 570 580 >>CCDS10130.1 SHC4 gene_id:399694|Hs108|chr15 (630 aa) initn: 1491 init1: 879 opt: 997 Z-score: 746.3 bits: 148.2 E(32554): 3e-35 Smith-Waterman score: 1518; 43.9% identity (67.5% similar) in 633 aa overlap (1-592:24-619) 10 20 30 pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGG--GGKVS :: :.::.::::.:.::.:. . ::: :.: : CCDS10 MRERGQDSLAGLVLYVGLFGHPGMLHRAKYSRFRNESITSLDE-----GSSGGSVGNKGS 10 20 30 40 50 40 50 60 70 80 90 pF1KE4 AARATPAAAPYLVSGEALRKAPVDGPGSLGHLLHKVSHLKLSSSG----LRGLSSAARER :: ::.: . .: . ..: : :. ... .::.. . :... ...: CCDS10 PQPPHPALAPHLPTEDATLPSQ-ESPTPLCTLIPRMASMKLANPATLLSLKNFCLGTKEV 60 70 80 90 100 110 100 110 120 130 pF1KE4 AGARL--------SGSCSAPSLAAPDGSAPSAPRAPAMSAARKGRPGDEPLPRP--P--- .: :: : . . .:.:: . . : : . ::: : : CCDS10 PRLKLQESRDPGSSGPSSPETSLSRSGTAPPPQQDLVGHRATALTPDSCPLPGPGEPTLR 120 130 140 150 160 170 140 150 160 170 180 190 pF1KE4 -RGAPHASDQVLGPGVTYVVKYLGCIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKG : : ...:: :..: :.:.::.:::.:::::::. :::.:::::::.:::::::.: CCDS10 SRQDRHFLQHLLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLCEAVPGANG 180 190 200 210 220 230 200 210 220 230 240 250 pF1KE4 AFKKRKPPSKMLSSILGKSNLQFAGMSISLTISTASLNLRTPDSKQIIANHHMRSISFAS :.:::::: :.::..::::::::.::.:.::::: ::.: . :..::::::::.:::::: CCDS10 AIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHHMQSISFAS 240 250 260 270 280 290 260 270 280 290 300 310 pF1KE4 GGDPDTTDYVAYVTKDPVNRRACHILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPA :::::::::::::.:::::.:::::::: .:.:::::..:::::::::::::. :. . CCDS10 GGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYLKNPSLNTS 300 310 320 330 340 350 320 330 340 350 360 pF1KE4 LHDRMQSLDEPWTEEEGDGSDHPYYNSIPSKMPPPGGFLDTRLKPR--------P----- ... .: :.: :: ::: ::.:.:: :: : :.: . : CCDS10 CESEEVHIDSHAEERE----DHEYYNEIPGKQPPVGGVSDMRIKVQATEQMAYCPIQCEK 360 370 380 390 400 410 370 380 390 400 410 420 pF1KE4 --HAPDTAQFAG-KEQTYYQGRHLGDTFGEDWQQTPLRQGSSDIYSTPEGKLHVAPTGEA . : ... .. :. :.: .:.. . :. .. .: . : . : . CCDS10 LCYLPGNSKCSSVYENCLEQSRAIGNVHPRGVQS---QRDTSLLKHTCRVDLF-----DD 420 430 440 450 460 430 440 450 460 470 480 pF1KE4 PTYVNTQQIPPQAWPAAVSSAESSPRKDLFDMKPFEDALKNQPLGPVLSKAASVECISPV : :.::: . :. :..... .:. :::: . . : ..: CCDS10 PCYINTQAL--QSTPGSAGNQRSA-----------------QPLGSPWHCGKAPETVQPG 470 480 490 500 490 500 510 520 530 pF1KE4 SPRAP-DAKMLEELQAETW----YQGEMSRKEAEGLLEKDGDFLVRKSTTNPGSFVLTGM . : ... : ... . : :.:..::: ::.:: ::::::::.:.:.::..::.:. CCDS10 ATAQPASSHSLPHIKQQLWSEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQYVLSGL 510 520 530 540 550 560 540 550 560 570 580 590 pF1KE4 HNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESSLPIVSAGSELCLQQPVERKQ ..::::::::::::: ..:::.:::...::: .:...::::.:.:::. :.:::.. CCDS10 QGGQAKHLLLVDPEGKVRTKDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVRKDNNP 570 580 590 600 610 620 CCDS10 ALLHSNK 630 594 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:12:19 2016 done: Sun Nov 6 00:12:20 2016 Total Scan time: 4.170 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]