FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4531, 594 aa
1>>>pF1KE4531 594 - 594 aa - 594 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.2286+/-0.000935; mu= 7.6966+/- 0.057
mean_var=184.3820+/-37.712, 0's: 0 Z-trim(112.9): 75 B-trim: 149 in 2/50
Lambda= 0.094453
statistics sampled from 13513 (13587) to 13513 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.753), E-opt: 0.2 (0.417), width: 16
Scan time: 4.170
The best scores are: opt bits E(32554)
CCDS6681.1 SHC3 gene_id:53358|Hs108|chr9 ( 594) 3976 554.1 1.8e-157
CCDS44233.1 SHC1 gene_id:6464|Hs108|chr1 ( 584) 1197 175.4 1.8e-43
CCDS30881.1 SHC1 gene_id:6464|Hs108|chr1 ( 583) 1190 174.5 3.4e-43
CCDS1076.1 SHC1 gene_id:6464|Hs108|chr1 ( 474) 1181 173.2 6.8e-43
CCDS44234.1 SHC1 gene_id:6464|Hs108|chr1 ( 473) 1174 172.2 1.3e-42
CCDS45891.1 SHC2 gene_id:25759|Hs108|chr19 ( 582) 1027 152.3 1.7e-36
CCDS10130.1 SHC4 gene_id:399694|Hs108|chr15 ( 630) 997 148.2 3e-35
>>CCDS6681.1 SHC3 gene_id:53358|Hs108|chr9 (594 aa)
initn: 3976 init1: 3976 opt: 3976 Z-score: 2940.5 bits: 554.1 E(32554): 1.8e-157
Smith-Waterman score: 3976; 99.5% identity (99.8% similar) in 594 aa overlap (1-594:1-594)
10 20 30 40 50 60
pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAPVDG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::
CCDS66 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAPDDG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 PGSLGHLLHKVSHLKLSSSGLRGLSSAARERAGARLSGSCSAPSLAAPDGSAPSAPRAPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 PGSLGHLLHKVSHLKLSSSGLRGLSSAARERAGARLSGSCSAPSLAAPDGSAPSAPRAPA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 MSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEVLRSMRSLDFSTRTQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 MSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEVLRSMRSLDFSTRTQI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 TREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSISLTISTASLNLRTPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 TREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSISLTISTASLNLRTPD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 SKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACHILECCDGLAQDVIGSIGQA
::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::
CCDS66 SKQIIANHHMRSISFASGGDPDTTDYVAYVAKDPVNRRACHILECCDGLAQDVIGSIGQA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 FELRFKQYLQCPTKIPALHDRMQSLDEPWTEEEGDGSDHPYYNSIPSKMPPPGGFLDTRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 FELRFKQYLQCPTKIPALHDRMQSLDEPWTEEEGDGSDHPYYNSIPSKMPPPGGFLDTRL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 KPRPHAPDTAQFAGKEQTYYQGRHLGDTFGEDWQQTPLRQGSSDIYSTPEGKLHVAPTGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 KPRPHAPDTAQFAGKEQTYYQGRHLGDTFGEDWQQTPLRQGSSDIYSTPEGKLHVAPTGE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 APTYVNTQQIPPQAWPAAVSSAESSPRKDLFDMKPFEDALKNQPLGPVLSKAASVECISP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 APTYVNTQQIPPQAWPAAVSSAESSPRKDLFDMKPFEDALKNQPLGPVLSKAASVECISP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 VSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS66 VSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQ
490 500 510 520 530 540
550 560 570 580 590
pF1KE4 AKHLLLVDPEGTIQTKDRVFDSISHLINHHLESSLPIVSAGSELCLQQPVERKQ
:::::::::::::.::::::::::::::::::::::::::::::::::::::::
CCDS66 AKHLLLVDPEGTIRTKDRVFDSISHLINHHLESSLPIVSAGSELCLQQPVERKQ
550 560 570 580 590
>>CCDS44233.1 SHC1 gene_id:6464|Hs108|chr1 (584 aa)
initn: 1524 init1: 960 opt: 1197 Z-score: 894.1 bits: 175.4 E(32554): 1.8e-43
Smith-Waterman score: 1694; 48.8% identity (68.8% similar) in 619 aa overlap (3-593:6-583)
10 20 30 40 50
pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAP
:. ::: .::.:..:... :..:.. . .: : : : :
CCDS44 MDLLPPKPKYNPLRNESLSSLEE--------GASGSTPPEELPSPSASSL--GPILPPLP
10 20 30 40 50
60 70 80 90 100 110
pF1KE4 VD-GPGSLGHLLHKVSHLKLSS-SGLRGLSSAARERAGARLSGSCSAPSLAAPD-GSAPS
: .: .: .. ..:.:.:.. .: : :.. ::. : .: : :: : :
CCDS44 GDDSPTTLCSFFPRMSNLRLANPAGGRPGSKGEPGRAADDGEGIVGA---AMPDSGPLPL
60 70 80 90 100
120 130 140 150 160
pF1KE4 APRAPAMSAA--RK-----GRPGDEPLPR-------PPRGAPHASDQVLGPGVTYVVKYL
.:.. :. :. : : : : :: : .:.:.::::.:.:.:.
CCDS44 LQDMNKLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYM
110 120 130 140 150 160
170 180 190 200 210 220
pF1KE4 GCIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQF
::.:::.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.:
CCDS44 GCVEVLQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKF
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE4 AGMSISLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRAC
::: :.::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.:::
CCDS44 AGMPITLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRAC
230 240 250 260 270 280
290 300 310 320 330
pF1KE4 HILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDH
::::: .:::::::..:::::::::::::. : :. . :::: ..: : ::: . ::
CCDS44 HILECPEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDH
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE4 PYYNSIPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQT
:::..:.: :: :: .: ::. . :: .:. : . :: ::: :. :.
CCDS44 QYYNDFPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGD
350 360 370 380 390 400
400 410 420 430 440
pF1KE4 P-LRQGSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKD
: .:. : :. . :.:::.:.. : : . :.:: :
CCDS44 PEVRKQMPPPPPCPAGR----ELFDDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-D
410 420 430 440 450
450 460 470 480 490 500
pF1KE4 LFDMKPFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEA
:::::::::::. : : ...: :.:..: :..:..::.::
CCDS44 LFDMKPFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREA
460 470 480 490
510 520 530 540 550 560
pF1KE4 EGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINH
:.::. .::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::..
CCDS44 EALLQLNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISY
500 510 520 530 540 550
570 580 590
pF1KE4 HLESSLPIVSAGSELCLQQPVERKQ
:... :::.:::::::::::::::
CCDS44 HMDNHLPIISAGSELCLQQPVERKL
560 570 580
>>CCDS30881.1 SHC1 gene_id:6464|Hs108|chr1 (583 aa)
initn: 1441 init1: 960 opt: 1190 Z-score: 888.9 bits: 174.5 E(32554): 3.4e-43
Smith-Waterman score: 1687; 48.8% identity (68.8% similar) in 619 aa overlap (3-593:6-582)
10 20 30 40 50
pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGGGGKVSAARATPAAAPYLVSGEALRKAP
:. ::: .::.:..:... :..:.. . .: : : : :
CCDS30 MDLLPPKPKYNPLRNESLSSLEE--------GASGSTPPEELPSPSASSL--GPILPPLP
10 20 30 40 50
60 70 80 90 100 110
pF1KE4 VD-GPGSLGHLLHKVSHLKLSS-SGLRGLSSAARERAGARLSGSCSAPSLAAPD-GSAPS
: .: .: .. ..:.:.:.. .: : :.. ::. : .: : :: : :
CCDS30 GDDSPTTLCSFFPRMSNLRLANPAGGRPGSKGEPGRAADDGEGIVGA---AMPDSGPLPL
60 70 80 90 100
120 130 140 150 160
pF1KE4 APRAPAMSAA--RK-----GRPGDEPLPR-------PPRGAPHASDQVLGPGVTYVVKYL
.:.. :. :. : : : : :: : .:.:.::::.:.:.:.
CCDS30 LQDMNKLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYM
110 120 130 140 150 160
170 180 190 200 210 220
pF1KE4 GCIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQF
::.:::.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.:
CCDS30 GCVEVLQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKF
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE4 AGMSISLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRAC
::: :.::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.:::
CCDS30 AGMPITLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRAC
230 240 250 260 270 280
290 300 310 320 330
pF1KE4 HILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDH
::::: .:::::::..:::::::::::::. : :. . :::: ..: : ::: . ::
CCDS30 HILECPEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDH
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE4 PYYNSIPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQT
:::..:.: :: :: .: ::. . :: .:. : . :: ::: :. :.
CCDS30 QYYNDFPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGD
350 360 370 380 390 400
400 410 420 430 440
pF1KE4 P-LRQGSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKD
: .:. : .: . :.:::.:.. : : . :.:: :
CCDS30 PEVRKQMPPPPPCPGRELF-----DDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-D
410 420 430 440 450
450 460 470 480 490 500
pF1KE4 LFDMKPFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEA
:::::::::::. : : ...: :.:..: :..:..::.::
CCDS30 LFDMKPFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREA
460 470 480 490
510 520 530 540 550 560
pF1KE4 EGLLEKDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINH
:.::. .::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::..
CCDS30 EALLQLNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISY
500 510 520 530 540 550
570 580 590
pF1KE4 HLESSLPIVSAGSELCLQQPVERKQ
:... :::.:::::::::::::::
CCDS30 HMDNHLPIISAGSELCLQQPVERKL
560 570 580
>>CCDS1076.1 SHC1 gene_id:6464|Hs108|chr1 (474 aa)
initn: 1550 init1: 960 opt: 1181 Z-score: 883.6 bits: 173.2 E(32554): 6.8e-43
Smith-Waterman score: 1631; 56.1% identity (75.5% similar) in 469 aa overlap (136-593:33-473)
110 120 130 140 150 160
pF1KE4 AAPDGSAPSAPRAPAMSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEV
.: :: : .:.:.::::.:.:.:.::.::
CCDS10 KLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYMGCVEV
10 20 30 40 50 60
170 180 190 200 210 220
pF1KE4 LRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSI
:.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.:::: :
CCDS10 LQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKFAGMPI
70 80 90 100 110 120
230 240 250 260 270 280
pF1KE4 SLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACHILEC
.::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.::::::::
CCDS10 TLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRACHILEC
130 140 150 160 170 180
290 300 310 320 330 340
pF1KE4 CDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDHPYYNS
.:::::::..:::::::::::::. : :. . :::: ..: : ::: . :: :::.
CCDS10 PEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDHQYYND
190 200 210 220 230 240
350 360 370 380 390 400
pF1KE4 IPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQTP-LRQ
.:.: :: :: .: ::. . :: .:. : . :: ::: :. :. : .:.
CCDS10 FPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGDPEVRK
250 260 270 280 290
410 420 430 440 450
pF1KE4 GSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKDLFDMK
: :. . :.:::.:.. : : . :.:: ::::::
CCDS10 QMPPPPPCPAGR----ELFDDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-DLFDMK
300 310 320 330 340 350
460 470 480 490 500 510
pF1KE4 PFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLE
::::::. : : ...: :.:..: :..:..::.:::.::.
CCDS10 PFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREAEALLQ
360 370 380 390
520 530 540 550 560 570
pF1KE4 KDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESS
.::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::..:...
CCDS10 LNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISYHMDNH
400 410 420 430 440 450
580 590
pF1KE4 LPIVSAGSELCLQQPVERKQ
:::.:::::::::::::::
CCDS10 LPIISAGSELCLQQPVERKL
460 470
>>CCDS44234.1 SHC1 gene_id:6464|Hs108|chr1 (473 aa)
initn: 1467 init1: 960 opt: 1174 Z-score: 878.4 bits: 172.2 E(32554): 1.3e-42
Smith-Waterman score: 1624; 56.1% identity (75.5% similar) in 469 aa overlap (136-593:33-472)
110 120 130 140 150 160
pF1KE4 AAPDGSAPSAPRAPAMSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLGCIEV
.: :: : .:.:.::::.:.:.:.::.::
CCDS44 KLSGGGGRRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYMGCVEV
10 20 30 40 50 60
170 180 190 200 210 220
pF1KE4 LRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFAGMSI
:.:::.:::.::::.:::::: ::::::::::: ..::: :. ::::::.:::.:::: :
CCDS44 LQSMRALDFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKFAGMPI
70 80 90 100 110 120
230 240 250 260 270 280
pF1KE4 SLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACHILEC
.::.::.:::: . : :::::::::.::::::::::::..:::::.:::::.::::::::
CCDS44 TLTVSTSSLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRACHILEC
130 140 150 160 170 180
290 300 310 320 330 340
pF1KE4 CDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLD-EPWTEEEGDGSDHPYYNS
.:::::::..:::::::::::::. : :. . :::: ..: : ::: . :: :::.
CCDS44 PEGLAQDVISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDHQYYND
190 200 210 220 230 240
350 360 370 380 390 400
pF1KE4 IPSKMPPPGGFLDTRLKPRPHAPDTAQ-FAGKEQTYYQGRHLGDTF--GEDWQQTP-LRQ
.:.: :: :: .: ::. . :: .:. : . :: ::: :. :. : .:.
CCDS44 FPGKEPPLGGVVDMRLR-EGAAPGAARPTAPNAQT---PSHLGATLPVGQPVGGDPEVRK
250 260 270 280 290
410 420 430 440 450
pF1KE4 GSSDIYSTPEGKLHVAPTGEAPTYVNTQQIPPQ------AWPAAVSSAESSPRKDLFDMK
: .: . :.:::.:.. : : . :.:: ::::::
CCDS44 QMPPPPPCPGRELF-----DDPSYVNVQNLDKARQAVGGAGPPNPAINGSAPR-DLFDMK
300 310 320 330 340 350
460 470 480 490 500 510
pF1KE4 PFEDALKNQPLGPVLSKAASVECISPVSPRAPDAKMLEELQAETWYQGEMSRKEAEGLLE
::::::. : : ...: :.:..: :..:..::.:::.::.
CCDS44 PFEDALR-------------------VPPPPQSVSMAEQLRGEPWFHGKLSRREAEALLQ
360 370 380 390
520 530 540 550 560 570
pF1KE4 KDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESS
.::::::.:::.::..::::...:: ::::::::::...:::. :.:.::::..:...
CCDS44 LNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISYHMDNH
400 410 420 430 440 450
580 590
pF1KE4 LPIVSAGSELCLQQPVERKQ
:::.:::::::::::::::
CCDS44 LPIISAGSELCLQQPVERKL
460 470
>>CCDS45891.1 SHC2 gene_id:25759|Hs108|chr19 (582 aa)
initn: 1285 init1: 693 opt: 1027 Z-score: 768.9 bits: 152.3 E(32554): 1.7e-36
Smith-Waterman score: 1548; 50.3% identity (70.5% similar) in 529 aa overlap (80-593:71-581)
50 60 70 80 90 100
pF1KE4 GEALRKAPVDGPGSLGHLLHKVSHLKLSSSGLRGLSSAARERAGARLSGSCSAPSLAAPD
:. .:..:. : .. : :.:.
CCDS45 GGFLGRGPAAARAAGASGGADPQPEPAGPGGVPALAAAVLGACEPRCAAPCPLPALSRCR
50 60 70 80 90 100
110 120 130 140 150 160
pF1KE4 GSAPSAPRA--------PAMSAARKGRPGDEPLPRPPRGAPHASDQVLGPGVTYVVKYLG
:.. . :. : .::. : :. . .: .: : . .::::::.:::.:.:
CCDS45 GAGSRGSRGGRGAAGSGDAAAAAEWIRKGSF-IHKPAHGWLHPDARVLGPGVSYVVRYMG
110 120 130 140 150
170 180 190 200 210 220
pF1KE4 CIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKGAFKKRKPPSKMLSSILGKSNLQFA
:::::::::::::.::::.:::::.:. :::::..:..:: : :.: :.:.::::::.::
CCDS45 CIEVLRSMRSLDFNTRTQVTREAINRLHEAVPGVRGSWKK-KAPNKALASVLGKSNLRFA
160 170 180 190 200 210
230 240 250 260 270 280
pF1KE4 GMSISLTISTASLNLRTPDSKQIIANHHMRSISFASGGDPDTTDYVAYVTKDPVNRRACH
:::::. ::: .:.: .: ..:.:::::: ::::::::: : :::::::.:::.:.::::
CCDS45 GMSISIHISTDGLSLSVPATRQVIANHHMPSISFASGGDTDMTDYVAYVAKDPINQRACH
220 230 240 250 260 270
290 300 310 320 330 340
pF1KE4 ILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPALHDRMQSLDEP-WTEEEGDGSDHP
:::::.::::..:...::::::::::::. : :. .:. . .: : .:: :. .:
CCDS45 ILECCEGLAQSIISTVGQAFELRFKQYLHSPPKVALPPERLAGPEESAWGDEE-DSLEHN
280 290 300 310 320 330
350 360 370 380 390 400
pF1KE4 YYNSIPSKMPPPGGFLDTRLKPRPHAPDTAQFAGKEQTYYQGRHLGDTFGEDWQQTPLRQ
::::::.: :: ::..:.:: :: : . .. : : :
CCDS45 YYNSIPGKEPPLGGLVDSRLALTQPCALTALDQGPSPSLRDACSLPWDVGSTGTAPP---
340 350 360 370 380 390
410 420 430 440 450
pF1KE4 GSSDIYSTPEGKLHVAPTGEAPTYVNTQQIP-PQAWPAAVSSAESSPRKDLFDMKPFEDA
:.. . . .: : : ::::: . :. : :.::.::::::.:::::
CCDS45 GDGYVQADARGP----PDHEEHLYVNTQGLDAPE--P------EDSPKKDLFDMRPFEDA
400 410 420 430 440
460 470 480 490 500 510
pF1KE4 LKNQPLGPVLSKAAS---VECISPVSP--RAPDAKMLEELQAETWYQGEMSRKEAEGLLE
:: . . . . .:. .: : : ::: : :.:. : ::.:.:::. :: .:.
CCDS45 LKLHECSVAAGVTAAPLPLEDQWPSPPTRRAPVAPTEEQLRQEPWYHGRMSRRAAERMLR
450 460 470 480 490 500
520 530 540 550 560 570
pF1KE4 KDGDFLVRKSTTNPGSFVLTGMHNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESS
::::::: :.::::..:::::: :: ::::::::::...::: .:.::::::.:::...
CCDS45 ADGDFLVRDSVTNPGQYVLTGMHAGQPKHLLLVDPEGVVRTKDVLFESISHLIDHHLQNG
510 520 530 540 550 560
580 590
pF1KE4 LPIVSAGSELCLQQPVERKQ
:::.: ::: :. : :.
CCDS45 QPIVAAESELHLRGVVSREP
570 580
>>CCDS10130.1 SHC4 gene_id:399694|Hs108|chr15 (630 aa)
initn: 1491 init1: 879 opt: 997 Z-score: 746.3 bits: 148.2 E(32554): 3e-35
Smith-Waterman score: 1518; 43.9% identity (67.5% similar) in 633 aa overlap (1-592:24-619)
10 20 30
pF1KE4 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGG--GGKVS
:: :.::.::::.:.::.:. . ::: :.: :
CCDS10 MRERGQDSLAGLVLYVGLFGHPGMLHRAKYSRFRNESITSLDE-----GSSGGSVGNKGS
10 20 30 40 50
40 50 60 70 80 90
pF1KE4 AARATPAAAPYLVSGEALRKAPVDGPGSLGHLLHKVSHLKLSSSG----LRGLSSAARER
:: ::.: . .: . ..: : :. ... .::.. . :... ...:
CCDS10 PQPPHPALAPHLPTEDATLPSQ-ESPTPLCTLIPRMASMKLANPATLLSLKNFCLGTKEV
60 70 80 90 100 110
100 110 120 130
pF1KE4 AGARL--------SGSCSAPSLAAPDGSAPSAPRAPAMSAARKGRPGDEPLPRP--P---
.: :: : . . .:.:: . . : : . ::: : :
CCDS10 PRLKLQESRDPGSSGPSSPETSLSRSGTAPPPQQDLVGHRATALTPDSCPLPGPGEPTLR
120 130 140 150 160 170
140 150 160 170 180 190
pF1KE4 -RGAPHASDQVLGPGVTYVVKYLGCIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKG
: : ...:: :..: :.:.::.:::.:::::::. :::.:::::::.:::::::.:
CCDS10 SRQDRHFLQHLLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLCEAVPGANG
180 190 200 210 220 230
200 210 220 230 240 250
pF1KE4 AFKKRKPPSKMLSSILGKSNLQFAGMSISLTISTASLNLRTPDSKQIIANHHMRSISFAS
:.:::::: :.::..::::::::.::.:.::::: ::.: . :..::::::::.::::::
CCDS10 AIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHHMQSISFAS
240 250 260 270 280 290
260 270 280 290 300 310
pF1KE4 GGDPDTTDYVAYVTKDPVNRRACHILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPA
:::::::::::::.:::::.:::::::: .:.:::::..:::::::::::::. :. .
CCDS10 GGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYLKNPSLNTS
300 310 320 330 340 350
320 330 340 350 360
pF1KE4 LHDRMQSLDEPWTEEEGDGSDHPYYNSIPSKMPPPGGFLDTRLKPR--------P-----
... .: :.: :: ::: ::.:.:: :: : :.: . :
CCDS10 CESEEVHIDSHAEERE----DHEYYNEIPGKQPPVGGVSDMRIKVQATEQMAYCPIQCEK
360 370 380 390 400 410
370 380 390 400 410 420
pF1KE4 --HAPDTAQFAG-KEQTYYQGRHLGDTFGEDWQQTPLRQGSSDIYSTPEGKLHVAPTGEA
. : ... .. :. :.: .:.. . :. .. .: . : . : .
CCDS10 LCYLPGNSKCSSVYENCLEQSRAIGNVHPRGVQS---QRDTSLLKHTCRVDLF-----DD
420 430 440 450 460
430 440 450 460 470 480
pF1KE4 PTYVNTQQIPPQAWPAAVSSAESSPRKDLFDMKPFEDALKNQPLGPVLSKAASVECISPV
: :.::: . :. :..... .:. :::: . . : ..:
CCDS10 PCYINTQAL--QSTPGSAGNQRSA-----------------QPLGSPWHCGKAPETVQPG
470 480 490 500
490 500 510 520 530
pF1KE4 SPRAP-DAKMLEELQAETW----YQGEMSRKEAEGLLEKDGDFLVRKSTTNPGSFVLTGM
. : ... : ... . : :.:..::: ::.:: ::::::::.:.:.::..::.:.
CCDS10 ATAQPASSHSLPHIKQQLWSEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQYVLSGL
510 520 530 540 550 560
540 550 560 570 580 590
pF1KE4 HNGQAKHLLLVDPEGTIQTKDRVFDSISHLINHHLESSLPIVSAGSELCLQQPVERKQ
..::::::::::::: ..:::.:::...::: .:...::::.:.:::. :.:::..
CCDS10 QGGQAKHLLLVDPEGKVRTKDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVRKDNNP
570 580 590 600 610 620
CCDS10 ALLHSNK
630
594 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 00:12:19 2016 done: Sun Nov 6 00:12:20 2016
Total Scan time: 4.170 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]