FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4127, 520 aa
1>>>pF1KE4127 520 - 520 aa - 520 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.0299+/-0.00107; mu= -2.2454+/- 0.066
mean_var=456.2487+/-91.424, 0's: 0 Z-trim(116.9): 4 B-trim: 0 in 0/54
Lambda= 0.060045
statistics sampled from 17560 (17564) to 17560 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.799), E-opt: 0.2 (0.54), width: 16
Scan time: 3.320
The best scores are: opt bits E(32554)
CCDS53377.1 MEX3A gene_id:92312|Hs108|chr1 ( 520) 3566 322.9 5.5e-88
CCDS11951.2 MEX3C gene_id:51320|Hs108|chr18 ( 659) 1057 105.7 1.7e-22
CCDS32865.2 MEX3D gene_id:399664|Hs108|chr19 ( 651) 1028 103.1 9.8e-22
CCDS10319.1 MEX3B gene_id:84206|Hs108|chr15 ( 569) 1008 101.3 3e-21
>>CCDS53377.1 MEX3A gene_id:92312|Hs108|chr1 (520 aa)
initn: 3566 init1: 3566 opt: 3566 Z-score: 1693.0 bits: 322.9 E(32554): 5.5e-88
Smith-Waterman score: 3566; 100.0% identity (100.0% similar) in 520 aa overlap (1-520:1-520)
10 20 30 40 50 60
pF1KE4 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPTAGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPTAGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 DGGGGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPTAPKGASDAKLCALYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DGGGGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPTAPKGASDAKLCALYK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 EAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFMVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFMVT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 GRREDVATARREIISAAEHFSMIRASRNKSGAAFGVAPALPGQVTIRVRVPYRVVGLVVG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GRREDVATARREIISAAEHFSMIRASRNKSGAAFGVAPALPGQVTIRVRVPYRVVGLVVG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 PKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETHIAVRTGKILEYNN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETHIAVRTGKILEYNN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 ENDFLAGSPDAAIDSRYSDAWRVHQPGCKPLSTFRQNSLGCIGECGVDSGFEAPRLGEQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ENDFLAGSPDAAIDSRYSDAWRVHQPGCKPLSTFRQNSLGCIGECGVDSGFEAPRLGEQG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 GDFGYGGYLFPGYGVGKQDVYYGVAETSPPLWAGQENATPTSVLFSSASSSSSSSAKARA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GDFGYGGYLFPGYGVGKQDVYYGVAETSPPLWAGQENATPTSVLFSSASSSSSSSAKARA
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 GPPGAHRSPATSAGPELAGLPRRPPGEPLQGFSKLGGGGLRSPGGGRDCMVCFESEVTAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GPPGAHRSPATSAGPELAGLPRRPPGEPLQGFSKLGGGGLRSPGGGRDCMVCFESEVTAA
430 440 450 460 470 480
490 500 510 520
pF1KE4 LVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRIFS
::::::::::::::::::::::::::::::::::::::::
CCDS53 LVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRIFS
490 500 510 520
>>CCDS11951.2 MEX3C gene_id:51320|Hs108|chr18 (659 aa)
initn: 1346 init1: 507 opt: 1057 Z-score: 517.2 bits: 105.7 E(32554): 1.7e-22
Smith-Waterman score: 1336; 46.3% identity (67.2% similar) in 533 aa overlap (28-513:121-652)
10 20 30 40 50
pF1KE4 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPT
: :::.:. . .. : : ::: :
CCDS11 ERAPPGRPGAPEAAELELEEDEEEGEEAELDGDLLEEEELEEAEEEDRSSLLLLSPPAAT
100 110 120 130 140 150
60 70 80 90 100 110
pF1KE4 AGEDGG--GGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPT-----APKGA
:.. ::. :. ::: . :: .. .. :: . .: :
CCDS11 ASQTQQIPGGSLGSVLLPAARFDAREAAAAAAAAGVLYGGDDAQGMMAAMLSHAYGPGGC
160 170 180 190 200 210
120 130 140 150 160 170
pF1KE4 SDAKLCALYKEAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPV
. : ..: : . : :::::::::.::::::::::::::::::::::::::::::
CCDS11 GAAAAALNGEQAALLRRKSVNTTECVPVPSSEHVAEIVGRQGCKIKALRAKTNTYIKTPV
220 230 240 250 260 270
180 190 200 210 220
pF1KE4 RGEEPVFMVTGRREDVATARREIISAAEHFSMIRASRNKSGAAFG---VAPALPGQVTIR
:::::.:.::::.:::: :.:::.:::::::::::::::.: :.: .: ::::.:..
CCDS11 RGEEPIFVVTGRKEDVAMAKREILSAAEHFSMIRASRNKNGPALGGLSCSPNLPGQTTVQ
280 290 300 310 320 330
230 240 250 260 270 280
pF1KE4 VRVPYRVVGLVVGPKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETH
::::::::::::::::::::::::::.:::.:::::..::::.:: : ::.::::::: :
CCDS11 VRVPYRVVGLVVGPKGATIKRIQQQTHTYIVTPSRDKEPVFEVTGMPENVDRAREEIEMH
340 350 360 370 380 390
290 300 310 320 330 340
pF1KE4 IAVRTGKILEYNNENDFLAGSPDAAIDS-RYSDAWRVHQP----GCKPLSTFRQNSLGCI
::.:::. .: :.:::: .. :..... ..:: .: . .:..:..: . .
CCDS11 IAMRTGNYIELNEENDFHYNGTDVSFEGGTLGSAWLSSNPVPPSRARMISNYRNDSSSSL
400 410 420 430 440 450
350 360 370 380 390
pF1KE4 GECGVDSGFEAPRLGE--QGGDFGYGGYLFPGY--GVGKQDV------YYGVAETSPPLW
: ..:: : . ::.. . :. :.. : .::..:. . .. .. .:
CCDS11 GSGSTDSYFGSNRLADFSPTSPFSTGNFWFGDTLPSVGSEDLAVDSPAFDSLPTSAQTIW
460 470 480 490 500 510
400 410 420 430
pF1KE4 AGQENATPTSVLFSSASSS------SSSSAKARAGP--------PGAHR--SPATSAGPE
. : ..: : . :. :.. .:. . : .: : :.: : :.: .
CCDS11 TPFEPVNPLSGFGSDPSGNMKTQRRGSQPSTPRLSPTFPESIEHPLARRVRSDPPSTGNH
520 530 540 550 560 570
440 450 460 470 480 490
pF1KE4 LAGLPRRPPG--EPLQGFSKLGGGGLRS-PGGGR---DCMVCFESEVTAALVPCGHNLFC
. ::: :. . ...:. .::. : : .: ::..:::.:: ::::::::::::
CCDS11 V-GLPIYIPAFSNGTNSYSSSNGGSTSSSPPESRRKHDCVICFENEVIAALVPCGHNLFC
580 590 600 610 620
500 510 520
pF1KE4 MECAVRICERTDPECPVCHITATQAIRIFS
:::: .:::. : ::::. ..:
CCDS11 MECANKICEKRTPSCPVCQTAVTQAIQIHS
630 640 650
>>CCDS32865.2 MEX3D gene_id:399664|Hs108|chr19 (651 aa)
initn: 1006 init1: 501 opt: 1028 Z-score: 503.7 bits: 103.1 E(32554): 9.8e-22
Smith-Waterman score: 1097; 46.0% identity (62.1% similar) in 485 aa overlap (37-455:58-525)
10 20 30 40 50 60
pF1KE4 SGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLG---EPPAPTAGEDG-
::.:::::: :::: . :. ::
CCDS32 PGPGPAPPPEGAQEAAPAPRPPPEPDDAAAALRLALDQLSALGLGGAGDTDEEGAAGDGA
30 40 50 60 70 80
70 80 90 100
pF1KE4 ---GGGGGGAPAQPAAPPQP---APPP--PPAAPPAAPTAAPAAQTPQPPT---------
::. ::: .:. : : ::: : .:: . : : :. : ::
CCDS32 AAAGGADGGAAPEPVPPDGPEAGAPPTLAPAVAPGSLPLLDPNASPPPPPPPRPSPPDVF
90 100 110 120 130 140
110 120 130 140 150 160
pF1KE4 ---APKGASDAKLCALYKEAEL--RLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRA
::. :. . : . . : : : :::::::.::::::::::::::::::::
CCDS32 AGFAPHPAALGPPTLLADQMSVIGSRKKSVNMTECVPVPSSEHVAEIVGRQGCKIKALRA
150 160 170 180 190 200
170 180 190 200 210
pF1KE4 KTNTYIKTPVRGEEPVFMVTGRREDVATARREIISAAEHFSMIRASRNKSGAAFGVA---
:::::::::::::::::.::::.::: :.:::.:::::::.:::.:.:.:. :.:
CCDS32 KTNTYIKTPVRGEEPVFIVTGRKEDVEMAKREILSAAEHFSIIRATRSKAGGLPGAAQGP
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE4 PALPGQVTIRVRVPYRVVGLVVGPKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNV
: ::::.::.::::::::::::::::::::::::.:.:::.::.::..::: .:: : ::
CCDS32 PNLPGQTTIQVRVPYRVVGLVVGPKGATIKRIQQRTHTYIVTPGRDKEPVFAVTGMPENV
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE4 ERAREEIETHIAVRTGKILEYNNENDFLAGSPDAAIDSRYSDA--W-RVHQPGCKPLSTF
.:::::::.::..::: . . . ..:: :.. :. .: . : : .. . : .: ..
CCDS32 DRAREEIEAHITLRTGAFTDAGPDSDFHANGTDVCLDLLGAAASLWAKTPNQGRRPPTA-
330 340 350 360 370 380
340 350 360 370
pF1KE4 RQNSLGCIGEC--GVDSGFEAPRLGEQGGDF-------------GYGGYLF----PGYGV
. : :. :. :. :: : .:: : ::. : :: :
CCDS32 ---TAGLRGDTALGAPSAPEAFYAGSRGGPSVPDPGPASPYSGSGNGGFAFGAEGPGAPV
390 400 410 420 430 440
380 390 400 410 420
pF1KE4 GK---QDVYYG------VAETSPP----LWAGQENATPTSVLFSSASSSSSSSAKARAGP
: .: .: . . . : .:: : :.: .. :. :.... ::
CCDS32 GTAAPDDCDFGFDFDFLALDLTVPAAATIWAPFERAAPLPAF------SGCSTVNGAPGP
450 460 470 480 490
430 440 450 460 470 480
pF1KE4 P--GAHRSPATSAGPELAGLPRRPPGEPLQGFSKLGGGGLRSPGGGRDCMVCFESEVTAA
: ::.:: .: :: ::. : : : .:
CCDS32 PAAGARRS----SG---AGTPRHSPTLPEPGGLRLELPLSRRGAPDPVGALSWRPPQGPV
500 510 520 530 540 550
490 500 510 520
pF1KE4 LVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRIFS
CCDS32 SFPGGAAFSTATSLPSSPAAAACAPLDSGASENSRKPPSASSAPALARECVVCAEGEVMA
560 570 580 590 600 610
>>CCDS10319.1 MEX3B gene_id:84206|Hs108|chr15 (569 aa)
initn: 975 init1: 512 opt: 1008 Z-score: 495.0 bits: 101.3 E(32554): 3e-21
Smith-Waterman score: 1044; 45.8% identity (60.8% similar) in 485 aa overlap (1-463:1-391)
10 20 30 40 50 60
pF1KE4 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPTAGE
::: . . .::::. : : :::. :.:.:::::::::: ::::
CCDS10 MPSSLFAD-LERNGSGG--GG-GGSSGGGETLDDQRALQLALDQLSLLGLD---------
10 20 30 40
70 80 90 100 110 120
pF1KE4 DGGGGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPTAPKGASDAKLCALYK
. .::: ::
CCDS10 ---------------------------------------------SDEGAS------LY-
50
130 140 150 160 170 180
pF1KE4 EAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFMVT
..: : : : : :::::::.:::::::::::::::::::::::::::::::::::::.::
CCDS10 DSEPR-KKSVNMTECVPVPSSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFVVT
60 70 80 90 100 110
190 200 210 220 230
pF1KE4 GRREDVATARREIISAAEHFSMIRASRNKSGAAFGVAPA---LPGQVTIRVRVPYRVVGL
::.:::: :::::::::::::::::::::. : :..:. ::::.::.::::::::::
CCDS10 GRKEDVAMARREIISAAEHFSMIRASRNKNTALNGAVPGPPNLPGQTTIQVRVPYRVVGL
120 130 140 150 160 170
240 250 260 270 280 290
pF1KE4 VVGPKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETHIAVRTGKILE
::::::::::::::::.:::.:::::..::::.:: : ::.:::::::.:::.::: :.:
CCDS10 VVGPKGATIKRIQQQTHTYIVTPSRDKEPVFEVTGMPENVDRAREEIEAHIALRTGGIIE
180 190 200 210 220 230
300 310 320 330 340
pF1KE4 YNNENDFLAGSPDAAIDSRYSDA-------WR------VHQPGCKPLSTFRQNSLGCIGE
..:::: :.. :...: ..... : . :: ::.:..:..: . .:
CCDS10 LTDENDFHANGTDVGFDLHHGSGGSGPGSLWSKPTPSITPTPGRKPFSSYRNDSSSSLGS
240 250 260 270 280 290
350 360 370 380 390 400
pF1KE4 CGVDSGFEAPRLGEQGGDFGYGGYLFPGYGVGKQDVYYGVAETSPPLWAGQENATPTSVL
..:: : :: . .. .. .:. ::: . :
CCDS10 ASTDSYF--------------GGGTSSSAAATQR-----LADYSPP-------SPALSFA
300 310 320
410 420 430 440 450
pF1KE4 FSSASSSSSSSAKARAGPPGAHRSPATSAGPELAGL----PRRPPGEPL--QGFSKLGGG
.. ....... :: : :. .. ::: : ::: :: : . ::
CCDS10 HNGNNNNNGNGYTYTAG--GEASVPSPDGCPELQPTFDPAPAPPPGAPLIWAQFERSPGG
330 340 350 360 370 380
460 470 480 490 500 510
pF1KE4 GLRSPGGGRDCMVCFESEVTAALVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRI
: .:
CCDS10 GPAAPVSSSCSSSASSSASSSSVVFPGGGASAPSNANLGLLVHRRLHPGTSCPRLSPPLH
390 400 410 420 430 440
520 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 04:33:48 2016 done: Tue Nov 8 04:33:48 2016
Total Scan time: 3.320 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]