FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4127, 520 aa 1>>>pF1KE4127 520 - 520 aa - 520 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.0299+/-0.00107; mu= -2.2454+/- 0.066 mean_var=456.2487+/-91.424, 0's: 0 Z-trim(116.9): 4 B-trim: 0 in 0/54 Lambda= 0.060045 statistics sampled from 17560 (17564) to 17560 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.799), E-opt: 0.2 (0.54), width: 16 Scan time: 3.320 The best scores are: opt bits E(32554) CCDS53377.1 MEX3A gene_id:92312|Hs108|chr1 ( 520) 3566 322.9 5.5e-88 CCDS11951.2 MEX3C gene_id:51320|Hs108|chr18 ( 659) 1057 105.7 1.7e-22 CCDS32865.2 MEX3D gene_id:399664|Hs108|chr19 ( 651) 1028 103.1 9.8e-22 CCDS10319.1 MEX3B gene_id:84206|Hs108|chr15 ( 569) 1008 101.3 3e-21 >>CCDS53377.1 MEX3A gene_id:92312|Hs108|chr1 (520 aa) initn: 3566 init1: 3566 opt: 3566 Z-score: 1693.0 bits: 322.9 E(32554): 5.5e-88 Smith-Waterman score: 3566; 100.0% identity (100.0% similar) in 520 aa overlap (1-520:1-520) 10 20 30 40 50 60 pF1KE4 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPTAGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPTAGE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 DGGGGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPTAPKGASDAKLCALYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DGGGGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPTAPKGASDAKLCALYK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 EAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFMVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFMVT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 GRREDVATARREIISAAEHFSMIRASRNKSGAAFGVAPALPGQVTIRVRVPYRVVGLVVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GRREDVATARREIISAAEHFSMIRASRNKSGAAFGVAPALPGQVTIRVRVPYRVVGLVVG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 PKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETHIAVRTGKILEYNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETHIAVRTGKILEYNN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 ENDFLAGSPDAAIDSRYSDAWRVHQPGCKPLSTFRQNSLGCIGECGVDSGFEAPRLGEQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 ENDFLAGSPDAAIDSRYSDAWRVHQPGCKPLSTFRQNSLGCIGECGVDSGFEAPRLGEQG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 GDFGYGGYLFPGYGVGKQDVYYGVAETSPPLWAGQENATPTSVLFSSASSSSSSSAKARA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GDFGYGGYLFPGYGVGKQDVYYGVAETSPPLWAGQENATPTSVLFSSASSSSSSSAKARA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GPPGAHRSPATSAGPELAGLPRRPPGEPLQGFSKLGGGGLRSPGGGRDCMVCFESEVTAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GPPGAHRSPATSAGPELAGLPRRPPGEPLQGFSKLGGGGLRSPGGGRDCMVCFESEVTAA 430 440 450 460 470 480 490 500 510 520 pF1KE4 LVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRIFS :::::::::::::::::::::::::::::::::::::::: CCDS53 LVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRIFS 490 500 510 520 >>CCDS11951.2 MEX3C gene_id:51320|Hs108|chr18 (659 aa) initn: 1346 init1: 507 opt: 1057 Z-score: 517.2 bits: 105.7 E(32554): 1.7e-22 Smith-Waterman score: 1336; 46.3% identity (67.2% similar) in 533 aa overlap (28-513:121-652) 10 20 30 40 50 pF1KE4 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPT : :::.:. . .. : : ::: : CCDS11 ERAPPGRPGAPEAAELELEEDEEEGEEAELDGDLLEEEELEEAEEEDRSSLLLLSPPAAT 100 110 120 130 140 150 60 70 80 90 100 110 pF1KE4 AGEDGG--GGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPT-----APKGA :.. ::. :. ::: . :: .. .. :: . .: : CCDS11 ASQTQQIPGGSLGSVLLPAARFDAREAAAAAAAAGVLYGGDDAQGMMAAMLSHAYGPGGC 160 170 180 190 200 210 120 130 140 150 160 170 pF1KE4 SDAKLCALYKEAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPV . : ..: : . : :::::::::.:::::::::::::::::::::::::::::: CCDS11 GAAAAALNGEQAALLRRKSVNTTECVPVPSSEHVAEIVGRQGCKIKALRAKTNTYIKTPV 220 230 240 250 260 270 180 190 200 210 220 pF1KE4 RGEEPVFMVTGRREDVATARREIISAAEHFSMIRASRNKSGAAFG---VAPALPGQVTIR :::::.:.::::.:::: :.:::.:::::::::::::::.: :.: .: ::::.:.. CCDS11 RGEEPIFVVTGRKEDVAMAKREILSAAEHFSMIRASRNKNGPALGGLSCSPNLPGQTTVQ 280 290 300 310 320 330 230 240 250 260 270 280 pF1KE4 VRVPYRVVGLVVGPKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETH ::::::::::::::::::::::::::.:::.:::::..::::.:: : ::.::::::: : CCDS11 VRVPYRVVGLVVGPKGATIKRIQQQTHTYIVTPSRDKEPVFEVTGMPENVDRAREEIEMH 340 350 360 370 380 390 290 300 310 320 330 340 pF1KE4 IAVRTGKILEYNNENDFLAGSPDAAIDS-RYSDAWRVHQP----GCKPLSTFRQNSLGCI ::.:::. .: :.:::: .. :..... ..:: .: . .:..:..: . . CCDS11 IAMRTGNYIELNEENDFHYNGTDVSFEGGTLGSAWLSSNPVPPSRARMISNYRNDSSSSL 400 410 420 430 440 450 350 360 370 380 390 pF1KE4 GECGVDSGFEAPRLGE--QGGDFGYGGYLFPGY--GVGKQDV------YYGVAETSPPLW : ..:: : . ::.. . :. :.. : .::..:. . .. .. .: CCDS11 GSGSTDSYFGSNRLADFSPTSPFSTGNFWFGDTLPSVGSEDLAVDSPAFDSLPTSAQTIW 460 470 480 490 500 510 400 410 420 430 pF1KE4 AGQENATPTSVLFSSASSS------SSSSAKARAGP--------PGAHR--SPATSAGPE . : ..: : . :. :.. .:. . : .: : :.: : :.: . CCDS11 TPFEPVNPLSGFGSDPSGNMKTQRRGSQPSTPRLSPTFPESIEHPLARRVRSDPPSTGNH 520 530 540 550 560 570 440 450 460 470 480 490 pF1KE4 LAGLPRRPPG--EPLQGFSKLGGGGLRS-PGGGR---DCMVCFESEVTAALVPCGHNLFC . ::: :. . ...:. .::. : : .: ::..:::.:: :::::::::::: CCDS11 V-GLPIYIPAFSNGTNSYSSSNGGSTSSSPPESRRKHDCVICFENEVIAALVPCGHNLFC 580 590 600 610 620 500 510 520 pF1KE4 MECAVRICERTDPECPVCHITATQAIRIFS :::: .:::. : ::::. ..: CCDS11 MECANKICEKRTPSCPVCQTAVTQAIQIHS 630 640 650 >>CCDS32865.2 MEX3D gene_id:399664|Hs108|chr19 (651 aa) initn: 1006 init1: 501 opt: 1028 Z-score: 503.7 bits: 103.1 E(32554): 9.8e-22 Smith-Waterman score: 1097; 46.0% identity (62.1% similar) in 485 aa overlap (37-455:58-525) 10 20 30 40 50 60 pF1KE4 SGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLG---EPPAPTAGEDG- ::.:::::: :::: . :. :: CCDS32 PGPGPAPPPEGAQEAAPAPRPPPEPDDAAAALRLALDQLSALGLGGAGDTDEEGAAGDGA 30 40 50 60 70 80 70 80 90 100 pF1KE4 ---GGGGGGAPAQPAAPPQP---APPP--PPAAPPAAPTAAPAAQTPQPPT--------- ::. ::: .:. : : ::: : .:: . : : :. : :: CCDS32 AAAGGADGGAAPEPVPPDGPEAGAPPTLAPAVAPGSLPLLDPNASPPPPPPPRPSPPDVF 90 100 110 120 130 140 110 120 130 140 150 160 pF1KE4 ---APKGASDAKLCALYKEAEL--RLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRA ::. :. . : . . : : : :::::::.:::::::::::::::::::: CCDS32 AGFAPHPAALGPPTLLADQMSVIGSRKKSVNMTECVPVPSSEHVAEIVGRQGCKIKALRA 150 160 170 180 190 200 170 180 190 200 210 pF1KE4 KTNTYIKTPVRGEEPVFMVTGRREDVATARREIISAAEHFSMIRASRNKSGAAFGVA--- :::::::::::::::::.::::.::: :.:::.:::::::.:::.:.:.:. :.: CCDS32 KTNTYIKTPVRGEEPVFIVTGRKEDVEMAKREILSAAEHFSIIRATRSKAGGLPGAAQGP 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE4 PALPGQVTIRVRVPYRVVGLVVGPKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNV : ::::.::.::::::::::::::::::::::::.:.:::.::.::..::: .:: : :: CCDS32 PNLPGQTTIQVRVPYRVVGLVVGPKGATIKRIQQRTHTYIVTPGRDKEPVFAVTGMPENV 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE4 ERAREEIETHIAVRTGKILEYNNENDFLAGSPDAAIDSRYSDA--W-RVHQPGCKPLSTF .:::::::.::..::: . . . ..:: :.. :. .: . : : .. . : .: .. CCDS32 DRAREEIEAHITLRTGAFTDAGPDSDFHANGTDVCLDLLGAAASLWAKTPNQGRRPPTA- 330 340 350 360 370 380 340 350 360 370 pF1KE4 RQNSLGCIGEC--GVDSGFEAPRLGEQGGDF-------------GYGGYLF----PGYGV . : :. :. :. :: : .:: : ::. : :: : CCDS32 ---TAGLRGDTALGAPSAPEAFYAGSRGGPSVPDPGPASPYSGSGNGGFAFGAEGPGAPV 390 400 410 420 430 440 380 390 400 410 420 pF1KE4 GK---QDVYYG------VAETSPP----LWAGQENATPTSVLFSSASSSSSSSAKARAGP : .: .: . . . : .:: : :.: .. :. :.... :: CCDS32 GTAAPDDCDFGFDFDFLALDLTVPAAATIWAPFERAAPLPAF------SGCSTVNGAPGP 450 460 470 480 490 430 440 450 460 470 480 pF1KE4 P--GAHRSPATSAGPELAGLPRRPPGEPLQGFSKLGGGGLRSPGGGRDCMVCFESEVTAA : ::.:: .: :: ::. : : : .: CCDS32 PAAGARRS----SG---AGTPRHSPTLPEPGGLRLELPLSRRGAPDPVGALSWRPPQGPV 500 510 520 530 540 550 490 500 510 520 pF1KE4 LVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRIFS CCDS32 SFPGGAAFSTATSLPSSPAAAACAPLDSGASENSRKPPSASSAPALARECVVCAEGEVMA 560 570 580 590 600 610 >>CCDS10319.1 MEX3B gene_id:84206|Hs108|chr15 (569 aa) initn: 975 init1: 512 opt: 1008 Z-score: 495.0 bits: 101.3 E(32554): 3e-21 Smith-Waterman score: 1044; 45.8% identity (60.8% similar) in 485 aa overlap (1-463:1-391) 10 20 30 40 50 60 pF1KE4 MPSLVVSGIMERNGGFGELGCFGGSAKDRGLLEDERALQLALDQLCLLGLGEPPAPTAGE ::: . . .::::. : : :::. :.:.:::::::::: :::: CCDS10 MPSSLFAD-LERNGSGG--GG-GGSSGGGETLDDQRALQLALDQLSLLGLD--------- 10 20 30 40 70 80 90 100 110 120 pF1KE4 DGGGGGGGAPAQPAAPPQPAPPPPPAAPPAAPTAAPAAQTPQPPTAPKGASDAKLCALYK . .::: :: CCDS10 ---------------------------------------------SDEGAS------LY- 50 130 140 150 160 170 180 pF1KE4 EAELRLKGSSNTTECVPVPTSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFMVT ..: : : : : :::::::.:::::::::::::::::::::::::::::::::::::.:: CCDS10 DSEPR-KKSVNMTECVPVPSSEHVAEIVGRQGCKIKALRAKTNTYIKTPVRGEEPVFVVT 60 70 80 90 100 110 190 200 210 220 230 pF1KE4 GRREDVATARREIISAAEHFSMIRASRNKSGAAFGVAPA---LPGQVTIRVRVPYRVVGL ::.:::: :::::::::::::::::::::. : :..:. ::::.::.:::::::::: CCDS10 GRKEDVAMARREIISAAEHFSMIRASRNKNTALNGAVPGPPNLPGQTTIQVRVPYRVVGL 120 130 140 150 160 170 240 250 260 270 280 290 pF1KE4 VVGPKGATIKRIQQQTNTYIITPSRDRDPVFEITGAPGNVERAREEIETHIAVRTGKILE ::::::::::::::::.:::.:::::..::::.:: : ::.:::::::.:::.::: :.: CCDS10 VVGPKGATIKRIQQQTHTYIVTPSRDKEPVFEVTGMPENVDRAREEIEAHIALRTGGIIE 180 190 200 210 220 230 300 310 320 330 340 pF1KE4 YNNENDFLAGSPDAAIDSRYSDA-------WR------VHQPGCKPLSTFRQNSLGCIGE ..:::: :.. :...: ..... : . :: ::.:..:..: . .: CCDS10 LTDENDFHANGTDVGFDLHHGSGGSGPGSLWSKPTPSITPTPGRKPFSSYRNDSSSSLGS 240 250 260 270 280 290 350 360 370 380 390 400 pF1KE4 CGVDSGFEAPRLGEQGGDFGYGGYLFPGYGVGKQDVYYGVAETSPPLWAGQENATPTSVL ..:: : :: . .. .. .:. ::: . : CCDS10 ASTDSYF--------------GGGTSSSAAATQR-----LADYSPP-------SPALSFA 300 310 320 410 420 430 440 450 pF1KE4 FSSASSSSSSSAKARAGPPGAHRSPATSAGPELAGL----PRRPPGEPL--QGFSKLGGG .. ....... :: : :. .. ::: : ::: :: : . :: CCDS10 HNGNNNNNGNGYTYTAG--GEASVPSPDGCPELQPTFDPAPAPPPGAPLIWAQFERSPGG 330 340 350 360 370 380 460 470 480 490 500 510 pF1KE4 GLRSPGGGRDCMVCFESEVTAALVPCGHNLFCMECAVRICERTDPECPVCHITATQAIRI : .: CCDS10 GPAAPVSSSCSSSASSSASSSSVVFPGGGASAPSNANLGLLVHRRLHPGTSCPRLSPPLH 390 400 410 420 430 440 520 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 04:33:48 2016 done: Tue Nov 8 04:33:48 2016 Total Scan time: 3.320 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]