FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3265, 644 aa 1>>>pF1KE3265 644 - 644 aa - 644 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.7686+/-0.000995; mu= 7.8827+/- 0.060 mean_var=120.5011+/-24.124, 0's: 0 Z-trim(107.6): 25 B-trim: 0 in 0/51 Lambda= 0.116837 statistics sampled from 9647 (9662) to 9647 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.653), E-opt: 0.2 (0.297), width: 16 Scan time: 2.690 The best scores are: opt bits E(32554) CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 ( 644) 4279 732.7 3.6e-211 CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 ( 589) 998 179.7 1e-44 CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 ( 574) 559 105.7 1.9e-22 CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 ( 755) 541 102.7 2e-21 >>CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 (644 aa) initn: 4279 init1: 4279 opt: 4279 Z-score: 3904.6 bits: 732.7 E(32554): 3.6e-211 Smith-Waterman score: 4279; 100.0% identity (100.0% similar) in 644 aa overlap (1-644:1-644) 10 20 30 40 50 60 pF1KE3 MDDIADRMRMDAGEVTLVNHNSVFKTHLLPQTGFPEDQLSLSDQQILSSRQGHLDRSFTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MDDIADRMRMDAGEVTLVNHNSVFKTHLLPQTGFPEDQLSLSDQQILSSRQGHLDRSFTC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 STRSAAYNPSYYSDNPSSDSFLGSGDLRTFGQSANGQWRNSTPSSSSSLQKSRNSRSLYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 STRSAAYNPSYYSDNPSSDSFLGSGDLRTFGQSANGQWRNSTPSSSSSLQKSRNSRSLYL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 ETRKTSSGLSNSFAGKSNHHCHVSAYEKSFPIKPVPSPSWSGSCRRSLLSPKKTQRRHVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ETRKTSSGLSNSFAGKSNHHCHVSAYEKSFPIKPVPSPSWSGSCRRSLLSPKKTQRRHVS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 TAEETVQEEEREIYRQLLQMVTGKQFTIAKPTTHFPLHLSRCLSSSKNTLKDSLFKNGNS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TAEETVQEEEREIYRQLLQMVTGKQFTIAKPTTHFPLHLSRCLSSSKNTLKDSLFKNGNS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 CASQIIGSDTSSSGSASILTNQEQLSHSVYSLSSYTPDVAFGSKDSGTLHHPHHHHSVPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 CASQIIGSDTSSSGSASILTNQEQLSHSVYSLSSYTPDVAFGSKDSGTLHHPHHHHSVPH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 QPDNLAASNTQSEGSDSVILLKVKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 QPDNLAASNTQSEGSDSVILLKVKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 EEQKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQETQKKGHKLTDSEDEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EEQKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQETQKKGHKLTDSEDEF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 PEITEEMEKEIKNVFRNGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLME :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PEITEEMEKEIKNVFRNGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLME 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 RSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVD 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 FRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNG 550 560 570 580 590 600 610 620 630 640 pF1KE3 SDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILHRKLL :::::::::::::::::::::::::::::::::::::::::::: CCDS44 SDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILHRKLL 610 620 630 640 >>CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 (589 aa) initn: 1047 init1: 975 opt: 998 Z-score: 916.3 bits: 179.7 E(32554): 1e-44 Smith-Waterman score: 998; 48.7% identity (77.9% similar) in 298 aa overlap (353-644:292-589) 330 340 350 360 370 380 pF1KE3 VKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQIEEQKALALQLQNQRLQEREHSV .. .. . : . .. .. ...: . : .. CCDS33 GVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTETMVGIRFENESRRGYQLEPDL 270 280 290 300 310 320 390 400 410 420 430 pF1KE3 HDSVELHLRVP------LEKEIPVTVVQETQKKGHKLTDSEDEFPEITEEMEKEIKNVFR . : .::. :.... . ..: . .:.. :.. :.::.:::::.:.. CCDS33 SEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALG 330 340 350 360 370 380 440 450 460 470 480 490 pF1KE3 NGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTF .: :::.:: ::.: ::: :::::.. .:::::.::::::.:.::.:..: :..:.:.:: CCDS33 HGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTF 390 400 410 420 430 440 500 510 520 530 540 550 pF1KE3 FFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGIN :. :::..:::::::::: :..: .:.::::: ::: :.:.:.::: . : :::: . CCDS33 FYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKG 450 460 470 480 490 500 560 570 580 590 600 610 pF1KE3 NEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITK .. :.::::::..:: :. .... : : : .:::::.::::::::.::::: :.. CCDS33 HRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISR 510 520 530 540 550 560 620 630 640 pF1KE3 DRPINFTQQHMPYFRKRMVWEILHRKLL :.::.:::..:: :::.:::::::..:: CCDS33 DKPITFTQHQMPLFRKKMVWEILHQQLL 570 580 >>CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 (574 aa) initn: 518 init1: 331 opt: 559 Z-score: 516.6 bits: 105.7 E(32554): 1.9e-22 Smith-Waterman score: 562; 37.0% identity (63.7% similar) in 273 aa overlap (393-643:308-572) 370 380 390 400 410 pF1KE3 QKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQET-----QKKGHKLTDSE ::..: :: :: : : . : CCDS73 DHVAQELFQGSDLGMAEEAERPGEKAGQHSPLREE-HVTCVQSILDEFLQTYGSLIPLST 280 290 300 310 320 330 420 430 440 450 460 pF1KE3 DEFPEITEEM-EKEIKNVFRNG-----------NQDEVLSEAFRLTITRK-----DIQTL :: : :.. ..:... :.: ... ..::.. :. :. :: CCDS73 DEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTL 340 350 360 370 380 390 470 480 490 500 510 520 pF1KE3 NHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFS :::::...:.: ...:. :: :: ::.::. ::.: ::..::::::.::.:. CCDS73 YGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTKGYDGVKRWTKNVDIFN 400 410 420 430 440 450 530 540 550 560 570 580 pF1KE3 VDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFD ..::.:::: ::: : :: :...:::.::. .: . . . .::. :.. : : .: CCDS73 KELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFH 460 470 480 490 500 510 590 600 610 620 630 640 pF1KE3 TNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILH .::. . : ... .: : :::: :. .: .. ..:..:::: :: .:... :. : CCDS73 -QGWKGYFK--MNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPKLRRQIYKELCH 520 530 540 550 560 pF1KE3 RKLL :: CCDS73 CKLTV 570 >>CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 (755 aa) initn: 431 init1: 279 opt: 541 Z-score: 498.2 bits: 102.7 E(32554): 2e-21 Smith-Waterman score: 542; 30.0% identity (57.4% similar) in 467 aa overlap (214-644:306-754) 190 200 210 220 230 240 pF1KE3 ETVQEEEREIYRQLLQMVTGKQFTIAKPTTHFPLHLSRCLSSSKNTLKDSLFKNGNSCAS .:: : . .. :. . .:.: . CCDS33 QETRRENGEGGSCSPFPSPEPKDPSCRHQPYFPDMDSSAVVKGTNSHVPDCHTKGSSFLG 280 290 300 310 320 330 250 260 270 280 290 pF1KE3 QIIGSDTS----SSGSASILTNQEQLSHSVYSLSSYTPDVAFGSKDSGTLHHPHHHHSVP . .. : . ..:::. .: . : . . :. . . :.:. . .. . CCDS33 KELSLDEAFPDQQNGSATNAWDQSSCSSPKWECTELIHDIPLPEHRSNTMFISETEREIM 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE3 HQPDNLAASNTQSEGSDSVILLKVKDSQTPT-----P-SSTFFQAE--LWIKELTSVYDS .:. : : ::. . :.:. ..: . : :. : : ..: :. .: CCDS33 ----TLGQENQTSSVSDDRVKLSVSGADTSVSSVDGPVSQKAVQNENSYQMEEDGSLKQS 400 410 420 430 440 450 360 370 380 390 pF1KE3 -RARERLRQIEEQKAL-------ALQLQNQ----RLQEREHSVHD---SVELH--LRVPL . : : . .. : .:.:.:: . ... : : :: : : . CCDS33 ILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCLSGFLDEVM 460 470 480 490 500 510 400 410 420 430 440 450 pF1KE3 EKEIPVTVVQETQKKGHKLTDSEDE-FPEITEEMEKEIKNVFRNGNQDEVLSEAFRLTIT .: .. ..: . : .: : .: : . ...:: : .: .: . ::. . CCDS33 KKYGSLVPLSEKEVLG-RLKDVFNEDFSNRKPFINREITN-YRARHQ----KCNFRIFYN 520 530 540 550 560 460 470 480 490 500 pF1KE3 RK-----DIQTLNHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTFFFTKLKTAGYQA .. :. ::. :::::..::.: ...:. .: :: ::.:: .: : ::.. CCDS33 KHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDK----VHFFNSFFHRQLVTKGYNG 570 580 590 600 610 620 510 520 530 540 550 560 pF1KE3 VKRWTKKVDVFSVDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGINNEAC-RILLQYL :::::::::.:. ..::.:::: ::: : .: . .. :..:::.: :. . : . . .:: CCDS33 VKRWTKKVDLFKKSLLLIPIHLEVHWSLITVTLSNRIISFYDSQG-IHFKFCVENIRKYL 630 640 650 660 670 680 570 580 590 600 610 620 pF1KE3 KQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITKDRPINFTQQHM :. .:.: :: .::: . .. :::: : ::::.:. .: :.. ..:..:.:. : CCDS33 LTEAREKNRPEF-LQGWQ--TAVTKCIPQQKNDSDCGVFVLQYCKCLALEQPFQFSQEDM 690 700 710 720 730 630 640 pF1KE3 PYFRKRMVWEILHRKLL : :::. :. . .:. CCDS33 PRVRKRIYKELCECRLMD 740 750 644 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 16:47:46 2016 done: Mon Nov 7 16:47:46 2016 Total Scan time: 2.690 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]