FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3265, 644 aa
1>>>pF1KE3265 644 - 644 aa - 644 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.7686+/-0.000995; mu= 7.8827+/- 0.060
mean_var=120.5011+/-24.124, 0's: 0 Z-trim(107.6): 25 B-trim: 0 in 0/51
Lambda= 0.116837
statistics sampled from 9647 (9662) to 9647 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.653), E-opt: 0.2 (0.297), width: 16
Scan time: 2.690
The best scores are: opt bits E(32554)
CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 ( 644) 4279 732.7 3.6e-211
CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 ( 589) 998 179.7 1e-44
CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 ( 574) 559 105.7 1.9e-22
CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 ( 755) 541 102.7 2e-21
>>CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 (644 aa)
initn: 4279 init1: 4279 opt: 4279 Z-score: 3904.6 bits: 732.7 E(32554): 3.6e-211
Smith-Waterman score: 4279; 100.0% identity (100.0% similar) in 644 aa overlap (1-644:1-644)
10 20 30 40 50 60
pF1KE3 MDDIADRMRMDAGEVTLVNHNSVFKTHLLPQTGFPEDQLSLSDQQILSSRQGHLDRSFTC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MDDIADRMRMDAGEVTLVNHNSVFKTHLLPQTGFPEDQLSLSDQQILSSRQGHLDRSFTC
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 STRSAAYNPSYYSDNPSSDSFLGSGDLRTFGQSANGQWRNSTPSSSSSLQKSRNSRSLYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 STRSAAYNPSYYSDNPSSDSFLGSGDLRTFGQSANGQWRNSTPSSSSSLQKSRNSRSLYL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 ETRKTSSGLSNSFAGKSNHHCHVSAYEKSFPIKPVPSPSWSGSCRRSLLSPKKTQRRHVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ETRKTSSGLSNSFAGKSNHHCHVSAYEKSFPIKPVPSPSWSGSCRRSLLSPKKTQRRHVS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 TAEETVQEEEREIYRQLLQMVTGKQFTIAKPTTHFPLHLSRCLSSSKNTLKDSLFKNGNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TAEETVQEEEREIYRQLLQMVTGKQFTIAKPTTHFPLHLSRCLSSSKNTLKDSLFKNGNS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 CASQIIGSDTSSSGSASILTNQEQLSHSVYSLSSYTPDVAFGSKDSGTLHHPHHHHSVPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 CASQIIGSDTSSSGSASILTNQEQLSHSVYSLSSYTPDVAFGSKDSGTLHHPHHHHSVPH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 QPDNLAASNTQSEGSDSVILLKVKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QPDNLAASNTQSEGSDSVILLKVKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 EEQKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQETQKKGHKLTDSEDEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EEQKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQETQKKGHKLTDSEDEF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 PEITEEMEKEIKNVFRNGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PEITEEMEKEIKNVFRNGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLME
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 RSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVD
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 FRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNG
550 560 570 580 590 600
610 620 630 640
pF1KE3 SDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILHRKLL
::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILHRKLL
610 620 630 640
>>CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 (589 aa)
initn: 1047 init1: 975 opt: 998 Z-score: 916.3 bits: 179.7 E(32554): 1e-44
Smith-Waterman score: 998; 48.7% identity (77.9% similar) in 298 aa overlap (353-644:292-589)
330 340 350 360 370 380
pF1KE3 VKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQIEEQKALALQLQNQRLQEREHSV
.. .. . : . .. .. ...: . : ..
CCDS33 GVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTETMVGIRFENESRRGYQLEPDL
270 280 290 300 310 320
390 400 410 420 430
pF1KE3 HDSVELHLRVP------LEKEIPVTVVQETQKKGHKLTDSEDEFPEITEEMEKEIKNVFR
. : .::. :.... . ..: . .:.. :.. :.::.:::::.:..
CCDS33 SEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALG
330 340 350 360 370 380
440 450 460 470 480 490
pF1KE3 NGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTF
.: :::.:: ::.: ::: :::::.. .:::::.::::::.:.::.:..: :..:.:.::
CCDS33 HGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTF
390 400 410 420 430 440
500 510 520 530 540 550
pF1KE3 FFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGIN
:. :::..:::::::::: :..: .:.::::: ::: :.:.:.::: . : :::: .
CCDS33 FYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKG
450 460 470 480 490 500
560 570 580 590 600 610
pF1KE3 NEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITK
.. :.::::::..:: :. .... : : : .:::::.::::::::.::::: :..
CCDS33 HRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISR
510 520 530 540 550 560
620 630 640
pF1KE3 DRPINFTQQHMPYFRKRMVWEILHRKLL
:.::.:::..:: :::.:::::::..::
CCDS33 DKPITFTQHQMPLFRKKMVWEILHQQLL
570 580
>>CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 (574 aa)
initn: 518 init1: 331 opt: 559 Z-score: 516.6 bits: 105.7 E(32554): 1.9e-22
Smith-Waterman score: 562; 37.0% identity (63.7% similar) in 273 aa overlap (393-643:308-572)
370 380 390 400 410
pF1KE3 QKALALQLQNQRLQEREHSVHDSVELHLRVPLEKEIPVTVVQET-----QKKGHKLTDSE
::..: :: :: : : . :
CCDS73 DHVAQELFQGSDLGMAEEAERPGEKAGQHSPLREE-HVTCVQSILDEFLQTYGSLIPLST
280 290 300 310 320 330
420 430 440 450 460
pF1KE3 DEFPEITEEM-EKEIKNVFRNG-----------NQDEVLSEAFRLTITRK-----DIQTL
:: : :.. ..:... :.: ... ..::.. :. :. ::
CCDS73 DEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRGFRVAYKRHVLTMDDLGTL
340 350 360 370 380 390
470 480 490 500 510 520
pF1KE3 NHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFS
:::::...:.: ...:. :: :: ::.::. ::.: ::..::::::.::.:.
CCDS73 YGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTKGYDGVKRWTKNVDIFN
400 410 420 430 440 450
530 540 550 560 570 580
pF1KE3 VDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGINNEACRILLQYLKQESIDKKRKEFD
..::.:::: ::: : :: :...:::.::. .: . . . .::. :.. : : .:
CCDS73 KELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIAKYLQAEAVKKDRLDFH
460 470 480 490 500 510
590 600 610 620 630 640
pF1KE3 TNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITKDRPINFTQQHMPYFRKRMVWEILH
.::. . : ... .: : :::: :. .: .. ..:..:::: :: .:... :. :
CCDS73 -QGWKGYFK--MNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQQDMPKLRRQIYKELCH
520 530 540 550 560
pF1KE3 RKLL
::
CCDS73 CKLTV
570
>>CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 (755 aa)
initn: 431 init1: 279 opt: 541 Z-score: 498.2 bits: 102.7 E(32554): 2e-21
Smith-Waterman score: 542; 30.0% identity (57.4% similar) in 467 aa overlap (214-644:306-754)
190 200 210 220 230 240
pF1KE3 ETVQEEEREIYRQLLQMVTGKQFTIAKPTTHFPLHLSRCLSSSKNTLKDSLFKNGNSCAS
.:: : . .. :. . .:.: .
CCDS33 QETRRENGEGGSCSPFPSPEPKDPSCRHQPYFPDMDSSAVVKGTNSHVPDCHTKGSSFLG
280 290 300 310 320 330
250 260 270 280 290
pF1KE3 QIIGSDTS----SSGSASILTNQEQLSHSVYSLSSYTPDVAFGSKDSGTLHHPHHHHSVP
. .. : . ..:::. .: . : . . :. . . :.:. . .. .
CCDS33 KELSLDEAFPDQQNGSATNAWDQSSCSSPKWECTELIHDIPLPEHRSNTMFISETEREIM
340 350 360 370 380 390
300 310 320 330 340 350
pF1KE3 HQPDNLAASNTQSEGSDSVILLKVKDSQTPT-----P-SSTFFQAE--LWIKELTSVYDS
.:. : : ::. . :.:. ..: . : :. : : ..: :. .:
CCDS33 ----TLGQENQTSSVSDDRVKLSVSGADTSVSSVDGPVSQKAVQNENSYQMEEDGSLKQS
400 410 420 430 440 450
360 370 380 390
pF1KE3 -RARERLRQIEEQKAL-------ALQLQNQ----RLQEREHSVHD---SVELH--LRVPL
. : : . .. : .:.:.:: . ... : : :: : : .
CCDS33 ILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCLSGFLDEVM
460 470 480 490 500 510
400 410 420 430 440 450
pF1KE3 EKEIPVTVVQETQKKGHKLTDSEDE-FPEITEEMEKEIKNVFRNGNQDEVLSEAFRLTIT
.: .. ..: . : .: : .: : . ...:: : .: .: . ::. .
CCDS33 KKYGSLVPLSEKEVLG-RLKDVFNEDFSNRKPFINREITN-YRARHQ----KCNFRIFYN
520 530 540 550 560
460 470 480 490 500
pF1KE3 RK-----DIQTLNHLNWLNDEIINFYMNMLMERSKEKGLPSVHAFNTFFFTKLKTAGYQA
.. :. ::. :::::..::.: ...:. .: :: ::.:: .: : ::..
CCDS33 KHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDK----VHFFNSFFHRQLVTKGYNG
570 580 590 600 610 620
510 520 530 540 550 560
pF1KE3 VKRWTKKVDVFSVDILLVPIHLGVHWCLAVVDFRKKNITYYDSMGGINNEAC-RILLQYL
:::::::::.:. ..::.:::: ::: : .: . .. :..:::.: :. . : . . .::
CCDS33 VKRWTKKVDLFKKSLLLIPIHLEVHWSLITVTLSNRIISFYDSQG-IHFKFCVENIRKYL
630 640 650 660 670 680
570 580 590 600 610 620
pF1KE3 KQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNGSDCGMFACKYADCITKDRPINFTQQHM
:. .:.: :: .::: . .. :::: : ::::.:. .: :.. ..:..:.:. :
CCDS33 LTEAREKNRPEF-LQGWQ--TAVTKCIPQQKNDSDCGVFVLQYCKCLALEQPFQFSQEDM
690 700 710 720 730
630 640
pF1KE3 PYFRKRMVWEILHRKLL
: :::. :. . .:.
CCDS33 PRVRKRIYKELCECRLMD
740 750
644 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 16:47:46 2016 done: Mon Nov 7 16:47:46 2016
Total Scan time: 2.690 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]