FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1331, 589 aa
1>>>pF1KA1331 589 - 589 aa - 589 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.2133+/-0.000932; mu= 14.4197+/- 0.056
mean_var=81.3677+/-16.033, 0's: 0 Z-trim(106.2): 22 B-trim: 0 in 0/52
Lambda= 0.142183
statistics sampled from 8818 (8834) to 8818 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.642), E-opt: 0.2 (0.271), width: 16
Scan time: 2.710
The best scores are: opt bits E(32554)
CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 ( 589) 3987 827.9 0
CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 ( 644) 1001 215.4 1.8e-55
CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 ( 574) 494 111.4 3.3e-24
CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 ( 755) 488 110.2 9.9e-24
>>CCDS33902.1 SENP2 gene_id:59343|Hs108|chr3 (589 aa)
initn: 3987 init1: 3987 opt: 3987 Z-score: 4420.2 bits: 827.9 E(32554): 0
Smith-Waterman score: 3987; 99.8% identity (99.8% similar) in 589 aa overlap (1-589:1-589)
10 20 30 40 50 60
pF1KA1 MYRWLVRILGTIFRFCDRSVPPARALLKRRRSDSTLFSTVDTDEIPAKRPRLDCFIHQVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MYRWLVRILGTIFRFCDRSVPPARALLKRRRSDSTLFSTVDTDEIPAKRPRLDCFIHQVK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 NSLYNAASLFGFPFQLTTKPMVTSACNGTRNVAPSGEVFSNSSSCELTGSGSWNNMLKLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NSLYNAASLFGFPFQLTTKPMVTSACNGTRNVAPSGEVFSNSSSCELTGSGSWNNMLKLG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 NKSPNGISDYPKIRVTVTRDQPRRVLPSFGFTLNSEGCNRRPGGRRHSKGNPESSLMWKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NKSPNGISDYPKIRVTVTRDQPRRVLPSFGFTLNSEGCNRRPGGRRHSKGNPESSLMWKP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 QEQAVTEMISEESGKGLRRPHCTVEEGVQKEEREKYRKLLERLKESGHGNSVCPVTSNYH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QEQAVTEMISEESGKGLRRPHCTVEEGVQKEEREKYRKLLERLKESGHGNSVCPVTSNYH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 SSQRSQMDTLKTKGWGEEQNHGVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SSQRSQMDTLKTKGWGEEQNHGVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 KMVGIRFENESRRGYQLEPDLSEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDR
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TMVGIRFENESRRGYQLEPDLSEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 RTDDLLELTEDMEKEISNALGHGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 RTDDLLELTEDMEKEISNALGHGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 NLLVERNKKQGYPALHVFSTFFYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 NLLVERNKKQGYPALHVFSTFFYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 LVVIDLRKKCLKYLDSMGQKGHRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LVVIDLRKKCLKYLDSMGQKGHRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIP
490 500 510 520 530 540
550 560 570 580
pF1KA1 QQLNGSDCGMFTCKYADYISRDKPITFTQHQMPLFRKKMVWEILHQQLL
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QQLNGSDCGMFTCKYADYISRDKPITFTQHQMPLFRKKMVWEILHQQLL
550 560 570 580
>>CCDS44868.2 SENP1 gene_id:29843|Hs108|chr12 (644 aa)
initn: 1047 init1: 975 opt: 1001 Z-score: 1109.3 bits: 215.4 E(32554): 1.8e-55
Smith-Waterman score: 1001; 48.1% identity (76.6% similar) in 308 aa overlap (282-589:345-644)
260 270 280 290 300 310
pF1KA1 TKGWGEEQNHGVKTTQFVPKQYRLVETRGPLCSLRSEKRCSKGKITDTEKMVGIRFENES
: :. . . . . . .: ......:.
CCDS44 SDSVILLKVKDSQTPTPSSTFFQAELWIKELTSVYDSRARERLRQIEEQKALALQLQNQ-
320 330 340 350 360 370
320 330 340 350 360 370
pF1KA1 RRGYQLEPDLSEEVSARLRLGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTED
: . : .. . : .::. :.... . ..: . .:.. :.. :.::.
CCDS44 -RLQEREHSVHDSVELHLRVP------LEKEIPVTVVQETQKKGHKLTDSEDEFPEITEE
380 390 400 410 420
380 390 400 410 420 430
pF1KA1 MEKEISNALGHGPQDEILSSAFKLRITRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQG
:::::.:.. .: :::.:: ::.: ::: :::::.. .:::::.::::::.:.::.:..:
CCDS44 MEKEIKNVFRNGNQDEVLSEAFRLTITRKDIQTLNHLNWLNDEIINFYMNMLMERSKEKG
430 440 450 460 470 480
440 450 460 470 480 490
pF1KA1 YPALHVFSTFFYPKLKSGGYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCL
:..:.:.:::. :::..:::::::::: :..: .:.::::: ::: :.:.:.::: .
CCDS44 LPSVHAFNTFFFTKLKTAGYQAVKRWTKKVDVFSVDILLVPIHLGVHWCLAVVDFRKKNI
490 500 510 520 530 540
500 510 520 530 540 550
pF1KA1 KYLDSMGQKGHRICEILLQYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMF
: :::: ... :.::::::..:: :. .... : : : .:::::.::::::::
CCDS44 TYYDSMGGINNEACRILLQYLKQESIDKKRKEFDTNGWQLFSKKSQEIPQQMNGSDCGMF
550 560 570 580 590 600
560 570 580
pF1KA1 TCKYADYISRDKPITFTQHQMPLFRKKMVWEILHQQLL
.::::: :..:.::.:::..:: :::.:::::::..::
CCDS44 ACKYADCITKDRPINFTQQHMPYFRKRMVWEILHRKLL
610 620 630 640
>>CCDS73958.1 SENP3 gene_id:26168|Hs108|chr17 (574 aa)
initn: 494 init1: 293 opt: 494 Z-score: 548.1 bits: 111.4 E(32554): 3.3e-24
Smith-Waterman score: 494; 34.1% identity (69.4% similar) in 229 aa overlap (361-588:356-572)
340 350 360 370 380 390
pF1KA1 LGSGSNGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALGHGPQDEILS
: .:.: ..... .::. .: .
CCDS73 QTYGSLIPLSTDEVVEKLEDIFQQEFSTPSRKGLVLQLIQSYQRMPGNAMVRG-----FR
330 340 350 360 370 380
400 410 420 430 440
pF1KA1 SAFKLRI-TRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTFFYPKLKSG
:.: .. : :. :: . .::::.:.:.: .:... .. .: :..::: ::..
CCDS73 VAYKRHVLTMDDLGTLYGQNWLNDQVMNMYGDLVMDTVPEK----VHFFNSFFYDKLRTK
390 400 410 420 430
450 460 470 480 490 500
pF1KA1 GYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKGHRICEILL
::..::::::.:..:..:..:.::: .:::::. .:.:.. . :.::. ..: . .
CCDS73 GYDGVKRWTKNVDIFNKELLLIPIHLEVHWSLISVDVRRRTITYFDSQRTLNRRCPKHIA
440 450 460 470 480 490
510 520 530 540 550 560
pF1KA1 QYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISRDKPITFTQ
.::: :. : :.. : ... .. .: : :::: :. .: ... ..:..:::
CCDS73 KYLQAEAVKKDRLDFHQ-GW--KGYFKMNVARQNNDSDCGAFVLQYCKHLALSQPFSFTQ
500 510 520 530 540 550
570 580
pF1KA1 HQMPLFRKKMVWEILHQQLL
..:: .:... :. : .:
CCDS73 QDMPKLRRQIYKELCHCKLTV
560 570
>>CCDS3322.1 SENP5 gene_id:205564|Hs108|chr3 (755 aa)
initn: 443 init1: 250 opt: 488 Z-score: 539.5 bits: 110.2 E(32554): 9.9e-24
Smith-Waterman score: 488; 30.6% identity (63.9% similar) in 291 aa overlap (304-589:475-754)
280 290 300 310 320 330
pF1KA1 RLVETRGPLCSLRSEKRCSKGKITDTEKMVGIRFENE---SRRGYQLEPDLSEEVSARLR
:...::. .. . . : .:..:. :
CCDS33 DGSLKQSILSSELLDHPYCKSPLEAPLVCSGLKLENQVGGGKNSQKASPVDDEQLSVCL-
450 460 470 480 490 500
340 350 360 370 380
pF1KA1 LGSGS-NGLLRRKVSIIETKEKNCSGKERDRRTDDLLELTEDMEKEISNALGHGPQDEIL
:: . .... :.. .::. :. .: ..:. . ...::.: .. . ..
CCDS33 --SGFLDEVMKKYGSLVPLSEKEVLGRLKDVFNEDFSNRKPFINREITNYRARHQKCNFR
510 520 530 540 550 560
390 400 410 420 430 440
pF1KA1 SSAFKLRITRGDIQTLKNYHWLNDEVINFYMNLLVERNKKQGYPALHVFSTFFYPKLKSG
: . :. :: . .::::.:::.: .:... . .: :..::. .: .
CCDS33 IFYNKHMLDMDDLATLDGQNWLNDQVINMYGELIMDAVPDK----VHFFNSFFHRQLVTK
570 580 590 600 610
450 460 470 480 490 500
pF1KA1 GYQAVKRWTKGVNLFEQEIILVPIHRKVHWSLVVIDLRKKCLKYLDSMGQKGHRIC-EIL
::..:::::: :.::.. ..:.::: .:::::... : .. ... ::.: . ..: : .
CCDS33 GYNGVKRWTKKVDLFKKSLLLIPIHLEVHWSLITVTLSNRIISFYDSQGIH-FKFCVENI
620 630 640 650 660 670
510 520 530 540 550 560
pF1KA1 LQYLQDESKTKRNSDLNLLEWTHHSMKPHEIPQQLNGSDCGMFTCKYADYISRDKPITFT
.:: :.. : .. : : : :::: : ::::.:. .: .. ..:. :.
CCDS33 RKYLLTEAREKNRPEF-LQGWQTAVTK--CIPQQKNDSDCGVFVLQYCKCLALEQPFQFS
680 690 700 710 720 730
570 580
pF1KA1 QHQMPLFRKKMVWEILHQQLL
:..:: ::.. :. . .:.
CCDS33 QEDMPRVRKRIYKELCECRLMD
740 750
589 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 20:58:53 2016 done: Wed Nov 2 20:58:54 2016
Total Scan time: 2.710 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]