FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5723, 814 aa
1>>>pF1KE5723 814 - 814 aa - 814 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.0669+/-0.00113; mu= 12.0480+/- 0.068
mean_var=101.5339+/-20.233, 0's: 0 Z-trim(105.0): 51 B-trim: 426 in 1/50
Lambda= 0.127282
statistics sampled from 8125 (8169) to 8125 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.606), E-opt: 0.2 (0.251), width: 16
Scan time: 4.050
The best scores are: opt bits E(32554)
CCDS34501.1 USP45 gene_id:85015|Hs108|chr6 ( 814) 5373 997.9 0
CCDS42912.1 USP16 gene_id:10600|Hs108|chr21 ( 822) 1479 282.8 1.6e-75
CCDS13583.1 USP16 gene_id:10600|Hs108|chr21 ( 823) 1479 282.8 1.6e-75
>>CCDS34501.1 USP45 gene_id:85015|Hs108|chr6 (814 aa)
initn: 5373 init1: 5373 opt: 5373 Z-score: 5334.1 bits: 997.9 E(32554): 0
Smith-Waterman score: 5373; 100.0% identity (100.0% similar) in 814 aa overlap (1-814:1-814)
10 20 30 40 50 60
pF1KE5 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 VCSECLKERRFYDGQLVLTSDIWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCIIINL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 VCSECLKERRFYDGQLVLTSDIWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCIIINL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 STWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKTQTSAFSRIMKLCEEKCETDEIQK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 STWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKTQTSAFSRIMKLCEEKCETDEIQK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLMNEIKESSTKLKIFPSSDSQLDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLMNEIKESSTKLKIFPSSDSQLDP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 LVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQLCQKAPRFKDFQQQDSQELLHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQLCQKAPRFKDFQQQDSQELLHY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 LLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVKAYGKEGVKMNFIDRIFIGELTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVKAYGKEGVKMNFIDRIFIGELTS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 TVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRMNKYRSLRETDHDRYSGNVTIEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 TVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRMNKYRSLRETDHDRYSGNVTIEN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 IHQPRAAKKHSSSKDKSQLIHDRKCIRKLSSGETVTYQKNENLEMNGDSLMFASLMNSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 IHQPRAAKKHSSSKDKSQLIHDRKCIRKLSSGETVTYQKNENLEMNGDSLMFASLMNSES
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE5 RLNESPTDDSEKEASHSESNVDADSEPSESESASKQTGLFRSSSGSGVQPDGPLYPLSAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 RLNESPTDDSEKEASHSESNVDADSEPSESESASKQTGLFRSSSGSGVQPDGPLYPLSAG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE5 KLLYTKETDSGDKEMAEAISELRLSSTVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KLLYTKETDSGDKEMAEAISELRLSSTVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE5 QNAFQTLSQSYITTSKECSIQSCLYQFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 QNAFQTLSQSYITTSKECSIQSCLYQFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE5 KVEGVYTNARKQLLISAVPAVLILHLKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 KVEGVYTNARKQLLISAVPAVLILHLKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCK
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE5 NASVGDKVLYGLYGIVEHSGSMREGHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 NASVGDKVLYGLYGIVEHSGSMREGHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNES
730 740 750 760 770 780
790 800 810
pF1KE5 AGQWVHVSDTYLQVVPESRALSAQAYLLFYERVL
::::::::::::::::::::::::::::::::::
CCDS34 AGQWVHVSDTYLQVVPESRALSAQAYLLFYERVL
790 800 810
>>CCDS42912.1 USP16 gene_id:10600|Hs108|chr21 (822 aa)
initn: 1711 init1: 507 opt: 1479 Z-score: 1469.5 bits: 282.8 E(32554): 1.6e-75
Smith-Waterman score: 1906; 38.6% identity (69.4% similar) in 836 aa overlap (15-814:4-822)
10 20 30 40 50 60
pF1KE5 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS
::.: ::: : :::. . .:.:. ... ...:.:... :.
CCDS42 MGKKRTKGKTVPID-DSSETLEP--VCRHIRKGLEQGNLKKALVNVEWN
10 20 30 40
70 80 90 100 110
pF1KE5 VCSECLKERRFYDGQLVLTSD---IWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCII
.:..: . . : : . .::::::: ::::.::. ::.:::. . :.::::..
CCDS42 ICQDCKTDNKVKDKAEEETEEKPSVWLCLKCGHQGCGRNSQEQHALKHYLTPRSEPHCLV
50 60 70 80 90 100
120 130 140 150 160
pF1KE5 INLSTWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKT-------------QTSAFSR
..:..: .::: ::.... .:... :.:.::...:.:: : ... . .
CCDS42 LSLDNWSVWCYVCDNEVQ-YCSSNQLGQVVDYVRKQASITTPKPEKDNGNIELENKKLEK
110 120 130 140 150 160
170 180 190 200 210
pF1KE5 IMKLCEEKCETDEIQK-----GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLMN
: .:. . ... : .. :. ..:.:..:::::::::::::::.:: .: .:..
CCDS42 ESKNEQEREKKENMAKENPPMNSPCQ-ITVKGLSNLGNTCFFNAVMQNLSQTPVLRELLK
170 180 190 200 210 220
220 230 240 250 260 270
pF1KE5 EIKESSTKLKIFPSSDSQLDPLVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQL
:.: :.: .:: : . . .:: ..: ::::: :. ::. :.::.:: ..:: ::.:.
CCDS42 EVKMSGTIVKIEPPDLALTEPLEINLEPPGPLTLAMSQFLNEMQETKKGVVTPKELFSQV
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE5 CQKAPRFKDFQQQDSQELLHYLLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVKA
:.:: ::: .:::::::::.::::..:.:: .:.. .:::::.: : : :.: ..:::
CCDS42 CKKAVRFKGYQQQDSQELLRYLLDGMRAEEHQRVSKGILKAFGNSTEKL-DEELKNKVKD
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE5 YGKEGVKMNFIDRIFIGELTSTVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRMN
: :. .:.:::: ::::: .::..: ..: :.. :.:.:::..... .: . . :
CCDS42 YEKKKSMPSFVDRIFGGELTSMIMCDQCRTVSLVHESFLDLSLPVLDDQSGKKSVNDK-N
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE5 KYRSLRETDHD----RYSGNVTIENIHQPRAAKKHSSSKDKSQLIHDRKCIRKLSS--GE
..... :.: . . . : : ...:: ..: :.: .. : :. .. :.
CCDS42 LKKTVEDEDQDSEEEKDNDSYIKERSDIPSGTSKHLQKKAKKQAKKQAKNQRRQQKIQGK
410 420 430 440 450 460
460 470 480 490 500 510
pF1KE5 TVTYQKNENLEMNGDSLMFASLMNSESRLNESPTDDSEKEASHSESNV---DADSEPSES
.. . ... :: . . :. ....: . . :.. . :.: : : ... .
CCDS42 VLHLNDICTIDHPEDS-EYEAEMSLQGEVNIKSNHISQEGVMHKEYCVNQKDLNGQAKMI
470 480 490 500 510 520
520 530 540 550 560
pF1KE5 ESASKQTGLFRSSSGSGVQPDGPLYPLSAGKL-----LYTKETDSGDKEMAEAISELRLS
::.. . . . .... :. : :... : : ..:. ........: :.
CCDS42 ESVTDNQKSTEEVDMKNINMDNDLEVLTSSPTRNLNGAYLTEGSNGEVDISNGFKNLNLN
530 540 550 560 570 580
570 580 590 600 610 620
pF1KE5 STVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSPQNAFQTLSQSYITTSKECSIQSCLY
... :. . . :: :.. . .. . .:..:: ::.. . .. ::::: :::
CCDS42 AALHPDEI---NIEILNDSHTPG-TKVYEVVNEDPETAFCTLANREVFNTDECSIQHCLY
590 600 610 620 630
630 640 650 660 670 680
pF1KE5 QFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEKKVEGVYTNARKQLLISAVPAVLILH
::: : : :::::: ::. . . . . .:.: :::::.::.::: .: :: ::
CCDS42 QFTRNEKLRDANKLLCEVCTRRQCNGPKANIKGERK--HVYTNAKKQMLISLAPPVLTLH
640 650 660 670 680 690
690 700 710 720 730 740
pF1KE5 LKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCKN-ASVGDKVLYGLYGIVEHSGSMRE
::::.:::..:::::.:. :: .:::::::. ::: : . .:::.:::.:::::.::
CCDS42 LKRFQQAGFNLRKVNKHIKFPEILDLAPFCTLKCKNVAEENTRVLYSLYGVVEHSGTMRS
700 710 720 730 740 750
750 760 770 780 790 800
pF1KE5 GHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNESAGQWVHVSDTYLQVVPESRALSAQ
::::::.:.:: . .:: . . . ..: . . :: ::: :.:::..:.:: ...:..:
CCDS42 GHYTAYAKARTANSHLS-NLVLHGDIP--QDFEMESKGQWFHISDTHVQAVPTTKVLNSQ
760 770 780 790 800 810
810
pF1KE5 AYLLFYERVL
::::::::.:
CCDS42 AYLLFYERIL
820
>>CCDS13583.1 USP16 gene_id:10600|Hs108|chr21 (823 aa)
initn: 1711 init1: 507 opt: 1479 Z-score: 1469.5 bits: 282.8 E(32554): 1.6e-75
Smith-Waterman score: 1904; 38.6% identity (69.3% similar) in 837 aa overlap (15-814:4-823)
10 20 30 40 50 60
pF1KE5 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS
::.: ::: : :::. . .:.:. ... ...:.:... :.
CCDS13 MGKKRTKGKTVPID-DSSETLEP--VCRHIRKGLEQGNLKKALVNVEWN
10 20 30 40
70 80 90 100 110
pF1KE5 VCSECLKERRFYDGQLVLTSD---IWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCII
.:..: . . : : . .::::::: ::::.::. ::.:::. . :.::::..
CCDS13 ICQDCKTDNKVKDKAEEETEEKPSVWLCLKCGHQGCGRNSQEQHALKHYLTPRSEPHCLV
50 60 70 80 90 100
120 130 140 150 160
pF1KE5 INLSTWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKT--------------QTSAFS
..:..: .::: ::.... .:... :.:.::...:.:: : ... .
CCDS13 LSLDNWSVWCYVCDNEVQ-YCSSNQLGQVVDYVRKQASITTPKPAEKDNGNIELENKKLE
110 120 130 140 150 160
170 180 190 200 210
pF1KE5 RIMKLCEEKCETDEIQK-----GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLM
. : .:. . ... : .. :. ..:.:..:::::::::::::::.:: .: .:.
CCDS13 KESKNEQEREKKENMAKENPPMNSPCQ-ITVKGLSNLGNTCFFNAVMQNLSQTPVLRELL
170 180 190 200 210 220
220 230 240 250 260 270
pF1KE5 NEIKESSTKLKIFPSSDSQLDPLVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQ
.:.: :.: .:: : . . .:: ..: ::::: :. ::. :.::.:: ..:: ::.:
CCDS13 KEVKMSGTIVKIEPPDLALTEPLEINLEPPGPLTLAMSQFLNEMQETKKGVVTPKELFSQ
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE5 LCQKAPRFKDFQQQDSQELLHYLLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVK
.:.:: ::: .:::::::::.::::..:.:: .:.. .:::::.: : : :.: ..:::
CCDS13 VCKKAVRFKGYQQQDSQELLRYLLDGMRAEEHQRVSKGILKAFGNSTEKL-DEELKNKVK
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE5 AYGKEGVKMNFIDRIFIGELTSTVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRM
: :. .:.:::: ::::: .::..: ..: :.. :.:.:::..... .: . .
CCDS13 DYEKKKSMPSFVDRIFGGELTSMIMCDQCRTVSLVHESFLDLSLPVLDDQSGKKSVNDK-
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE5 NKYRSLRETDHD----RYSGNVTIENIHQPRAAKKHSSSKDKSQLIHDRKCIRKLSS--G
: ..... :.: . . . : : ...:: ..: :.: .. : :. .. :
CCDS13 NLKKTVEDEDQDSEEEKDNDSYIKERSDIPSGTSKHLQKKAKKQAKKQAKNQRRQQKIQG
410 420 430 440 450 460
460 470 480 490 500
pF1KE5 ETVTYQKNENLEMNGDSLMFASLMNSESRLNESPTDDSEKEASHSESNV---DADSEPSE
... . ... :: . . :. ....: . . :.. . :.: : : ... .
CCDS13 KVLHLNDICTIDHPEDS-EYEAEMSLQGEVNIKSNHISQEGVMHKEYCVNQKDLNGQAKM
470 480 490 500 510 520
510 520 530 540 550 560
pF1KE5 SESASKQTGLFRSSSGSGVQPDGPLYPLSAGKL-----LYTKETDSGDKEMAEAISELRL
::.. . . . .... :. : :... : : ..:. ........: :
CCDS13 IESVTDNQKSTEEVDMKNINMDNDLEVLTSSPTRNLNGAYLTEGSNGEVDISNGFKNLNL
530 540 550 560 570 580
570 580 590 600 610 620
pF1KE5 SSTVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSPQNAFQTLSQSYITTSKECSIQSCL
.... :. . . :: :.. . .. . .:..:: ::.. . .. ::::: ::
CCDS13 NAALHPDEI---NIEILNDSHTPG-TKVYEVVNEDPETAFCTLANREVFNTDECSIQHCL
590 600 610 620 630
630 640 650 660 670 680
pF1KE5 YQFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEKKVEGVYTNARKQLLISAVPAVLIL
:::: : : :::::: ::. . . . . .:.: :::::.::.::: .: :: :
CCDS13 YQFTRNEKLRDANKLLCEVCTRRQCNGPKANIKGERK--HVYTNAKKQMLISLAPPVLTL
640 650 660 670 680 690
690 700 710 720 730 740
pF1KE5 HLKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCKN-ASVGDKVLYGLYGIVEHSGSMR
:::::.:::..:::::.:. :: .:::::::. ::: : . .:::.:::.:::::.::
CCDS13 HLKRFQQAGFNLRKVNKHIKFPEILDLAPFCTLKCKNVAEENTRVLYSLYGVVEHSGTMR
700 710 720 730 740 750
750 760 770 780 790 800
pF1KE5 EGHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNESAGQWVHVSDTYLQVVPESRALSA
::::::.:.:: . .:: . . . ..: . . :: ::: :.:::..:.:: ...:..
CCDS13 SGHYTAYAKARTANSHLS-NLVLHGDIP--QDFEMESKGQWFHISDTHVQAVPTTKVLNS
760 770 780 790 800 810
810
pF1KE5 QAYLLFYERVL
:::::::::.:
CCDS13 QAYLLFYERIL
820
814 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 06:06:10 2016 done: Tue Nov 8 06:06:11 2016
Total Scan time: 4.050 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]