FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1350, 878 aa
1>>>pF1KSDA1350 878 - 878 aa - 878 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.4914+/-0.000938; mu= 10.6134+/- 0.057
mean_var=115.7560+/-22.747, 0's: 0 Z-trim(108.3): 19 B-trim: 0 in 0/52
Lambda= 0.119207
statistics sampled from 10130 (10139) to 10130 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.665), E-opt: 0.2 (0.311), width: 16
Scan time: 4.020
The best scores are: opt bits E(32554)
CCDS43265.1 USP53 gene_id:54532|Hs108|chr4 (1073) 5970 1038.3 0
CCDS7329.2 USP54 gene_id:159195|Hs108|chr10 (1684) 784 146.4 4e-34
>>CCDS43265.1 USP53 gene_id:54532|Hs108|chr4 (1073 aa)
initn: 5970 init1: 5970 opt: 5970 Z-score: 5549.5 bits: 1038.3 E(32554): 0
Smith-Waterman score: 5970; 99.9% identity (99.9% similar) in 878 aa overlap (1-878:196-1073)
10 20 30
pF1KSD MLERHERFKPEMFAELLQAANTTDDYRKCP
::::::::::::::::::::::::::::::
CCDS43 RSCGASSDPLPFTEFVRYISTTALCNEVERMLERHERFKPEMFAELLQAANTTDDYRKCP
170 180 190 200 210 220
40 50 60 70 80 90
pF1KSD SNCGQKIKIRRVLMNCPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 SNCGQKIKIRRVLMNCPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAK
230 240 250 260 270 280
100 110 120 130 140 150
pF1KSD NSELNLVGMICYTSQHYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 NSELNLVGMICYTSQHYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLL
290 300 310 320 330 340
160 170 180 190 200 210
pF1KSD LFYANPDGTAVSTEDALRQVISWSHYKSVAENMGCEKPVIHKSDNLKENGFGDQAKQREN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LFYANPDGTAVSTEDALRQVISWSHYKSVAENMGCEKPVIHKSDNLKENGFGDQAKQREN
350 360 370 380 390 400
220 230 240 250 260 270
pF1KSD QKFPTDNISSSNRSHSHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQRKD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QKFPTDNISSSNRSHSHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQRKD
410 420 430 440 450 460
280 290 300 310 320 330
pF1KSD LEKGQRKDLGRHRDLVDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVPQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LEKGQRKDLGRHRDLVDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVPQS
470 480 490 500 510 520
340 350 360 370 380 390
pF1KSD RASAQIISSSKSQILAPGEKITGKVKSDNGTGYDTDSSQDSRDRGNSCDSSSKSRNRGWK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 RASAQIISSSKSQILAPGEKITGKVKSDNGTGYDTDSSQDSRDRGNSCDSSSKSRNRGWK
530 540 550 560 570 580
400 410 420 430 440 450
pF1KSD PMRETLNVDSIFSESEKRQHSPRHKPNISNKPKSSKDPSFSNWPKENPKQKGLMTIYEDE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PMRETLNVDSIFSESEKRQHSPRHKPNISNKPKSSKDPSFSNWPKENPKQKGLMTIYEDE
590 600 610 620 630 640
460 470 480 490 500 510
pF1KSD MKQEIGSRSSLESNGKGAEKNKGLVEGKVHGDNWQMQRTESGYESSDHISNGSTNLDSPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MKQEIGSRSSLESNGKGAEKNKGLVEGKVHGDNWQMQRTESGYESSDHISNGSTNLDSPV
650 660 670 680 690 700
520 530 540 550 560 570
pF1KSD IDGNGTVMDISGVKETVCFSDQITTSNLNKERGDCTSLQSQHHLEGFRKELRNLEAGYKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 IDGNGTVMDISGVKETVCFSDQITTSNLNKERGDCTSLQSQHHLEGFRKELRNLEAGYKS
710 720 730 740 750 760
580 590 600 610 620 630
pF1KSD HEFHPESHLQIKNHLIKRSHVHEDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLEKPNEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HEFHPESHLQIKNHLIKRSHVHEDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLEKPNEC
770 780 790 800 810 820
640 650 660 670 680 690
pF1KSD KFSEWLNIENSERTGLPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 KFSEWLNIENSERTGLPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNI
830 840 850 860 870 880
700 710 720 730 740 750
pF1KSD MDQCYFENSLSTECIIRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MDQCYFENSLSTECIIRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPD
890 900 910 920 930 940
760 770 780 790 800 810
pF1KSD VKLTEVFKATSHLPKHRLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTN
:::::::::::::::: :::::::::::::::::::::::::::::::::::::::::::
CCDS43 VKLTEVFKATSHLPKHSLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTN
950 960 970 980 990 1000
820 830 840 850 860 870
pF1KSD DFQANSGAIDAFCQPELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 DFQANSGAIDAFCQPELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESS
1010 1020 1030 1040 1050 1060
pF1KSD GFCNNSLS
::::::::
CCDS43 GFCNNSLS
1070
>>CCDS7329.2 USP54 gene_id:159195|Hs108|chr10 (1684 aa)
initn: 956 init1: 762 opt: 784 Z-score: 726.2 bits: 146.4 E(32554): 4e-34
Smith-Waterman score: 922; 29.2% identity (57.7% similar) in 885 aa overlap (1-834:197-1037)
10 20 30
pF1KSD MLERHERFKPEMFAELLQAANTTDDYRKCP
::::.:. .: ::.:::: :.: : :.::
CCDS73 TSCGATSDPLPFIQMVHYISTTSLCNQAICMLERREKPSPSMFGELLQNASTMGDLRNCP
170 180 190 200 210 220
40 50 60 70 80 90
pF1KSD SNCGQKIKIRRVLMNCPEIVTIGLVWDSEHSDLTEAVVRNLATHLYLPGLFYRVTDENAK
::::..:.::::::: :.:.::::::::.::::.: :...:.: : : ::.::::. ::
CCDS73 SNCGERIRIRRVLMNAPQIITIGLVWDSDHSDLAEDVIHSLGTCLKLGDLFFRVTDDRAK
230 240 250 260 270 280
100 110 120 130 140 150
pF1KSD NSELNLVGMICYTSQHYCAFAFHTKSSKWVFFDDANVKEIGTRWKDVVSKCIRCHFQPLL
.::: ::::::: ..:: .: :.:: ::..::::.::::: .:::::.:::. :.::::
CCDS73 QSELYLVGMICYYGKHYSTFFFQTKIRKWMYFDDAHVKEIGPKWKDVVTKCIKGHYQPLL
290 300 310 320 330 340
160 170 180 190 200
pF1KSD LFYANPDGTAVSTEDALRQVISWSHYKSV--AENMGCEKPVIHKSDNLKENGFGDQAKQR
:.::.:.:: :::.: :. :. .. .:. : : : : .::. ... . ..
CCDS73 LLYADPQGTPVSTQDLPPQAEFQSYSRTCYDSEDSGRE-PSI-SSDTRTDSSTESYPYKH
350 360 370 380 390 400
210 220 230 240 250 260
pF1KSD ENQKFPTDNISSSNRSHSHTGVGKGPAKLSHIDQREKIKDISRECALKAIEQKNLLSSQR
... ....::.... .: . . : .:. . . :: : .:. :
CCDS73 SHHESVVSHFSSDSQGTVIYNVENDSMSQS---SRDTGHLTDSECNQKHTSKKGSL----
410 420 430 440 450
270 280 290 300 310 320
pF1KSD KDLEKGQRKDLGRHRDLVDEDLSHFQSGSPPAPNGFKQHGNPHLYHSQGKGSYKHDRVVP
.:. ... :: : :: . :: . .:.. :. . .: : . .:.
CCDS73 --IER--KRSSGRVRRKGDEPQA---SGYHSEGETLKEKQAPR---NASKPSSSTNRLRD
460 470 480 490 500
330 340 350 360 370
pF1KSD QSRASAQIISSSKSQILAPGEKITGKVKSDNGTGYDTDSSQD----SRD-----RGNSCD
... ...: . : :: .. .. .. .: : . ::: ..
CCDS73 FKETVSNMIHNRPS--LASQTNVGSHCRGRGGDQPDKKPPRTLPLHSRDWEIESTSSESK
510 520 530 540 550 560
380 390 400 410 420
pF1KSD SSSKSRNRG-WKPMRETLNVDSIFSESEKRQH------SPRHK-------PNISNKPKS-
:::.:. : :.: ::.::.:::::. .::.: :: . :. .:: :
CCDS73 SSSSSKYRPTWRPKRESLNIDSIFSK-DKRKHCGYTQLSPFSEDSAKEFIPDEPSKPPSY
570 580 590 600 610 620
430 440 450 460 470
pF1KSD -----SKDPSFSNWPKENPKQKGLMTIYEDEMKQEIGSRSSLESNGKGAEKNKGLVEGKV
. .:... : : .. : . ...: : .:: ..... . . .: :..
CCDS73 DIKFGGPSPQYKRWGPARPGSHLLEQHPRLIQRMESGYESSERNSSSPVSLDAALPESSN
630 640 650 660 670 680
480 490 500 510 520 530
pF1KSD HGDNWQMQRTESGYESSDHISNGSTNLDSPVIDGNGTVMDISGVKETVCFS-DQITTSNL
. . .:. . : :: .. . : ... ..:. ...: .. :: ..:....
CCDS73 VYRDPSAKRSAGLVPSWRHIPKSHS---SSILEVDSTA-SMGGWTKSQPFSGEEISSKSE
690 700 710 720 730 740
540 550 560 570 580 590
pF1KSD NKERGDCTSLQSQHHLEGFRKELRNLEA--GYKSH--EFHPESHLQIKNHL--IKRSHVH
: . .. ..:.. : ::. ..::: :.. : .: ..:: ... ..:: ..
CCDS73 LDELQEEVARRAQEQ-ELRRKREKELEAAKGFNPHPSRFMDLDELQNQGRSDGFERS-LQ
750 760 770 780 790
600 610 620 630 640
pF1KSD EDNGKLFPSSSLQIPKDHNAREHIHQSDEQKLE---KPNECK------FSEWLNIENSER
: .. . : :. : : . . .::. . :. .. :.: .
CCDS73 EAESVFEESLHLEQKGDCAAALALCNEAISKLRLALHGASCSTHSRALVDKKLQISIRKA
800 810 820 830 840 850
650 660 670 680 690 700
pF1KSD TGLPFHVDNSASGKRVNSNEPSSLWSSHLRTVGLKPETAPLIQQQNIMDQCYFENSLSTE
.: ..... : .. ..::. .. :.. :. : . .. .:....::
CCDS73 RSLQDRMQQQQSPQQ--PSQPSACLPTQAGTLSQPTSEQPIPLQVLLSQEAQLESGMDTE
860 870 880 890 900 910
710 720 730 740 750 760
pF1KSD CIIRSASRSDGCQMPKLFCQNLPPPLPPKKYAITSVPQSEKSESTPDVKLTEVFKATSHL
: .: . :.. : :. .:.:: ..: : .:: .. .
CCDS73 FGASSFFHSPAS------CHESHSSLSPE----SSAPQ-HSSPSRSALKLLTSVEVDNIE
920 930 940 950 960
770 780 790 800 810
pF1KSD PK--HRLSTASEPSLEVSTHMNDERHKETFQVRECFGNTPNCPSSSSTN-DFQANSG-AI
:. :: . . :. :. :... : ... : . : .:: .. : . : :
CCDS73 PSAFHRQGLPKAPGW---TEKNSHHSWEPLDAPEGKLQGSRCDNSSCSKLPPQEGRGIAQ
970 980 990 1000 1010 1020
820 830 840 850 860 870
pF1KSD DAFCQPELDSISTCPNETVSLTTYFSVDSCMTDTYRLKYHQRPKLSFPESSGFCNNSLS
. . : . : . :
CCDS73 EQLFQEKKDPANPSPVMPGIATSERGDEHSLGCSPSNSSAQPSLPLYRTCHPIMPVASSF
1030 1040 1050 1060 1070 1080
878 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 05:57:27 2016 done: Thu Nov 3 05:57:28 2016
Total Scan time: 4.020 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]