FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3322, 913 aa
1>>>pF1KE3322 913 - 913 aa - 913 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9687+/-0.00106; mu= 12.6188+/- 0.063
mean_var=95.5211+/-19.052, 0's: 0 Z-trim(105.6): 81 B-trim: 0 in 0/49
Lambda= 0.131227
statistics sampled from 8416 (8497) to 8416 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.63), E-opt: 0.2 (0.261), width: 16
Scan time: 2.880
The best scores are: opt bits E(32554)
CCDS14635.1 USP26 gene_id:83844|Hs108|chrX ( 913) 6036 1153.8 0
CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 ( 922) 1690 331.0 6.2e-90
CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 ( 979) 1064 212.5 3.1e-54
>>CCDS14635.1 USP26 gene_id:83844|Hs108|chrX (913 aa)
initn: 6036 init1: 6036 opt: 6036 Z-score: 6174.8 bits: 1153.8 E(32554): 0
Smith-Waterman score: 6036; 99.9% identity (99.9% similar) in 913 aa overlap (1-913:1-913)
10 20 30 40 50 60
pF1KE3 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYSTFRLSDNIQNVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYSTFRLSDNIQNVV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 LKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVFS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 STTQKEINKTSFHKVDEKSSSKSFEIAKGSGTGVLQRMPLLTSKLTLTCGELSENQHKKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 STTQKEINKTSFHKVDEKSSSKSFEIAKGSGTGVLQRMPLLTSKLTLTCGELSENQHKKR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 KRMLSSSSEMNEEFLKENNSVEYKKSKADCSRCVSYNREKQLKLKELEENKKLECESSCI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 KRMLSSSSEMNEEFLKENNSVEYKKSKADCSRCVSYNREKQLKLKELEENKKLECESSCI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 MNATGNPYLDDIGLLQALTEKMVLVFLLQQGYSDGYTKWDKLKLFFELFPEKICHGLPNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MNATGNPYLDDIGLLQALTEKMVLVFLLQQGYSDGYTKWDKLKLFFELFPEKICHGLPNL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 GNTCYMNAVLQSLLSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GNTCYMNAVLQSLLSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEML
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 LLNLKKAISAAAEIFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LLNLKKAISAAAEIFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 FADDPDTSGFSCPVITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKAHPSSIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 FADDPDTSGFSCPVITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKAHPSSIQ
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 STFDLFFGAEELEYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALKKNDQEVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 STFDLFFGAEELEYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALKKNDQEVI
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 ISKYLKVSSHCNEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATKESKDILAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ISKYLKVSSHCNEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATKESKDILAP
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 HIGSDKESEQKKGQTVFKGASRRQQQKYLGKNSKPNELESVYSGDRAFIEKEPLAHLMTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 HIGSDKESEQKKGQTVFKGASRRQQQKYLGKNSKPNELESVYSGDRAFIEKEPLAHLMTY
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 LEDTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKNVKTSKFVAFDRIINPTKDL
:::::::::::::::::::::::::::::::::::::::: :::::::::::::::::::
CCDS14 LEDTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKYVKTSKFVAFDRIINPTKDL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 YEDKNIRIPERFQKVSEQTQQCDGMRICEQAPQQALPQSFPKPGTQGHTKNLLRPTKLNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 YEDKNIRIPERFQKVSEQTQQCDGMRICEQAPQQALPQSFPKPGTQGHTKNLLRPTKLNL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 QKSNRNSLLALGSNKNPRNKDILDKIKSKAKETKRNDDKGDHTYRLISVVSHLGKTLKSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 QKSNRNSLLALGSNKNPRNKDILDKIKSKAKETKRNDDKGDHTYRLISVVSHLGKTLKSG
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 HYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEIFEEMLKREENAQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 HYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEIFEEMLKREENAQ
850 860 870 880 890 900
910
pF1KE3 LNSKEVEETLQKE
:::::::::::::
CCDS14 LNSKEVEETLQKE
910
>>CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 (922 aa)
initn: 2104 init1: 1067 opt: 1690 Z-score: 1728.1 bits: 331.0 E(32554): 6.2e-90
Smith-Waterman score: 2399; 46.4% identity (70.7% similar) in 920 aa overlap (1-905:1-904)
10 20 30 40 50
pF1KE3 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKY-STFRLSDNIQNV
: .: . ::.:: . :::..: :::.::.:.:.:. .::. :::::. :.::.::..:
CCDS33 MISLKVCGFIQIWSQKTGMTKLKEALIETVQRQKEIKLVVTFKSGKFIRIFQLSNNIRSV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 VLKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVF
::. . :.::.:::.:: :::. :: ::.::..::: .:::. : :.. :::
CCDS33 VLRHCKKRQSHLRLTLKNNVFLFIDKLSYRDAKQLNMFLDIIHQNKSQQPMKSDDDWSVF
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 SSTTQ-KEINKTSFHKVDEKSSSKSFEIAKGSGTGVLQRMPLLTSKLTLTCGE-LSENQH
: .. :::.::::... .: : :.:::. :: . . :::
CCDS33 ESRNMLKEIDKTSFYSICNKPS--------------YQKMPLFMSKSPTHVKKGILENQG
130 140 150 160
180 190 200 210 220 230
pF1KE3 KKRKRMLSSSSEMNEEFLKENNSVEYKKSKADCSRCVSYNREKQLKLKELEENKKLECES
: . :::. . ::..:::.: : :: :.: . .. ::.. .:..::... :.
CCDS33 GKGQNTLSSDVQTNEDILKEDNPVPNKKYKTDSLKYIQSNRKNPSSLEDLEKDRDLKLGP
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE3 SCIMNATGNPYLDDIGL-LQALTEKMVLVFLLQQGYSDGYTKWDKLKLFFELFPEKICHG
: : .::: ::. : :.:. : :. :. .:.: . .: .. .. ... .:
CCDS33 SFNTNCNGNPNLDETVLATQTLNAKNGLTSPLEPEHSQGDPRCNKAQVPLDSHSQQLQQG
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE3 LPNLGNTCYMNAVLQSLLSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEI
.::::::::::::::::..:::::::::.:. :: ::..:: : :..:: .:: . .:
CCDS33 FPNLGNTCYMNAVLQSLFAIPSFADDLLTQGVPWEYIPFEALIMTLTQLLALKDFCSTKI
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE3 KEMLLLNLKKAISAAAEIFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNF
:. :: :.::.:::.:::: :: ::::::::..::::::..:::::. . .: :..:
CCDS33 KRELLGNVKKVISAVAEIFSGNMQNDAHEFLGQCLDQLKEDMEKLNATLNTGKECGDENS
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE3 PKQVFADDPDTSGFSCPVITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKAHP
:. . . :. : :::..:::.:: :. :::::...::.: :::::::: :. : :
CCDS33 SPQMHVGSAATKVFVCPVVANFEFELQLSLICKACGHAVLKVEPNNYLSINLHQETKPLP
410 420 430 440 450 460
480 490 500 510 520 530
pF1KE3 SSIQSTFDLFFGAEELEYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALKKND
:::...:::: :::::.: :..:. :. :.:::: :.::.::::::.:. : ::.
CCDS33 LSIQNSLDLFFKEEELEYNCQMCKQKSCVARHTFSRLSRVLIIHLKRYSFNNAWLLVKNN
470 480 490 500 510 520
540 550 560 570 580 590
pF1KE3 QEVIISKYLKVSSHCNEGTRPPLPLSEDGEITDFQLLKVIRKMTS---GNISVSWPATKE
..: : : :..::.:::.:.:::::: .. . ..:.: ..: : . .. : :.:
CCDS33 EQVYIPKSLSLSSYCNESTKPPLPLSSSAPVGKCEVLEVSQEMISEINSPLTPSMKLTSE
530 540 550 560 570 580
600 610 620 630 640 650
pF1KE3 SKDILAPHIGSDKESEQKKGQTVFKGASRRQQQKYLGKNSKPNELESVYSGDRAFIEKE-
:.: :. . ::... .. : ::..:.:. : .:.. : : :. :::. :::
CCDS33 SSDSLVLPVEPDKNADLQRFQRDCGDASQEQHQRDL-ENGSALESELVHFRDRAIGEKEL
590 600 610 620 630 640
660 670 680 690 700 710
pF1KE3 PLAHLMTYLEDTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKNVKTSKFVAF--
:.: . : :: ... ::: ::: : : .: .: ::..:. .: ::. :: :
CCDS33 PVADSLMDQGDISLPVMYEDGGKLISSPDTRLVEVHLQEVPQHPELQKYEKTNTFVEFNF
650 660 670 680 690 700
720 730 740 750 760 770
pF1KE3 DRIINPTKDLYEDKNIRIPERFQKVSEQTQQCDGMRICEQAPQQALPQSFPKPGTQGHTK
: . . :. .:. :. :::: : ..:: ::: : .. ::: : . : .: ::.
CCDS33 DSVTESTNGFYDCKENRIPEGSQGMAEQLQQCIEESIIDEFLQQAPPPGVRKLDAQEHTE
710 720 730 740 750 760
780 790 800 810 820
pF1KE3 NLL-RPTKLNLQKSNRNSLLALGSNKNPRNKDILD--KIKSKAKETKRNDDKGD--HTYR
. : . :.: :::.. : : ::::. :: ::.::: . ...::: :: :: ..::
CCDS33 ETLNQSTELRLQKADLNHLGALGSD-NPGNKNILDAENTRGEAKELTRNVKMGDPLQAYR
770 780 790 800 810 820
830 840 850 860 870 880
pF1KE3 LISVVSHLGKTLKSGHYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMH
:::::::.:.. .::::: :.:::.:: ::::.:. : :.:..::: : .::::::::
CCDS33 LISVVSHIGSSPNSGHYISDVYDFQKQAWFTYNDLCVSEISETKMQEARLHSGYIFFYMH
830 840 850 860 870 880
890 900 910
pF1KE3 NEIFEEMLKREENAQLNSKEVEETLQKE
: ::::.:.. ::..: : .
CCDS33 NGIFEELLRKAENSRLPSTQAGVIPQGEYEGDSLYRPA
890 900 910 920
>>CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 (979 aa)
initn: 1678 init1: 507 opt: 1064 Z-score: 1087.1 bits: 212.5 E(32554): 3.1e-54
Smith-Waterman score: 2096; 42.5% identity (66.8% similar) in 968 aa overlap (16-912:16-977)
10 20 30 40 50
pF1KE3 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYST-FRLSDNIQNV
.:::.: ::. .: ::...: ::.....: :.:: ::.::
CCDS24 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 VLKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVF
::. ..:..: ::::.:. : :. . : :::....::: ::::.. ..:..:.. :
CCDS24 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF
70 80 90 100 110 120
120 130 140 150
pF1KE3 -----SSTTQKEINKTSFHKVDEKSSSK--SFEI-------------AKGS-----GTGV
: :.::: .. .. :...:.: :.: ..:: :.:.
CCDS24 GAILGSRTSQKETSR-QLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGI
130 140 150 160 170
160 170 180 190 200 210
pF1KE3 LQRMPLLTSKLTLTCGELSENQHKKRKRMLSSSSEMNEEFLKENNSVEYKKSKADCSRC-
. .: ::: : . : ::. .:::::.:..::.::.. :::.: .:. .: ::
CCDS24 ARTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKY
180 190 200 210 220 230
220 230 240 250 260
pF1KE3 VSYNREKQLKLKELEENKK---LECESSCIM--------NATGNPYLDDIGLL-QALTEK
.. .:::::.::. :::. : .:: .. ...:. :: .. :. . :
CCDS24 LTSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAK
240 250 260 270 280 290
270 280 290 300 310
pF1KE3 MVLVFLLQQ--------GYSDGYTKWDKLKLFFELFPEKICHGLPNLGNTCYMNAVLQSL
: :: : .. :: :.: .. . .. .:. ::::::::::.::::
CCDS24 RSLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSL
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE3 LSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEMLLLNLKKAISAAAE
.:. :::.:::.:..:: ::::::: .:.:: :: : : :. :: ..:.::::.::
CCDS24 FSLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAE
360 370 380 390 400 410
380 390 400 410 420 430
pF1KE3 IFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQVFADDPDTSGFSCP
: : ::::::::..::::::..::::: :: . ::.: : : : ...::
CCDS24 RFSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPVSGEENSP-----DISATRAYTCP
420 430 440 450 460 470
440 450 460 470 480 490
pF1KE3 VITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKA-HPSSIQSTFDLFFGAEEL
::::.:.:. ::: :::::..: : : : :::.::.: : : :::...:::: ::::
CCDS24 VITNLEFEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEEL
480 490 500 510 520 530
500 510 520 530 540 550
pF1KE3 EYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALK-KNDQEVIISKYLKVSSHC
::.: :: : .. :.:.::::.::.::::::.: .:. : :.::: .:: .::::
CCDS24 EYSCEKCGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHC
540 550 560 570 580 590
560 570 580 590 600
pF1KE3 NEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATK---ESKDILAPHIGSDKES
.:.:.::. :. ..... . ::. . ..: : : :. : .::. :: . ::.:.
CCDS24 TENTKPPFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSED
600 610 620 630 640 650
610 620 630 640 650
pF1KE3 EQKKG----QTVFKGASRRQQQKYLGKNSK-----PNELESVYSGDRAFIEKEPLAHLMT
: :.. : . . . .:::. : :.:: :.. : :: . :.: :: ..
CCDS24 ELKRSVALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDRMSEEELLAAVLE
660 670 680 690 700 710
660 670 680 690 700 710
pF1KE3 YLE-DTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKNVKTSKFVAFD--RIINP
. :.: :. ::.::: : ... :.: .:::: .. : . .. .: . .
CCDS24 ISKRDASPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTEI
720 730 740 750 760 770
720 730 740 750 760 770
pF1KE3 TKDLYEDKNIRIPERFQKVSEQTQQCDGMRI-CEQAPQQALPQSFPKPGT--QGHTKNLL
::: :.:. . :: : . :: : : :: :::: ::. . . : . .:
CCDS24 TKDCDENKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDLK
780 790 800 810 820 830
780 790 800 810 820
pF1KE3 RPTKLNLQKSNRNSLLALGSNKNPRNKDILDK--IKSKAKETKRNDDKGD--HTYRLISV
: :.:.::. : . . ::::... :.:..: ...:.: ::: . :. :.::::::
CCDS24 RATELSLQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLISV
840 850 860 870 880 890
830 840 850 860 870 880
pF1KE3 VSHLGKTLKSGHYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEIF
:::.:.: .::::: :.::..:: ::::.:..: :::: .: :: .::::::::.:::
CCDS24 VSHIGSTSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEIF
900 910 920 930 940 950
890 900 910
pF1KE3 EEMLKREENAQLNSKEVEETLQKE
.:.:. :.:.: : :: .: ..
CCDS24 DELLETEKNSQSLSTEVGKTTRQAL
960 970
913 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 06:26:47 2016 done: Tue Nov 8 06:26:47 2016
Total Scan time: 2.880 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]