FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5723, 814 aa 1>>>pF1KE5723 814 - 814 aa - 814 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0669+/-0.00113; mu= 12.0480+/- 0.068 mean_var=101.5339+/-20.233, 0's: 0 Z-trim(105.0): 51 B-trim: 426 in 1/50 Lambda= 0.127282 statistics sampled from 8125 (8169) to 8125 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.606), E-opt: 0.2 (0.251), width: 16 Scan time: 4.050 The best scores are: opt bits E(32554) CCDS34501.1 USP45 gene_id:85015|Hs108|chr6 ( 814) 5373 997.9 0 CCDS42912.1 USP16 gene_id:10600|Hs108|chr21 ( 822) 1479 282.8 1.6e-75 CCDS13583.1 USP16 gene_id:10600|Hs108|chr21 ( 823) 1479 282.8 1.6e-75 >>CCDS34501.1 USP45 gene_id:85015|Hs108|chr6 (814 aa) initn: 5373 init1: 5373 opt: 5373 Z-score: 5334.1 bits: 997.9 E(32554): 0 Smith-Waterman score: 5373; 100.0% identity (100.0% similar) in 814 aa overlap (1-814:1-814) 10 20 30 40 50 60 pF1KE5 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 VCSECLKERRFYDGQLVLTSDIWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCIIINL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VCSECLKERRFYDGQLVLTSDIWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCIIINL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 STWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKTQTSAFSRIMKLCEEKCETDEIQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 STWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKTQTSAFSRIMKLCEEKCETDEIQK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLMNEIKESSTKLKIFPSSDSQLDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLMNEIKESSTKLKIFPSSDSQLDP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 LVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQLCQKAPRFKDFQQQDSQELLHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQLCQKAPRFKDFQQQDSQELLHY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 LLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVKAYGKEGVKMNFIDRIFIGELTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 LLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVKAYGKEGVKMNFIDRIFIGELTS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 TVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRMNKYRSLRETDHDRYSGNVTIEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRMNKYRSLRETDHDRYSGNVTIEN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 IHQPRAAKKHSSSKDKSQLIHDRKCIRKLSSGETVTYQKNENLEMNGDSLMFASLMNSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 IHQPRAAKKHSSSKDKSQLIHDRKCIRKLSSGETVTYQKNENLEMNGDSLMFASLMNSES 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 RLNESPTDDSEKEASHSESNVDADSEPSESESASKQTGLFRSSSGSGVQPDGPLYPLSAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RLNESPTDDSEKEASHSESNVDADSEPSESESASKQTGLFRSSSGSGVQPDGPLYPLSAG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 KLLYTKETDSGDKEMAEAISELRLSSTVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KLLYTKETDSGDKEMAEAISELRLSSTVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 QNAFQTLSQSYITTSKECSIQSCLYQFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QNAFQTLSQSYITTSKECSIQSCLYQFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEK 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE5 KVEGVYTNARKQLLISAVPAVLILHLKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 KVEGVYTNARKQLLISAVPAVLILHLKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCK 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE5 NASVGDKVLYGLYGIVEHSGSMREGHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 NASVGDKVLYGLYGIVEHSGSMREGHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNES 730 740 750 760 770 780 790 800 810 pF1KE5 AGQWVHVSDTYLQVVPESRALSAQAYLLFYERVL :::::::::::::::::::::::::::::::::: CCDS34 AGQWVHVSDTYLQVVPESRALSAQAYLLFYERVL 790 800 810 >>CCDS42912.1 USP16 gene_id:10600|Hs108|chr21 (822 aa) initn: 1711 init1: 507 opt: 1479 Z-score: 1469.5 bits: 282.8 E(32554): 1.6e-75 Smith-Waterman score: 1906; 38.6% identity (69.4% similar) in 836 aa overlap (15-814:4-822) 10 20 30 40 50 60 pF1KE5 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS ::.: ::: : :::. . .:.:. ... ...:.:... :. CCDS42 MGKKRTKGKTVPID-DSSETLEP--VCRHIRKGLEQGNLKKALVNVEWN 10 20 30 40 70 80 90 100 110 pF1KE5 VCSECLKERRFYDGQLVLTSD---IWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCII .:..: . . : : . .::::::: ::::.::. ::.:::. . :.::::.. CCDS42 ICQDCKTDNKVKDKAEEETEEKPSVWLCLKCGHQGCGRNSQEQHALKHYLTPRSEPHCLV 50 60 70 80 90 100 120 130 140 150 160 pF1KE5 INLSTWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKT-------------QTSAFSR ..:..: .::: ::.... .:... :.:.::...:.:: : ... . . CCDS42 LSLDNWSVWCYVCDNEVQ-YCSSNQLGQVVDYVRKQASITTPKPEKDNGNIELENKKLEK 110 120 130 140 150 160 170 180 190 200 210 pF1KE5 IMKLCEEKCETDEIQK-----GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLMN : .:. . ... : .. :. ..:.:..:::::::::::::::.:: .: .:.. CCDS42 ESKNEQEREKKENMAKENPPMNSPCQ-ITVKGLSNLGNTCFFNAVMQNLSQTPVLRELLK 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE5 EIKESSTKLKIFPSSDSQLDPLVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQL :.: :.: .:: : . . .:: ..: ::::: :. ::. :.::.:: ..:: ::.:. CCDS42 EVKMSGTIVKIEPPDLALTEPLEINLEPPGPLTLAMSQFLNEMQETKKGVVTPKELFSQV 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE5 CQKAPRFKDFQQQDSQELLHYLLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVKA :.:: ::: .:::::::::.::::..:.:: .:.. .:::::.: : : :.: ..::: CCDS42 CKKAVRFKGYQQQDSQELLRYLLDGMRAEEHQRVSKGILKAFGNSTEKL-DEELKNKVKD 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE5 YGKEGVKMNFIDRIFIGELTSTVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRMN : :. .:.:::: ::::: .::..: ..: :.. :.:.:::..... .: . . : CCDS42 YEKKKSMPSFVDRIFGGELTSMIMCDQCRTVSLVHESFLDLSLPVLDDQSGKKSVNDK-N 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE5 KYRSLRETDHD----RYSGNVTIENIHQPRAAKKHSSSKDKSQLIHDRKCIRKLSS--GE ..... :.: . . . : : ...:: ..: :.: .. : :. .. :. CCDS42 LKKTVEDEDQDSEEEKDNDSYIKERSDIPSGTSKHLQKKAKKQAKKQAKNQRRQQKIQGK 410 420 430 440 450 460 460 470 480 490 500 510 pF1KE5 TVTYQKNENLEMNGDSLMFASLMNSESRLNESPTDDSEKEASHSESNV---DADSEPSES .. . ... :: . . :. ....: . . :.. . :.: : : ... . CCDS42 VLHLNDICTIDHPEDS-EYEAEMSLQGEVNIKSNHISQEGVMHKEYCVNQKDLNGQAKMI 470 480 490 500 510 520 520 530 540 550 560 pF1KE5 ESASKQTGLFRSSSGSGVQPDGPLYPLSAGKL-----LYTKETDSGDKEMAEAISELRLS ::.. . . . .... :. : :... : : ..:. ........: :. CCDS42 ESVTDNQKSTEEVDMKNINMDNDLEVLTSSPTRNLNGAYLTEGSNGEVDISNGFKNLNLN 530 540 550 560 570 580 570 580 590 600 610 620 pF1KE5 STVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSPQNAFQTLSQSYITTSKECSIQSCLY ... :. . . :: :.. . .. . .:..:: ::.. . .. ::::: ::: CCDS42 AALHPDEI---NIEILNDSHTPG-TKVYEVVNEDPETAFCTLANREVFNTDECSIQHCLY 590 600 610 620 630 630 640 650 660 670 680 pF1KE5 QFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEKKVEGVYTNARKQLLISAVPAVLILH ::: : : :::::: ::. . . . . .:.: :::::.::.::: .: :: :: CCDS42 QFTRNEKLRDANKLLCEVCTRRQCNGPKANIKGERK--HVYTNAKKQMLISLAPPVLTLH 640 650 660 670 680 690 690 700 710 720 730 740 pF1KE5 LKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCKN-ASVGDKVLYGLYGIVEHSGSMRE ::::.:::..:::::.:. :: .:::::::. ::: : . .:::.:::.:::::.:: CCDS42 LKRFQQAGFNLRKVNKHIKFPEILDLAPFCTLKCKNVAEENTRVLYSLYGVVEHSGTMRS 700 710 720 730 740 750 750 760 770 780 790 800 pF1KE5 GHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNESAGQWVHVSDTYLQVVPESRALSAQ ::::::.:.:: . .:: . . . ..: . . :: ::: :.:::..:.:: ...:..: CCDS42 GHYTAYAKARTANSHLS-NLVLHGDIP--QDFEMESKGQWFHISDTHVQAVPTTKVLNSQ 760 770 780 790 800 810 810 pF1KE5 AYLLFYERVL ::::::::.: CCDS42 AYLLFYERIL 820 >>CCDS13583.1 USP16 gene_id:10600|Hs108|chr21 (823 aa) initn: 1711 init1: 507 opt: 1479 Z-score: 1469.5 bits: 282.8 E(32554): 1.6e-75 Smith-Waterman score: 1904; 38.6% identity (69.3% similar) in 837 aa overlap (15-814:4-823) 10 20 30 40 50 60 pF1KE5 MRVKDPTKALPEKAKRSKRPTVPHDEDSSDDIAVGLTCQHVSHAISVNHVKRAIAENLWS ::.: ::: : :::. . .:.:. ... ...:.:... :. CCDS13 MGKKRTKGKTVPID-DSSETLEP--VCRHIRKGLEQGNLKKALVNVEWN 10 20 30 40 70 80 90 100 110 pF1KE5 VCSECLKERRFYDGQLVLTSD---IWLCLKCGFQGCGKNSESQHSLKHFKSSRTEPHCII .:..: . . : : . .::::::: ::::.::. ::.:::. . :.::::.. CCDS13 ICQDCKTDNKVKDKAEEETEEKPSVWLCLKCGHQGCGRNSQEQHALKHYLTPRSEPHCLV 50 60 70 80 90 100 120 130 140 150 160 pF1KE5 INLSTWIIWCYECDEKLSTHCNKKVLAQIVDFLQKHASKT--------------QTSAFS ..:..: .::: ::.... .:... :.:.::...:.:: : ... . CCDS13 LSLDNWSVWCYVCDNEVQ-YCSSNQLGQVVDYVRKQASITTPKPAEKDNGNIELENKKLE 110 120 130 140 150 160 170 180 190 200 210 pF1KE5 RIMKLCEEKCETDEIQK-----GGKCRNLSVRGITNLGNTCFFNAVMQNLAQTYTLTDLM . : .:. . ... : .. :. ..:.:..:::::::::::::::.:: .: .:. CCDS13 KESKNEQEREKKENMAKENPPMNSPCQ-ITVKGLSNLGNTCFFNAVMQNLSQTPVLRELL 170 180 190 200 210 220 220 230 240 250 260 270 pF1KE5 NEIKESSTKLKIFPSSDSQLDPLVVELSRPGPLTSALFLFLHSMKETEKGPLSPKVLFNQ .:.: :.: .:: : . . .:: ..: ::::: :. ::. :.::.:: ..:: ::.: CCDS13 KEVKMSGTIVKIEPPDLALTEPLEINLEPPGPLTLAMSQFLNEMQETKKGVVTPKELFSQ 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE5 LCQKAPRFKDFQQQDSQELLHYLLDAVRTEETKRIQASILKAFNNPTTKTADDETRKKVK .:.:: ::: .:::::::::.::::..:.:: .:.. .:::::.: : : :.: ..::: CCDS13 VCKKAVRFKGYQQQDSQELLRYLLDGMRAEEHQRVSKGILKAFGNSTEKL-DEELKNKVK 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE5 AYGKEGVKMNFIDRIFIGELTSTVMCEECANISTVKDPFIDISLPIIEERVSKPLLWGRM : :. .:.:::: ::::: .::..: ..: :.. :.:.:::..... .: . . CCDS13 DYEKKKSMPSFVDRIFGGELTSMIMCDQCRTVSLVHESFLDLSLPVLDDQSGKKSVNDK- 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE5 NKYRSLRETDHD----RYSGNVTIENIHQPRAAKKHSSSKDKSQLIHDRKCIRKLSS--G : ..... :.: . . . : : ...:: ..: :.: .. : :. .. : CCDS13 NLKKTVEDEDQDSEEEKDNDSYIKERSDIPSGTSKHLQKKAKKQAKKQAKNQRRQQKIQG 410 420 430 440 450 460 460 470 480 490 500 pF1KE5 ETVTYQKNENLEMNGDSLMFASLMNSESRLNESPTDDSEKEASHSESNV---DADSEPSE ... . ... :: . . :. ....: . . :.. . :.: : : ... . CCDS13 KVLHLNDICTIDHPEDS-EYEAEMSLQGEVNIKSNHISQEGVMHKEYCVNQKDLNGQAKM 470 480 490 500 510 520 510 520 530 540 550 560 pF1KE5 SESASKQTGLFRSSSGSGVQPDGPLYPLSAGKL-----LYTKETDSGDKEMAEAISELRL ::.. . . . .... :. : :... : : ..:. ........: : CCDS13 IESVTDNQKSTEEVDMKNINMDNDLEVLTSSPTRNLNGAYLTEGSNGEVDISNGFKNLNL 530 540 550 560 570 580 570 580 590 600 610 620 pF1KE5 SSTVTGDQDFDRENQPLNISNNLCFLEGKHLRSYSPQNAFQTLSQSYITTSKECSIQSCL .... :. . . :: :.. . .. . .:..:: ::.. . .. ::::: :: CCDS13 NAALHPDEI---NIEILNDSHTPG-TKVYEVVNEDPETAFCTLANREVFNTDECSIQHCL 590 600 610 620 630 630 640 650 660 670 680 pF1KE5 YQFTSMELLMGNNKLLCENCTKNKQKYQEETSFAEKKVEGVYTNARKQLLISAVPAVLIL :::: : : :::::: ::. . . . . .:.: :::::.::.::: .: :: : CCDS13 YQFTRNEKLRDANKLLCEVCTRRQCNGPKANIKGERK--HVYTNAKKQMLISLAPPVLTL 640 650 660 670 680 690 690 700 710 720 730 740 pF1KE5 HLKRFHQAGLSLRKVNRHVDFPLMLDLAPFCSATCKN-ASVGDKVLYGLYGIVEHSGSMR :::::.:::..:::::.:. :: .:::::::. ::: : . .:::.:::.:::::.:: CCDS13 HLKRFQQAGFNLRKVNKHIKFPEILDLAPFCTLKCKNVAEENTRVLYSLYGVVEHSGTMR 700 710 720 730 740 750 750 760 770 780 790 800 pF1KE5 EGHYTAYVKVRTPSRKLSEHNTKKKNVPGLKAADNESAGQWVHVSDTYLQVVPESRALSA ::::::.:.:: . .:: . . . ..: . . :: ::: :.:::..:.:: ...:.. CCDS13 SGHYTAYAKARTANSHLS-NLVLHGDIP--QDFEMESKGQWFHISDTHVQAVPTTKVLNS 760 770 780 790 800 810 810 pF1KE5 QAYLLFYERVL :::::::::.: CCDS13 QAYLLFYERIL 820 814 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:06:10 2016 done: Tue Nov 8 06:06:11 2016 Total Scan time: 4.050 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]