FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3322, 913 aa 1>>>pF1KE3322 913 - 913 aa - 913 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9687+/-0.00106; mu= 12.6188+/- 0.063 mean_var=95.5211+/-19.052, 0's: 0 Z-trim(105.6): 81 B-trim: 0 in 0/49 Lambda= 0.131227 statistics sampled from 8416 (8497) to 8416 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.63), E-opt: 0.2 (0.261), width: 16 Scan time: 2.880 The best scores are: opt bits E(32554) CCDS14635.1 USP26 gene_id:83844|Hs108|chrX ( 913) 6036 1153.8 0 CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 ( 922) 1690 331.0 6.2e-90 CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 ( 979) 1064 212.5 3.1e-54 >>CCDS14635.1 USP26 gene_id:83844|Hs108|chrX (913 aa) initn: 6036 init1: 6036 opt: 6036 Z-score: 6174.8 bits: 1153.8 E(32554): 0 Smith-Waterman score: 6036; 99.9% identity (99.9% similar) in 913 aa overlap (1-913:1-913) 10 20 30 40 50 60 pF1KE3 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYSTFRLSDNIQNVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYSTFRLSDNIQNVV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 LKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVFS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 STTQKEINKTSFHKVDEKSSSKSFEIAKGSGTGVLQRMPLLTSKLTLTCGELSENQHKKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 STTQKEINKTSFHKVDEKSSSKSFEIAKGSGTGVLQRMPLLTSKLTLTCGELSENQHKKR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 KRMLSSSSEMNEEFLKENNSVEYKKSKADCSRCVSYNREKQLKLKELEENKKLECESSCI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KRMLSSSSEMNEEFLKENNSVEYKKSKADCSRCVSYNREKQLKLKELEENKKLECESSCI 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 MNATGNPYLDDIGLLQALTEKMVLVFLLQQGYSDGYTKWDKLKLFFELFPEKICHGLPNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MNATGNPYLDDIGLLQALTEKMVLVFLLQQGYSDGYTKWDKLKLFFELFPEKICHGLPNL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 GNTCYMNAVLQSLLSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GNTCYMNAVLQSLLSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEML 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 LLNLKKAISAAAEIFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 LLNLKKAISAAAEIFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 FADDPDTSGFSCPVITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKAHPSSIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 FADDPDTSGFSCPVITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKAHPSSIQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 STFDLFFGAEELEYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALKKNDQEVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 STFDLFFGAEELEYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALKKNDQEVI 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 ISKYLKVSSHCNEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATKESKDILAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ISKYLKVSSHCNEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATKESKDILAP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 HIGSDKESEQKKGQTVFKGASRRQQQKYLGKNSKPNELESVYSGDRAFIEKEPLAHLMTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 HIGSDKESEQKKGQTVFKGASRRQQQKYLGKNSKPNELESVYSGDRAFIEKEPLAHLMTY 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 LEDTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKNVKTSKFVAFDRIINPTKDL :::::::::::::::::::::::::::::::::::::::: ::::::::::::::::::: CCDS14 LEDTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKYVKTSKFVAFDRIINPTKDL 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 YEDKNIRIPERFQKVSEQTQQCDGMRICEQAPQQALPQSFPKPGTQGHTKNLLRPTKLNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 YEDKNIRIPERFQKVSEQTQQCDGMRICEQAPQQALPQSFPKPGTQGHTKNLLRPTKLNL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 QKSNRNSLLALGSNKNPRNKDILDKIKSKAKETKRNDDKGDHTYRLISVVSHLGKTLKSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 QKSNRNSLLALGSNKNPRNKDILDKIKSKAKETKRNDDKGDHTYRLISVVSHLGKTLKSG 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 HYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEIFEEMLKREENAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 HYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEIFEEMLKREENAQ 850 860 870 880 890 900 910 pF1KE3 LNSKEVEETLQKE ::::::::::::: CCDS14 LNSKEVEETLQKE 910 >>CCDS33124.1 USP29 gene_id:57663|Hs108|chr19 (922 aa) initn: 2104 init1: 1067 opt: 1690 Z-score: 1728.1 bits: 331.0 E(32554): 6.2e-90 Smith-Waterman score: 2399; 46.4% identity (70.7% similar) in 920 aa overlap (1-905:1-904) 10 20 30 40 50 pF1KE3 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKY-STFRLSDNIQNV : .: . ::.:: . :::..: :::.::.:.:.:. .::. :::::. :.::.::..: CCDS33 MISLKVCGFIQIWSQKTGMTKLKEALIETVQRQKEIKLVVTFKSGKFIRIFQLSNNIRSV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 VLKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVF ::. . :.::.:::.:: :::. :: ::.::..::: .:::. : :.. ::: CCDS33 VLRHCKKRQSHLRLTLKNNVFLFIDKLSYRDAKQLNMFLDIIHQNKSQQPMKSDDDWSVF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 SSTTQ-KEINKTSFHKVDEKSSSKSFEIAKGSGTGVLQRMPLLTSKLTLTCGE-LSENQH : .. :::.::::... .: : :.:::. :: . . ::: CCDS33 ESRNMLKEIDKTSFYSICNKPS--------------YQKMPLFMSKSPTHVKKGILENQG 130 140 150 160 180 190 200 210 220 230 pF1KE3 KKRKRMLSSSSEMNEEFLKENNSVEYKKSKADCSRCVSYNREKQLKLKELEENKKLECES : . :::. . ::..:::.: : :: :.: . .. ::.. .:..::... :. CCDS33 GKGQNTLSSDVQTNEDILKEDNPVPNKKYKTDSLKYIQSNRKNPSSLEDLEKDRDLKLGP 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE3 SCIMNATGNPYLDDIGL-LQALTEKMVLVFLLQQGYSDGYTKWDKLKLFFELFPEKICHG : : .::: ::. : :.:. : :. :. .:.: . .: .. .. ... .: CCDS33 SFNTNCNGNPNLDETVLATQTLNAKNGLTSPLEPEHSQGDPRCNKAQVPLDSHSQQLQQG 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE3 LPNLGNTCYMNAVLQSLLSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEI .::::::::::::::::..:::::::::.:. :: ::..:: : :..:: .:: . .: CCDS33 FPNLGNTCYMNAVLQSLFAIPSFADDLLTQGVPWEYIPFEALIMTLTQLLALKDFCSTKI 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE3 KEMLLLNLKKAISAAAEIFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNF :. :: :.::.:::.:::: :: ::::::::..::::::..:::::. . .: :..: CCDS33 KRELLGNVKKVISAVAEIFSGNMQNDAHEFLGQCLDQLKEDMEKLNATLNTGKECGDENS 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE3 PKQVFADDPDTSGFSCPVITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKAHP :. . . :. : :::..:::.:: :. :::::...::.: :::::::: :. : : CCDS33 SPQMHVGSAATKVFVCPVVANFEFELQLSLICKACGHAVLKVEPNNYLSINLHQETKPLP 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE3 SSIQSTFDLFFGAEELEYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALKKND :::...:::: :::::.: :..:. :. :.:::: :.::.::::::.:. : ::. CCDS33 LSIQNSLDLFFKEEELEYNCQMCKQKSCVARHTFSRLSRVLIIHLKRYSFNNAWLLVKNN 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE3 QEVIISKYLKVSSHCNEGTRPPLPLSEDGEITDFQLLKVIRKMTS---GNISVSWPATKE ..: : : :..::.:::.:.:::::: .. . ..:.: ..: : . .. : :.: CCDS33 EQVYIPKSLSLSSYCNESTKPPLPLSSSAPVGKCEVLEVSQEMISEINSPLTPSMKLTSE 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE3 SKDILAPHIGSDKESEQKKGQTVFKGASRRQQQKYLGKNSKPNELESVYSGDRAFIEKE- :.: :. . ::... .. : ::..:.:. : .:.. : : :. :::. ::: CCDS33 SSDSLVLPVEPDKNADLQRFQRDCGDASQEQHQRDL-ENGSALESELVHFRDRAIGEKEL 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE3 PLAHLMTYLEDTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKNVKTSKFVAF-- :.: . : :: ... ::: ::: : : .: .: ::..:. .: ::. :: : CCDS33 PVADSLMDQGDISLPVMYEDGGKLISSPDTRLVEVHLQEVPQHPELQKYEKTNTFVEFNF 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE3 DRIINPTKDLYEDKNIRIPERFQKVSEQTQQCDGMRICEQAPQQALPQSFPKPGTQGHTK : . . :. .:. :. :::: : ..:: ::: : .. ::: : . : .: ::. CCDS33 DSVTESTNGFYDCKENRIPEGSQGMAEQLQQCIEESIIDEFLQQAPPPGVRKLDAQEHTE 710 720 730 740 750 760 780 790 800 810 820 pF1KE3 NLL-RPTKLNLQKSNRNSLLALGSNKNPRNKDILD--KIKSKAKETKRNDDKGD--HTYR . : . :.: :::.. : : ::::. :: ::.::: . ...::: :: :: ..:: CCDS33 ETLNQSTELRLQKADLNHLGALGSD-NPGNKNILDAENTRGEAKELTRNVKMGDPLQAYR 770 780 790 800 810 820 830 840 850 860 870 880 pF1KE3 LISVVSHLGKTLKSGHYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMH :::::::.:.. .::::: :.:::.:: ::::.:. : :.:..::: : .:::::::: CCDS33 LISVVSHIGSSPNSGHYISDVYDFQKQAWFTYNDLCVSEISETKMQEARLHSGYIFFYMH 830 840 850 860 870 880 890 900 910 pF1KE3 NEIFEEMLKREENAQLNSKEVEETLQKE : ::::.:.. ::..: : . CCDS33 NGIFEELLRKAENSRLPSTQAGVIPQGEYEGDSLYRPA 890 900 910 920 >>CCDS2418.1 USP37 gene_id:57695|Hs108|chr2 (979 aa) initn: 1678 init1: 507 opt: 1064 Z-score: 1087.1 bits: 212.5 E(32554): 3.1e-54 Smith-Waterman score: 2096; 42.5% identity (66.8% similar) in 968 aa overlap (16-912:16-977) 10 20 30 40 50 pF1KE3 MAALFLRGFVQIGNCKTGISKSKEAFIEAVERKKKDRLVLYFKSGKYST-FRLSDNIQNV .:::.: ::. .: ::...: ::.....: :.:: ::.:: CCDS24 MSPLKIHGPIRIRSMQTGITKWKEGSFEIVEKENKVSLVVHYNTGGIPRIFQLSHNIKNV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 VLKSYRGNQNHLHLTLQNNNGLFIEGLSSTDAEQLKIFLDRVHQNEVQPPVRPGKGGSVF ::. ..:..: ::::.:. : :. . : :::....::: ::::.. ..:..:.. : CCDS24 VLRPSGAKQSRLMLTLQDNSFLSIDKVPSKDAEEMRLFLDAVHQNRLPAAMKPSQGSGSF 70 80 90 100 110 120 120 130 140 150 pF1KE3 -----SSTTQKEINKTSFHKVDEKSSSK--SFEI-------------AKGS-----GTGV : :.::: .. .. :...:.: :.: ..:: :.:. CCDS24 GAILGSRTSQKETSR-QLSYSDNQASAKRGSLETKDDIPFRKVLGNPGRGSIKTVAGSGI 130 140 150 160 170 160 170 180 190 200 210 pF1KE3 LQRMPLLTSKLTLTCGELSENQHKKRKRMLSSSSEMNEEFLKENNSVEYKKSKADCSRC- . .: ::: : . : ::. .:::::.:..::.::.. :::.: .:. .: :: CCDS24 ARTIPSLTSTSTPLRSGLLENRTEKRKRMISTGSELNEDYPKENDSSSNNKAMTDPSRKY 180 190 200 210 220 230 220 230 240 250 260 pF1KE3 VSYNREKQLKLKELEENKK---LECESSCIM--------NATGNPYLDDIGLL-QALTEK .. .:::::.::. :::. : .:: .. ...:. :: .. :. . : CCDS24 LTSSREKQLSLKQSEENRTSGLLPLQSSSFYGSRAGSKEHSSGGTNLDRTNVSSQTPSAK 240 250 260 270 280 290 270 280 290 300 310 pF1KE3 MVLVFLLQQ--------GYSDGYTKWDKLKLFFELFPEKICHGLPNLGNTCYMNAVLQSL : :: : .. :: :.: .. . .. .:. ::::::::::.:::: CCDS24 RSLGFLPQPVPLSVKKLRCNQDYTGWNKPRVPLSSHQQQQLQGFSNLGNTCYMNAILQSL 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE3 LSIPSFADDLLNQSFPWGKIPLNALTMCLARLLFFKDTYNIEIKEMLLLNLKKAISAAAE .:. :::.:::.:..:: ::::::: .:.:: :: : : :. :: ..:.::::.:: CCDS24 FSLQSFANDLLKQGIPWKKIPLNALIRRFAHLLVKKDICNSETKKDLLKKVKNAISATAE 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE3 IFHGNAQNDAHEFLAHCLDQLKDNMEKLNTIWKPKSEFGEDNFPKQVFADDPDTSGFSCP : : ::::::::..::::::..::::: :: . ::.: : : : ...:: CCDS24 RFSGYMQNDAHEFLSQCLDQLKEDMEKLNKTWKTEPVSGEENSP-----DISATRAYTCP 420 430 440 450 460 470 440 450 460 470 480 490 pF1KE3 VITNFELELLHSIACKACGQVILKTELNNYLSINLPQRIKA-HPSSIQSTFDLFFGAEEL ::::.:.:. ::: :::::..: : : : :::.::.: : : :::...:::: :::: CCDS24 VITNLEFEVQHSIICKACGEIIPKREQFNDLSIDLPRRKKPLPPRSIQDSLDLFFRAEEL 480 490 500 510 520 530 500 510 520 530 540 550 pF1KE3 EYKCAKCEHKTSVGVHSFSRLPRILIVHLKRYSLNEFCALK-KNDQEVIISKYLKVSSHC ::.: :: : .. :.:.::::.::.::::::.: .:. : :.::: .:: .:::: CCDS24 EYSCEKCGGKCALVRHKFNRLPRVLILHLKRYSFNVALSLNNKIGQQVIIPRYLTLSSHC 540 550 560 570 580 590 560 570 580 590 600 pF1KE3 NEGTRPPLPLSEDGEITDFQLLKVIRKMTSGNISVSWPATK---ESKDILAPHIGSDKES .:.:.::. :. ..... . ::. . ..: : : :. : .::. :: . ::.:. CCDS24 TENTKPPFTLGWSAHMAISRPLKASQMVNSCITSPSTPSKKFTFKSKSSLALCLDSDSED 600 610 620 630 640 650 610 620 630 640 650 pF1KE3 EQKKG----QTVFKGASRRQQQKYLGKNSK-----PNELESVYSGDRAFIEKEPLAHLMT : :.. : . . . .:::. : :.:: :.. : :: . :.: :: .. CCDS24 ELKRSVALSQRLCEMLGNEQQQEDLEKDSKLCPIEPDKSELENSGFDRMSEEELLAAVLE 660 670 680 690 700 710 660 670 680 690 700 710 pF1KE3 YLE-DTSLCQFHKAGGKPASSPGTPLSKVDFQTVPENPKRKKNVKTSKFVAFD--RIINP . :.: :. ::.::: : ... :.: .:::: .. : . .. .: . . CCDS24 ISKRDASPSLSHEDDDKPTSSPDTGFAEDDIQEMPENPDTMETEKPKTITELDPASFTEI 720 730 740 750 760 770 720 730 740 750 760 770 pF1KE3 TKDLYEDKNIRIPERFQKVSEQTQQCDGMRI-CEQAPQQALPQSFPKPGT--QGHTKNLL ::: :.:. . :: : . :: : : :: :::: ::. . . : . .: CCDS24 TKDCDENKENKTPEGSQGEVDWLQQYDMEREREEQELQQALAQSLQEQEAWEQKEDDDLK 780 790 800 810 820 830 780 790 800 810 820 pF1KE3 RPTKLNLQKSNRNSLLALGSNKNPRNKDILDK--IKSKAKETKRNDDKGD--HTYRLISV : :.:.::. : . . ::::... :.:..: ...:.: ::: . :. :.:::::: CCDS24 RATELSLQEFNNSFVDALGSDEDSGNEDVFDMEYTEAEAEELKRNAETGNLPHSYRLISV 840 850 860 870 880 890 830 840 850 860 870 880 pF1KE3 VSHLGKTLKSGHYICDAYDFEKQIWFTYDDMRVLGIQEAQMQEDRRCTGYIFFYMHNEIF :::.:.: .::::: :.::..:: ::::.:..: :::: .: :: .::::::::.::: CCDS24 VSHIGSTSSSGHYISDVYDIKKQAWFTYNDLEVSKIQEAAVQSDRDRSGYIFFYMHKEIF 900 910 920 930 940 950 890 900 910 pF1KE3 EEMLKREENAQLNSKEVEETLQKE .:.:. :.:.: : :: .: .. CCDS24 DELLETEKNSQSLSTEVGKTTRQAL 960 970 913 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 06:26:47 2016 done: Tue Nov 8 06:26:47 2016 Total Scan time: 2.880 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]