FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3067, 222 aa 1>>>pF1KE3067 222 - 222 aa - 222 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9228+/-0.000694; mu= 13.8743+/- 0.042 mean_var=126.2917+/-25.283, 0's: 0 Z-trim(114.5): 56 B-trim: 0 in 0/53 Lambda= 0.114127 statistics sampled from 15016 (15074) to 15016 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.792), E-opt: 0.2 (0.463), width: 16 Scan time: 2.570 The best scores are: opt bits E(32554) CCDS33114.1 UBE2S gene_id:27338|Hs108|chr19 ( 222) 1478 253.3 8.8e-68 CCDS4174.1 UBE2B gene_id:7320|Hs108|chr5 ( 152) 376 71.7 2.8e-13 CCDS43369.1 UBE2D2 gene_id:7322|Hs108|chr5 ( 147) 374 71.4 3.5e-13 CCDS3661.1 UBE2D3 gene_id:7323|Hs108|chr4 ( 148) 373 71.2 3.9e-13 CCDS31875.1 UBE2N gene_id:7334|Hs108|chr12 ( 152) 372 71.1 4.5e-13 CCDS5474.1 UBE2D4 gene_id:51619|Hs108|chr7 ( 147) 370 70.7 5.5e-13 CCDS14580.1 UBE2A gene_id:7319|Hs108|chrX ( 152) 370 70.7 5.6e-13 CCDS3660.1 UBE2D3 gene_id:7323|Hs108|chr4 ( 147) 364 69.7 1.1e-12 CCDS3659.1 UBE2D3 gene_id:7323|Hs108|chr4 ( 149) 360 69.1 1.7e-12 CCDS7252.1 UBE2D1 gene_id:7321|Hs108|chr10 ( 147) 356 68.4 2.7e-12 >>CCDS33114.1 UBE2S gene_id:27338|Hs108|chr19 (222 aa) initn: 1478 init1: 1478 opt: 1478 Z-score: 1330.4 bits: 253.3 E(32554): 8.8e-68 Smith-Waterman score: 1478; 100.0% identity (100.0% similar) in 222 aa overlap (1-222:1-222) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST 130 140 150 160 170 180 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL :::::::::::::::::::::::::::::::::::::::::: CCDS33 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL 190 200 210 220 >>CCDS4174.1 UBE2B gene_id:7320|Hs108|chr5 (152 aa) initn: 384 init1: 366 opt: 376 Z-score: 351.8 bits: 71.7 E(32554): 2.8e-13 Smith-Waterman score: 376; 36.4% identity (68.6% similar) in 140 aa overlap (14-153:7-146) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF : .... : ::: :.. :.:... . ...: ::::::. : : CCDS41 MSTPARRRLMRDFKRLQEDPPVGVSGAPSENNIMQWNAVIFGPEGTPFEDGTF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL .. . .....: .:: ::.:.::::: :.: ::...:. :. . .: .:. :: CCDS41 KLVIEFSEEYPNKPPTVRFLSKMFHPNVYADGSICLDILQNRWSPTYDVSSILTSIQSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST .:::.: : .:..: :: .:: :. ..: CCDS41 DEPNPNSPANSQAAQLYQENKREYEKRVSAIVEQSWNDS 120 130 140 150 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS43369.1 UBE2D2 gene_id:7322|Hs108|chr5 (147 aa) initn: 372 init1: 372 opt: 374 Z-score: 350.2 bits: 71.4 E(32554): 3.5e-13 Smith-Waterman score: 374; 38.3% identity (66.7% similar) in 141 aa overlap (13-153:3-143) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF .. ..::.. :. ::: .. : .:. :.:: ::. .:: ::.: CCDS43 MALKRIHKELNDLARDPPAQCSAGPVGDDMFHWQATIMGPNDSPYQGGVF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL . . . :.: .::: : :.:.:::...:: ::...:. .:. : : .:::.: :: CCDS43 FLTIHFPTDYPFKPPKVAFTTRIYHPNINSNGSICLDILRSQWSPALTISKVLLSICSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::.. : : .:. . :.: :: :. CCDS43 CDPNPDDPLVPEIARIYKTDREKYNRIAREWTQKYAM 120 130 140 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS3661.1 UBE2D3 gene_id:7323|Hs108|chr4 (148 aa) initn: 373 init1: 373 opt: 373 Z-score: 349.2 bits: 71.2 E(32554): 3.9e-13 Smith-Waterman score: 373; 38.3% identity (66.0% similar) in 141 aa overlap (13-153:3-143) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF .. . ::.. :. ::: .. : .:. :.:: ::. .:: ::.: CCDS36 MALKRINKELSDLARDPPAQCSAGPVGDDMFHWQATIMGPNDSPYQGGVF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL . . . :.: .::: : :.:.:::...:: ::...:. .:. : : .:::.: :: CCDS36 FLTIHFPTDYPFKPPKVAFTTRIYHPNINSNGSICLDILRSQWSPALTISKVLLSICSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::.. : : .:. . ..: :: :: CCDS36 CDPNPDDPLVPEIARIYKTDRDKYNRLAREWTEKYAML 120 130 140 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS31875.1 UBE2N gene_id:7334|Hs108|chr12 (152 aa) initn: 379 init1: 365 opt: 372 Z-score: 348.2 bits: 71.1 E(32554): 4.5e-13 Smith-Waterman score: 372; 38.7% identity (66.9% similar) in 142 aa overlap (14-155:6-147) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF : . ::. : :.: :::. :.: . ..:.: ::. .:. :: : CCDS31 MAGLPRRIIKETQRLLAEPVPGIKAEPDESNARYFHVVIAGPQDSPFEGGTF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL ...:.: ...: . :: :.:::.:::: :.::...:: :. : :: :::.:. :: CCDS31 KLELFLPEEYPMAAPKVRFMTKIYHPNVDKLGRICLDILKDKWSPALQIRTVLLSIQALL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::.. : ..... : . :: :... CCDS31 SAPNPDDPLANDVAEQWKTNEAQAIETARAWTRLYAMNNI 120 130 140 150 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS5474.1 UBE2D4 gene_id:51619|Hs108|chr7 (147 aa) initn: 368 init1: 368 opt: 370 Z-score: 346.6 bits: 70.7 E(32554): 5.5e-13 Smith-Waterman score: 370; 39.0% identity (64.5% similar) in 141 aa overlap (13-153:3-143) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF .. . ::.: : ::: .. : .:: :.:: ::. .:: ::.: CCDS54 MALKRIQKELTDLQRDPPAQCSAGPVGDDLFHWQATIMGPNDSPYQGGVF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL . . . :.: .::: : :::.:::...:: ::...:. .:. : . .:::.: :: CCDS54 FLTIHFPTDYPFKPPKVAFTTKIYHPNINSNGSICLDILRSQWSPALTVSKVLLSICSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::.. : : .. . :.: :: :. CCDS54 CDPNPDDPLVPEIAHTYKADREKYNRLAREWTQKYAM 120 130 140 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS14580.1 UBE2A gene_id:7319|Hs108|chrX (152 aa) initn: 378 init1: 360 opt: 370 Z-score: 346.4 bits: 70.7 E(32554): 5.6e-13 Smith-Waterman score: 370; 35.7% identity (67.1% similar) in 140 aa overlap (14-153:7-146) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF : .... : ::: :.. :.:... ...: ::::::. : : CCDS14 MSTPARRRLMRDFKRLQEDPPAGVSGAPSENNIMVWNAVIFGPEGTPFEDGTF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL .. . . ...: .:: :..:.::::: :.: ::...:. :. . .: .:. :: CCDS14 KLTIEFTEEYPNKPPTVRFVSKMFHPNVYADGSICLDILQNRWSPTYDVSSILTSIQSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST .:::.: : .:..: :: .:: :. ..: CCDS14 DEPNPNSPANSQAAQLYQENKREYEKRVSAIVEQSWRDC 120 130 140 150 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS3660.1 UBE2D3 gene_id:7323|Hs108|chr4 (147 aa) initn: 391 init1: 350 opt: 364 Z-score: 341.3 bits: 69.7 E(32554): 1.1e-12 Smith-Waterman score: 364; 36.9% identity (66.0% similar) in 141 aa overlap (13-153:3-143) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF .. . ::.. :. ::: .. : .:. :.:: ::. .:: ::.: CCDS36 MALKRINKELSDLARDPPAQCSAGPVGDDMFHWQATIMGPNDSPYQGGVF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL . . . :.: .::: : :.:.:::...:: ::...:. .:. : : .:::.: :: CCDS36 FLTIHFPTDYPFKPPKVAFTTRIYHPNINSNGSICLDILRSQWSPALTISKVLLSICSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::.. : : .:. . ..: .: :. CCDS36 CDPNPDDPLVPEIARIYKTDRDKYNRISREWTQKYAM 120 130 140 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS3659.1 UBE2D3 gene_id:7323|Hs108|chr4 (149 aa) initn: 391 init1: 350 opt: 360 Z-score: 337.6 bits: 69.1 E(32554): 1.7e-12 Smith-Waterman score: 360; 38.2% identity (66.2% similar) in 136 aa overlap (18-153:10-145) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF ::.. :. ::: .. : .:. :.:: ::. .:: ::.: CCDS36 MLSNRKCLSKELSDLARDPPAQCSAGPVGDDMFHWQATIMGPNDSPYQGGVF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL . . . :.: .::: : :.:.:::...:: ::...:. .:. : : .:::.: :: CCDS36 FLTIHFPTDYPFKPPKVAFTTRIYHPNINSNGSICLDILRSQWSPALTISKVLLSICSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::.. : : .:. . ..: .: :. CCDS36 CDPNPDDPLVPEIARIYKTDRDKYNRISREWTQKYAM 120 130 140 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL >>CCDS7252.1 UBE2D1 gene_id:7321|Hs108|chr10 (147 aa) initn: 354 init1: 354 opt: 356 Z-score: 334.1 bits: 68.4 E(32554): 2.7e-12 Smith-Waterman score: 356; 36.9% identity (64.5% similar) in 141 aa overlap (13-153:3-143) 10 20 30 40 50 60 pF1KE3 MNSNVENLPPHIIRLVYKEVTTLTADPPDGIKVFPNEEDLTDLQVTIEGPEGTPYAGGLF .. . ::.. : ::: .. : .:: :.:: :: . : ::.: CCDS72 MALKRIQKELSDLQRDPPAHCSAGPVGDDLFHWQATIMGPPDSAYQGGVF 10 20 30 40 50 70 80 90 100 110 120 pF1KE3 RMKLLLGKDFPASPPKGYFLTKIFHPNVGANGEICVNVLKRDWTAELGIRHVLLTIKCLL . . . :.: .::: : :::.:::...:: ::...:. .:. : . .:::.: :: CCDS72 FLTVHFPTDYPFKPPKIAFTTKIYHPNINSNGSICLDILRSQWSPALTVSKVLLSICSLL 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE3 IHPNPESALNEEAGRLLLENYEEYAARARLLTEIHGGAGGPSGRAEAGRALASGTEASST :::.. : . ... . :.: .:: :. CCDS72 CDPNPDDPLVPDIAQIYKSDKEKYNRHAREWTQKYAM 120 130 140 190 200 210 220 pF1KE3 DPGAPGGPGGAEGPMAKKHAGERDKKLAAKKKTDKKRALRRL 222 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 05:20:45 2016 done: Sun Nov 6 05:20:45 2016 Total Scan time: 2.570 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]