FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5404, 310 aa 1>>>pF1KE5404 310 - 310 aa - 310 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3201+/-0.00106; mu= 15.2912+/- 0.063 mean_var=62.8704+/-13.131, 0's: 0 Z-trim(101.6): 80 B-trim: 0 in 0/51 Lambda= 0.161753 statistics sampled from 6526 (6607) to 6526 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.561), E-opt: 0.2 (0.203), width: 16 Scan time: 1.820 The best scores are: opt bits E(32554) CCDS6716.1 HSD17B3 gene_id:3293|Hs108|chr9 ( 310) 1996 474.8 3.7e-134 CCDS7905.1 HSD17B12 gene_id:51144|Hs108|chr11 ( 312) 707 174.0 1.3e-43 CCDS10942.1 HSDL1 gene_id:83693|Hs108|chr16 ( 330) 550 137.4 1.5e-32 CCDS54046.1 HSDL1 gene_id:83693|Hs108|chr16 ( 275) 268 71.5 8.2e-13 CCDS9743.1 DHRS7 gene_id:51635|Hs108|chr14 ( 339) 250 67.4 1.8e-11 CCDS9605.1 DHRS4 gene_id:10901|Hs108|chr14 ( 278) 242 65.4 5.6e-11 >>CCDS6716.1 HSD17B3 gene_id:3293|Hs108|chr9 (310 aa) initn: 1996 init1: 1996 opt: 1996 Z-score: 2522.0 bits: 474.8 E(32554): 3.7e-134 Smith-Waterman score: 1996; 100.0% identity (100.0% similar) in 310 aa overlap (1-310:1-310) 10 20 30 40 50 60 pF1KE5 MGDVLEQFFILTGLLVCLACLAKCVRFSRCVLLNYWKVLPKSFLRSMGQWAVITGAGDGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MGDVLEQFFILTGLLVCLACLAKCVRFSRCVLLNYWKVLPKSFLRSMGQWAVITGAGDGI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 GKAYSFELAKRGLNVVLISRTLEKLEAIATEIERTTGRSVKIIQADFTKDDIYEHIKEKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 GKAYSFELAKRGLNVVLISRTLEKLEAIATEIERTTGRSVKIIQADFTKDDIYEHIKEKL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 AGLEIGILVNNVGMLPNLLPSHFLNAPDEIQSLIHCNITSVVKMTQLILKHMESRQKGLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 AGLEIGILVNNVGMLPNLLPSHFLNAPDEIQSLIHCNITSVVKMTQLILKHMESRQKGLI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 LNISSGIALFPWPLYSMYSASKAFVCAFSKALQEEYKAKEVIIQVLTPYAVSTAMTKYLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 LNISSGIALFPWPLYSMYSASKAFVCAFSKALQEEYKAKEVIIQVLTPYAVSTAMTKYLN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 TNVITKTADEFVKESLNYVTIGGETCGCLAHEILAGFLSLIPAWAFYSGAFQRLLLTHYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 TNVITKTADEFVKESLNYVTIGGETCGCLAHEILAGFLSLIPAWAFYSGAFQRLLLTHYV 250 260 270 280 290 300 310 pF1KE5 AYLKLNTKVR :::::::::: CCDS67 AYLKLNTKVR 310 >>CCDS7905.1 HSD17B12 gene_id:51144|Hs108|chr11 (312 aa) initn: 691 init1: 345 opt: 707 Z-score: 896.3 bits: 174.0 E(32554): 1.3e-43 Smith-Waterman score: 707; 41.7% identity (71.2% similar) in 295 aa overlap (18-306:19-312) 10 20 30 40 50 pF1KE5 MGDVLEQFFILTGLLVCLACLAKCVRFSRCVLLNYWKVLPKSFLR-SMGQWAVITGAGD .: :: . .: . : : : .. . ..:.:::.::. : CCDS79 MESALPAAGFLYWVGAGTVAYLALRISYSLFTALRVWGVGNEAGVGPGLGEWAVVTGSTD 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 GIGKAYSFELAKRGLNVVLISRTLEKLEAIATEIERTTGRSVKIIQADFTKDDIYEHIKE ::::.:. ::::.:..::::::. .::. ...::.. .. : .::...:::..:: CCDS79 GIGKSYAEELAKHGMKVVLISRSKDKLDQVSSEIKEKFKVETRTIAVDFASEDIYDKIKT 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 KLAGLEIGILVNNVGMLPNLLPSHFLNAPDE---IQSLIHCNITSVVKMTQLILKHMESR ::::::::::::::: . : .::..:: :...:. :: :: :::::.: : : CCDS79 GLAGLEIGILVNNVGMSYEY-PEYFLDVPDLDNVIKKMININILSVCKMTQLVLPGMVER 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 QKGLILNISSGIALFPWPLYSMYSASKAFVCAFSKALQEEYKAKEVIIQVLTPYAVSTAM .:: ::::::: ...: :: ..:::.:.:: ::. :.:::..: :..: . :: :.: . CCDS79 SKGAILNISSGSGMLPVPLLTIYSATKTFVDFFSQCLHEEYRSKGVFVQSVLPYFVATKL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 TKYLNTNVITKTADEFVKESLNYVTIGGETCGCLAHEILAGFLSLIPAWAFYSGAFQ--R .: . .. . . ::: ... : . ..: : : : ......: .:.: . . ... . CCDS79 AKIRKPTLDKPSPETFVKSAIKTVGLQSRTNGYLIHALMGSIISNLPSWIYLKIVMNMNK 240 250 260 270 280 290 300 310 pF1KE5 LLLTHYVAYLKLNTKVR .::. : : CCDS79 STRAHYLKKTKKN 300 310 >>CCDS10942.1 HSDL1 gene_id:83693|Hs108|chr16 (330 aa) initn: 487 init1: 286 opt: 550 Z-score: 697.9 bits: 137.4 E(32554): 1.5e-32 Smith-Waterman score: 550; 38.8% identity (68.2% similar) in 255 aa overlap (43-290:62-314) 20 30 40 50 60 70 pF1KE5 GLLVCLACLAKCVRFSRCVLLNYWKVLPKSFLRSMGQWAVITGAGDGIGKAYSFELAKRG .....:.:::..:: :::::::. :::.:: CCDS10 YTARKSITVICDFYSLIRLHFIPRLGSRADLIKQYGRWAVVSGATDGIGKAYAEELASRG 40 50 60 70 80 90 80 90 100 110 120 130 pF1KE5 LNVVLISRTLEKLEAIATEIERTTGRSVKIIQADFTKD-DIYEHIKEKLAGLEIGILVNN ::..::::. :::...: .: : . :: :::.. .:: :.: : ..:::::: CCDS10 LNIILISRNEEKLQVVAKDIADTYKVETDIIVADFSSGREIYLPIREALKDKDVGILVNN 100 110 120 130 140 150 140 150 160 170 180 pF1KE5 VGML-PNLLPSHFLN-APDEIQSLIHCNITSVVKMTQLILKHMESRQKGLILNISSGIAL ::.. : :..: . . :.. ..:. ::... :....: : :.:: :..:::: CCDS10 VGVFYP--YPQYFTQLSEDKLWDIINVNIAAASLMVHVVLPGMVERKKGAIVTISSGSCC 160 170 180 190 200 190 200 210 220 230 240 pF1KE5 FPWPLYSMYSASKAFVCAFSKALQEEYKAKEVIIQVLTPYAVSTAMTKYLN----TNVIT : : . .:::::.. ::.::: :: .: ...: : :. :.:.:: : . .. CCDS10 KPTPQLAAFSASKAYLDHFSRALQYEYASKGIFVQSLIPFYVATSMTAPSNFLHRCSWLV 210 220 230 240 250 260 250 260 270 280 290 300 pF1KE5 KTADEFVKESLNYVTIGGETCGCLAHEILAGFLSLIPAWAFYSGAFQRLLLTHYVAYLKL . ....... . :. .: : .: : : . .: : . :: CCDS10 PSPKVYAHHAVSTLGISKRTTGYWSHSIQFLFAQYMPEWLWVWGANILNRSLRKEALSCT 270 280 290 300 310 320 310 pF1KE5 NTKVR CCDS10 A 330 >>CCDS54046.1 HSDL1 gene_id:83693|Hs108|chr16 (275 aa) initn: 405 init1: 227 opt: 268 Z-score: 343.5 bits: 71.5 E(32554): 8.2e-13 Smith-Waterman score: 337; 31.0% identity (55.6% similar) in 252 aa overlap (43-290:62-259) 20 30 40 50 60 70 pF1KE5 GLLVCLACLAKCVRFSRCVLLNYWKVLPKSFLRSMGQWAVITGAGDGIGKAYSFELAKRG .....:.:::..:: :::::::. :::.:: CCDS54 YTARKSITVICDFYSLIRLHFIPRLGSRADLIKQYGRWAVVSGATDGIGKAYAEELASRG 40 50 60 70 80 90 80 90 100 110 120 130 pF1KE5 LNVVLISRTLEKLEAIATEIERTTGRSVKIIQADFTKDDIYEHIKEKLAGLEIGILVNNV ::..::::. :::. ::. ..: CCDS54 LNIILISRNEEKLQY-------------------FTQ------LSE-------------- 100 110 140 150 160 170 180 190 pF1KE5 GMLPNLLPSHFLNAPDEIQSLIHCNITSVVKMTQLILKHMESRQKGLILNISSGIALFPW :.. ..:. ::... :....: : :.:: :..:::: : CCDS54 ---------------DKLWDIINVNIAAASLMVHVVLPGMVERKKGAIVTISSGSCCKPT 120 130 140 150 200 210 220 230 240 pF1KE5 PLYSMYSASKAFVCAFSKALQEEYKAKEVIIQVLTPYAVSTAMTKYLN----TNVITKTA : . .:::::.. ::.::: :: .: ...: : :. :.:.:: : . .. . CCDS54 PQLAAFSASKAYLDHFSRALQYEYASKGIFVQSLIPFYVATSMTAPSNFLHRCSWLVPSP 160 170 180 190 200 210 250 260 270 280 290 300 pF1KE5 DEFVKESLNYVTIGGETCGCLAHEILAGFLSLIPAWAFYSGAFQRLLLTHYVAYLKLNTK ....... . :. .: : .: : : . .: : . :: CCDS54 KVYAHHAVSTLGISKRTTGYWSHSIQFLFAQYMPEWLWVWGANILNRSLRKEALSCTA 220 230 240 250 260 270 310 pF1KE5 VR >>CCDS9743.1 DHRS7 gene_id:51635|Hs108|chr14 (339 aa) initn: 232 init1: 118 opt: 250 Z-score: 319.4 bits: 67.4 E(32554): 1.8e-11 Smith-Waterman score: 250; 27.7% identity (57.8% similar) in 256 aa overlap (3-247:4-253) 10 20 30 40 50 pF1KE5 MGDVLEQFFILTGLLVCLACLAKCVRFSR--CVLLNYWK-VLPKSFLRSMGQWAVITGA ..: ...: .::. :. : . .: . .: :. :. : .: : .::: CCDS97 MNWELLLWLLVLCALLLLLVQLLRFLRADGDLTLLWAEWQGRRPEWELTDMVVW--VTGA 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 GDGIGKAYSFELAKRGLNVVLISRTLEKLEAIAT---EIERTTGRSVKIIQADFTKDDIY ..:::. ...:.: :...:: .: ...:: . : ... .. :.: : CCDS97 SSGIGEELAYQLSKLGVSLVLSARRVHELERVKRRCLENGNLKEKDILVLPLDLT--DTG 60 70 80 90 100 110 120 130 140 150 160 pF1KE5 EHIKEKLAGLE----IGILVNNVGMLPNLLPSHFLNAPDEIQSLIHCNITSVVKMTQLIL : : :. : ::::: :: : .. : ..::. : ..:..:. .: CCDS97 SHEAATKAVLQEFGRIDILVNNGGMSQRSLCMD--TSLDVYRKLIELNYLGTVSLTKCVL 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE5 KHMESRQKGLILNISSGIALFPWPLYSMYSASKAFVCAFSKALQEEYKAKE-VIIQVLTP :: :..: :....: .... :: : ::: . .: ..:. : . .:.. . : CCDS97 PHMIERKQGKIVTVNSILGIISVPLSIGYCASKHALRGFFNGLRTELATYPGIIVSNICP 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE5 YAVSTAMTKYLNTNVITKTADEFVKESLNYVTIGGETCGCLAHEILAGFLSLIPAWAFYS :.. ... .. .::: CCDS97 GPVQSNIVENSLAGEVTKTIGNNGDQSHKMTTSRCVRLMLISMANDLKEVWISEQPFLLV 240 250 260 270 280 290 >>CCDS9605.1 DHRS4 gene_id:10901|Hs108|chr14 (278 aa) initn: 124 init1: 105 opt: 242 Z-score: 310.6 bits: 65.4 E(32554): 5.6e-11 Smith-Waterman score: 242; 27.9% identity (62.2% similar) in 222 aa overlap (51-266:35-248) 30 40 50 60 70 80 pF1KE5 LAKCVRFSRCVLLNYWKVLPKSFLRSMGQWAVITGAGDGIGKAYSFELAKRGLNVVLISR :..:.. :::: : . .::. : .::. :: CCDS96 GLLGLCARAWNSVRMASSGMTRRDPLANKVALVTASTDGIGFAIARRLAQDGAHVVVSSR 10 20 30 40 50 60 90 100 110 120 130 pF1KE5 TLEKLE-AIAT---EIERTTGRSVKIIQADFTKDDIYEHIKEKLAGLEIGILVNNVGMLP .... :.:: : .:: .. .:. . . .: : : : :::.:... : CCDS96 KQQNVDQAVATLQGEGLSVTGTVCHVGKAEDRERLVATAVK--LHG-GIDILVSNAAVNP 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE5 NLLPSHFLNAPDEI-QSLIHCNITSVVKMTQLILKHMESRQKGLILNISSGIALFPWPLY . . .... .:. .. . :. . . ::. .. .::.: : .. .:: :. : : . CCDS96 FF--GSIMDVTEEVWDKTLDINVKAPALMTKAVVPEMEKRGGGSVVIVSSIAAFSPSPGF 130 140 150 160 170 200 210 220 230 240 250 pF1KE5 SMYSASKAFVCAFSKALQEEYKAKEVIIQVLTPYAVSTAMTKYLNTNVITKTADEFVKES : :..::. . ...:.: : ... .. :.: ..:.....: . : .: .::. CCDS96 SPYNVSKTALLGLTKTLAIELAPRNIRVNCLAPGLIKTSFSRML---WMDKEKEESMKET 180 190 200 210 220 230 260 270 280 290 300 310 pF1KE5 LNYVTIG-GETCGCLAHEILAGFLSLIPAWAFYSGAFQRLLLTHYVAYLKLNTKVR : .: : : CCDS96 LRIRRLGEPEDCAGIVSFLCSEDASYITGETVVVGGGTPSRL 240 250 260 270 310 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 00:24:28 2016 done: Tue Nov 8 00:24:28 2016 Total Scan time: 1.820 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]