FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4506, 529 aa 1>>>pF1KE4506 529 - 529 aa - 529 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5679+/-0.00102; mu= 16.6282+/- 0.061 mean_var=65.4690+/-13.394, 0's: 0 Z-trim(103.0): 35 B-trim: 0 in 0/48 Lambda= 0.158510 statistics sampled from 7171 (7205) to 7171 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.589), E-opt: 0.2 (0.221), width: 16 Scan time: 2.330 The best scores are: opt bits E(32554) CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 529) 3604 833.5 0 CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 528) 3225 746.8 1.4e-215 CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 ( 529) 3185 737.7 7.9e-213 CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 528) 3147 729.0 3.3e-210 CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 529) 3147 729.0 3.3e-210 CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 ( 530) 2873 666.3 2.4e-191 CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 ( 530) 2872 666.1 2.8e-191 CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 369) 2460 571.8 4.7e-163 CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 2289 532.8 3.8e-151 CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 536) 2267 527.7 1.3e-149 CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 ( 527) 2186 509.2 4.7e-144 CCDS75137.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 369) 2124 495.0 6.3e-140 CCDS56330.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 335) 1920 448.3 6.4e-126 CCDS75135.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 444) 1893 442.2 5.9e-124 CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1714 401.3 1.5e-111 CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 ( 530) 1495 351.2 1.7e-96 CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 ( 533) 1481 348.0 1.6e-95 CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 ( 534) 1478 347.3 2.6e-95 CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 ( 530) 1474 346.4 4.9e-95 CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 ( 530) 1470 345.5 9.1e-95 CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 ( 534) 1469 345.3 1.1e-94 CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 ( 530) 1465 344.3 2e-94 CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 532) 1440 338.6 1.1e-92 CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 ( 534) 1428 335.9 7.2e-92 CCDS77925.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 483) 1112 263.6 3.7e-70 CCDS77924.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 492) 1112 263.6 3.8e-70 CCDS58902.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 693) 1112 263.7 5.1e-70 CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 265) 1083 256.9 2.2e-68 CCDS3705.1 UGT8 gene_id:7368|Hs108|chr4 ( 541) 1035 246.0 8.2e-65 CCDS3913.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 523) 912 217.9 2.3e-56 CCDS3914.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 523) 884 211.5 2e-54 CCDS54842.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 489) 877 209.9 5.7e-54 CCDS54841.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 252) 349 89.0 7e-18 >>CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 (529 aa) initn: 3604 init1: 3604 opt: 3604 Z-score: 4452.2 bits: 833.5 E(32554): 0 Smith-Waterman score: 3604; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA 430 440 450 460 470 480 490 500 510 520 pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND 490 500 510 520 >>CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 (528 aa) initn: 3195 init1: 3195 opt: 3225 Z-score: 3983.8 bits: 746.8 E(32554): 1.4e-215 Smith-Waterman score: 3225; 87.5% identity (96.6% similar) in 529 aa overlap (1-529:1-528) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA :..:::.: ::::::: ::::.:::::::::::: :::.:::: ::.::::::::::::: CCDS75 MALKWTTV-LLIQLSFYFSSGSCGKVLVWAAEYSLWMNMKTILKELVQRGHEVTVLASSA 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG :::::::.::.::.:.:::::::::.::.::: .:: :.. :::::: ::: :::. .. CCDS75 SILFDPNDSSTLKLEVYPTSLTKTEFENIIMQLVKRLSEIQKDTFWLPFSQEQEILWAIN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF :: :.::::::::::.:::.::::::..:::: .::.:::::::::::::: ::::::.: CCDS75 DIIRNFCKDVVSNKKLMKKLQESRFDIVFADAYLPCGELLAELFNIPFVYSHSFSPGYSF 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL :.:::::::::::::::::.:.::::::::::::.:::::::::.::.:::::::::::: CCDS75 ERHSGGFIFPPSYVPVVMSKLSDQMTFMERVKNMLYVLYFDFWFQIFNMKKWDQFYSEVL 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG :::::::::: :::.::.::::::.::.:.:::::::::::::::::::::::.:::::: CCDS75 GRPTTLSETMRKADIWLMRNSWNFKFPHPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSSG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN :::::::::::::::::::::::::.:::.:::::::::::::::.:::::::::::::: CCDS75 ENGVVVFSLGSMVSNMTEERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQN 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM :::::::::::::::::::::::::::::::::::: :::::::::::.::::::::::: CCDS75 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRVDFNTM 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA :::::::::: ::::::::::.:::::::::::::::::::::::::::::::::::::: CCDS75 SSTDLLNALKTVINDPSYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA 420 430 440 450 460 470 490 500 510 520 pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND :.::::::::::::::::.:::::.::.::::::::::::::.:::: : CCDS75 HNLTWFQYHSLDVIGFLLACVATVLFIITKCCLFCFWKFARKGKKGKRD 480 490 500 510 520 >>CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 (529 aa) initn: 3213 init1: 3175 opt: 3185 Z-score: 3934.4 bits: 737.7 E(32554): 7.9e-213 Smith-Waterman score: 3185; 85.6% identity (95.8% similar) in 529 aa overlap (1-529:1-529) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA :..:::::.:::.:: ::::.::::::::::::::::.:::: ::.::::::::::::: CCDS35 MTLKWTSVLLLIHLSCYFSSGSCGKVLVWAAEYSHWMNMKTILKELVQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG :::::::..:.::.:.:::::::::.::.::::.:::::. ::.::::::: :::. . CCDS35 SILFDPNDASTLKFEVYPTSLTKTEFENIIMQQVKRWSDIRKDSFWLYFSQEQEILWELY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF :: :.:::::::::: :::.::::::..::::.:::.:::: :.:: ::::: :.::::. CCDS35 DIFRNFCKDVVSNKKVMKKLQESRFDIVFADAVFPCGELLAALLNIRFVYSLRFTPGYTI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL :.::::.::::::.:.:::.:.::::::::::::::::::::::.. ::::::::::::: CCDS35 ERHSGGLIFPPSYIPIVMSKLSDQMTFMERVKNMIYVLYFDFWFQMSDMKKWDQFYSEVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG :::::: :::::::.::.::::.::::.:.:::::::::.:::::::::::::.:::::: CCDS35 GRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNVDFVGGFHCKPAKPLPKEMEEFVQSSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN :::::::::::..:::: :::::::.:::.:::::::::::::::.:::::::::::::: CCDS35 ENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM :::::::::::::::::::::::::::::::::::: :::::::::::.:::::.::::: CCDS35 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRLDFNTM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA :::::::::: ::::: ::::.:::::::::::::::::::::::::: ::::::::::: CCDS35 SSTDLLNALKTVINDPLYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMPHKGAKHLRVAA 430 440 450 460 470 480 490 500 510 520 pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND ::::::::::::::::::.::::::::.:: :::::::::::.:::: : CCDS35 HDLTWFQYHSLDVIGFLLACVATVIFIITKFCLFCFWKFARKGKKGKRD 490 500 510 520 >>CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 (528 aa) initn: 3158 init1: 3066 opt: 3147 Z-score: 3887.4 bits: 729.0 E(32554): 3.3e-210 Smith-Waterman score: 3147; 85.4% identity (95.7% similar) in 529 aa overlap (1-529:1-528) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA ::.::::..:::::: ::::.::::::: .:.:::::::::::::.::::::::::::: CCDS43 MSMKWTSALLLIQLSCYFSSGSCGKVLVWPTEFSHWMNIKTILDELVQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG :: ::::. :.::.:.::.::::::.:..: : .:::..::::::: ::::::::: :. CCDS43 SISFDPNSPSTLKFEVYPVSLTKTEFEDIIKQLVKRWAELPKDTFWSYFSQVQEIMWTFN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF :: ::::::.:::::.:::.:::::::..:::.:: .::::::..::::::: :::::.. CCDS43 DILRKFCKDIVSNKKLMKKLQESRFDVVLADAVFPFGELLAELLKIPFVYSLRFSPGYAI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL ::::::..:::::::::::::.:::::.::::::::::::.:::.::::::::::::::: CCDS43 EKHSGGLLFPPSYVPVVMSELSDQMTFIERVKNMIYVLYFEFWFQIFDMKKWDQFYSEVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG ::::::::::.:::.::::: :.::::.::::::.::::::::::::::::::.:::::: CCDS43 GRPTTLSETMAKADIWLIRNYWDFQFPHPLLPNVEFVGGLHCKPAKPLPKEMEEFVQSSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN ::::::::::::::: .::::::::::::.:::::::::::::::::::::::::::::: CCDS43 ENGVVVFSLGSMVSNTSEERANVIASALAKIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM ::::::::::::::::::::::::::::::::.:::::::::::::::.:::: .::.:: CCDS43 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGVPLFADQPDNIAHMKAKGAAVSLDFHTM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA :::::::::: ::::: ::::.::::::.::::::::::::::::::::::::::::::: CCDS43 SSTDLLNALKTVINDPLYKENAMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA 430 440 450 460 470 480 490 500 510 520 pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND ::::::::::::: ::::.::::::::.::: ::: :::.: .:::: : CCDS43 HDLTWFQYHSLDVTGFLLACVATVIFIITKC-LFCVWKFVRTGKKGKRD 490 500 510 520 >>CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 (529 aa) initn: 3176 init1: 3138 opt: 3147 Z-score: 3887.4 bits: 729.0 E(32554): 3.3e-210 Smith-Waterman score: 3147; 85.1% identity (95.5% similar) in 529 aa overlap (1-529:1-529) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA :..:::::.:::.:. ::::.:::::::..:::::::.:::: ::.::::::::::::: CCDS35 MALKWTSVLLLIHLGCYFSSGSCGKVLVWTGEYSHWMNMKTILKELVQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG :::::::.. .::.:.:::::::::.::.::::.:::::. ::.::::::: :::. : CCDS35 SILFDPNDAFTLKLEVYPTSLTKTEFENIIMQQVKRWSDIQKDSFWLYFSQEQEILWEFH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF :: :.:::::::::: :::.::::::.:::::.:::.:::: :.:::::::: :.::::. CCDS35 DIFRNFCKDVVSNKKVMKKLQESRFDIIFADAFFPCGELLAALLNIPFVYSLCFTPGYTI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL :.::::.::::::.:::::.:.::::::::::::::::::::::.. ::::::::::::: CCDS35 ERHSGGLIFPPSYIPVVMSKLSDQMTFMERVKNMIYVLYFDFWFQMCDMKKWDQFYSEVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG :::::: :::::::.::.::::.::::.:.:::.:::::::::::::::::::.:::::: CCDS35 GRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNIDFVGGLHCKPAKPLPKEMEEFVQSSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN :::::::::::..:::: :::::::.:::.:::::::::::::::.:::::::::::::: CCDS35 ENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM :::: ::::::::::::::::::::::::::::::: :::::::::::.:::::.::.:: CCDS35 DLLGLPKTRAFITHGGANGIYEAIYHGIPMVGIPLFWDQPDNIAHMKAKGAAVRLDFHTM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA :::::::::: ::::::::::::::: :::::::::: :::::::::: ::::::::::: CCDS35 SSTDLLNALKTVINDPSYKENVMKLSIIQHDQPVKPLHRAVFWIEFVMCHKGAKHLRVAA 430 440 450 460 470 480 490 500 510 520 pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND .:::::::::::::::::.:::::::.::: :::::::::::.:::: : CCDS35 RDLTWFQYHSLDVIGFLLACVATVIFVVTKFCLFCFWKFARKGKKGKRD 490 500 510 520 >>CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 (530 aa) initn: 2909 init1: 2431 opt: 2873 Z-score: 3548.8 bits: 666.3 E(32554): 2.4e-191 Smith-Waterman score: 2873; 77.9% identity (92.1% similar) in 530 aa overlap (1-529:1-530) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA ::.:::::.:::::: ::::.::::::: .:::::.:.::::.::.:::::::::.::: CCDS35 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRW-SDLPKDTFWLYFSQVQEIMSIF : : . ..:::.:.:.:::::::. ::. ... . :: . :.::: ::::.::. . CCDS35 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 GDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYT : . :.:::.: :::.: :.:::.::::.:::. ::.:::::::::::.::: :: ::: CCDS35 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 FEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEV :::..:::.:::::::::::::.::: ::::.::::..:::::::.:.:.:::::::::: CCDS35 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 LGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSS ::::::: ::::::..::::. :.:.:: :.:::::::::::::::::::::::.::::: CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 GENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ ::::.::::::::.:::.:: ::.::::::::::::::::::.::.::: :::::::.:: CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNT :::::::::.:::::::.:::::::::::::::::::::: ::::::::.:::. ::. : CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 MSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA ::: ::::::: ::::: :::::::::::.::::.::::::::::::::::::::::::: CCDS35 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA 430 440 450 460 470 480 480 490 500 510 520 pF1KE4 AHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND ::.:::.::::::::.:::.::::::::.:: ::::: :.:.:.:: : : CCDS35 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD 490 500 510 520 530 >>CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 (530 aa) initn: 2861 init1: 2415 opt: 2872 Z-score: 3547.5 bits: 666.1 E(32554): 2.8e-191 Smith-Waterman score: 2872; 76.8% identity (92.8% similar) in 530 aa overlap (1-529:1-530) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA ::.:: ::.::.::: ::::.::::::: .:::::.:.::::.::.:::::: ::.::: CCDS35 MSLKWMSVFLLMQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVIVLTSSA 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWS-DLPKDTFWLYFSQVQEIMSIF ::: . ..:::.:.:.:::::::..::.:.:... ::. .. :.::: ::::.::. . CCDS35 SILVNASKSSAIKLEVYPTSLTKNDLEDFFMKMFDRWTYSISKNTFWSYFSQLQELCWEY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 GDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYT .: . :.:.:.: :::.:.:.:::.:::..:::. ::.::::::.::::.::: :: ::: CCDS35 SDYNIKLCEDAVLNKKLMRKLQESKFDVLLADAVNPCGELLAELLNIPFLYSLRFSVGYT 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 FEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEV ::..:::.:::::::::::::.::: ::::.:::::.:::::::. .:.:::::::::: CCDS35 VEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIYMLYFDFWFQAYDLKKWDQFYSEV 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 LGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSS ::::::: ::::::..::::. :.:.:: :.:::::::::::::::::::::::.::::: CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 GENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ ::::.::::::::.:::.:: ::.::::::::::::::::::.::.::: :::::::.:: CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE4 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNT :::::::::.:::::::.:::::::::::::::::::::: ::::::::.:::. ::. : CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE4 MSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA ::: ::::::: ::::: ::::.::::::.:::::::::::::::::::::::::::::: CCDS35 MSSRDLLNALKSVINDPIYKENIMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA 430 440 450 460 470 480 480 490 500 510 520 pF1KE4 AHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND ::.:::.::::::::.:::.::::.::..:::::::: :.:. .:: : : CCDS35 AHNLTWIQYHSLDVIAFLLACVATMIFMITKCCLFCFRKLAKTGKKKKRD 490 500 510 520 530 >>CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 (369 aa) initn: 2460 init1: 2460 opt: 2460 Z-score: 3040.8 bits: 571.8 E(32554): 4.7e-163 Smith-Waterman score: 2460; 100.0% identity (100.0% similar) in 363 aa overlap (1-363:1-363) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM ::: CCDS82 DLLDIKRML >>CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 (527 aa) initn: 2235 init1: 1695 opt: 2289 Z-score: 2827.0 bits: 532.8 E(32554): 3.8e-151 Smith-Waterman score: 2289; 62.6% identity (86.8% similar) in 508 aa overlap (24-529:21-527) 10 20 30 40 50 60 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA :.::.: : :::.:.: :.::::.. :.::::..:. CCDS35 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG 10 20 30 40 50 70 80 90 100 110 pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRW-SDLPK-DTFWLYFSQVQEIMSI .... :... .: .::: . . : ..:. : . . : . :. .:.: ..... .... CCDS35 ALFITPTSNPSLTFEIYKVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 FGDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGY : .....: :..:...: :...:.:.:. .: .:::....: ..:::.::: :::. CCDS35 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 TFEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSE : ::: : .::::::.:.:::::::.: .:..:.: :. :: . :.::..::. CCDS35 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 VLGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQS .::::::: ::::::..::::. :.:.:: : ::: .::::::::::::::::::.:.:: CCDS35 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 SGENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIP ::.::::::::::::.:.:::.::.:::::::::::::::. :.:: ::: ::.:. ::: CCDS35 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 QNDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFN ::::::::::.:::::::.::::::::::.::::.:.:::::::::::::.::::.:..: CCDS35 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 TMSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRV ::.:.:::.::. :::.::::::.:.::::.::::::::::::::::::::::::::::: CCDS35 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV 420 430 440 450 460 470 480 490 500 510 520 pF1KE4 AAHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND :::::::::::::::::::::::.:.::.: .:::: ::.. .:: : . CCDS35 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE 480 490 500 510 520 >>CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 (536 aa) initn: 2228 init1: 1672 opt: 2267 Z-score: 2799.7 bits: 527.7 E(32554): 1.3e-149 Smith-Waterman score: 2267; 63.4% identity (86.0% similar) in 508 aa overlap (24-529:30-536) 10 20 30 40 50 pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVT :.::.: .. :::.::: ::.:::::.:.:: CCDS56 MVSIRDFTMPKKFVQMLVFNLTLTEVVLSGNVLIWPTDGSHWLNIKIILEELIQRNHNVT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 VLASSASILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDL-PKD-TFWLYFSQV ::::::..... : .: ...:. :.: :......: ..: : : : :.: ..... CCDS56 VLASSATLFINSNPDSPVNFEVIPVSYKKSNIDSLIEHMIMLWIDHRPTPLTIWAFYKEL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 QEIMSIFGDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSL .... : .:. ..: :..: :.: ..:.. :::. :: . :..:.: ..:::.:.: CCDS56 GKLLDTFFQINIQLCDGVLKNPKLMARLQKGGFDVLVADPVTICGDLVALKLGIPFMYTL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SFSPGYTFEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKW :::. : :.: : . : ::::...::::::::: ::.:: : :. :. . .: CCDS56 RFSPASTVERHCGKIPAPVSYVPAALSELTDQMTFGERIKNTISYSLQDYIFQSY-WGEW 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 DQFYSEVLGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEM ...::..::::::: ::::::..::::. :.:.:: : ::: .::::::::::::::::: CCDS56 NSYYSKILGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 EDFVQSSGENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTR :.:.::::.::::::::::::.:.:::.::.:::::::::::::::. :.:: ::: ::. CCDS56 EEFIQSSGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 LYKWIPQNDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAA :. :::::::::::::.:::::::.::::::::::.::::.:.:::::::::::::.::: CCDS56 LFDWIPQNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 VRVDFNTMSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKG :.:..:::.:.:::.::. :::.::::::.:.::::.::::::::::::::::::::::: CCDS56 VEVNLNTMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKG 420 430 440 450 460 470 480 490 500 510 520 pF1KE4 AKHLRVAAHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND :::::::::::::::::::::::::::::.:.::.: .:::: ::.. .:: : . CCDS56 AKHLRVAAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE 480 490 500 510 520 530 529 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 14:38:45 2016 done: Mon Nov 7 14:38:45 2016 Total Scan time: 2.330 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]