FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6450, 527 aa 1>>>pF1KE6450 527 - 527 aa - 527 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5370+/-0.000937; mu= 16.8852+/- 0.056 mean_var=66.0570+/-13.505, 0's: 0 Z-trim(104.5): 37 B-trim: 0 in 0/48 Lambda= 0.157803 statistics sampled from 7915 (7952) to 7915 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.618), E-opt: 0.2 (0.244), width: 16 Scan time: 2.040 The best scores are: opt bits E(32554) CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 3567 821.3 0 CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 536) 2953 681.5 6.5e-196 CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 2917 673.3 1.9e-193 CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 528) 2314 536.0 4e-152 CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 529) 2287 529.9 2.8e-150 CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 ( 530) 2275 527.1 1.9e-149 CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 ( 530) 2255 522.6 4.4e-148 CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 ( 527) 2251 521.7 8.3e-148 CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 ( 529) 2218 514.2 1.5e-145 CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 528) 2189 507.6 1.5e-143 CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 529) 2176 504.6 1.1e-142 CCDS77925.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 483) 1967 457.0 2.2e-128 CCDS75135.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 444) 1643 383.2 3.3e-106 CCDS58902.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 693) 1589 371.0 2.5e-102 CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 ( 533) 1555 363.2 4.2e-100 CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 532) 1553 362.8 5.7e-100 CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 ( 534) 1465 342.7 6.2e-94 CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 ( 534) 1464 342.5 7.2e-94 CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 ( 534) 1462 342.0 9.9e-94 CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 ( 530) 1448 338.9 8.9e-93 CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 ( 530) 1447 338.6 1e-92 CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 ( 530) 1432 335.2 1.1e-91 CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 ( 530) 1420 332.5 7.4e-91 CCDS75137.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 369) 1379 323.1 3.5e-88 CCDS77924.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 492) 1342 314.7 1.5e-85 CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 369) 1335 313.1 3.6e-85 CCDS56330.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 335) 1147 270.3 2.5e-72 CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 265) 1090 257.2 1.7e-68 CCDS3705.1 UGT8 gene_id:7368|Hs108|chr4 ( 541) 1066 251.9 1.4e-66 CCDS3913.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 523) 875 208.4 1.6e-53 CCDS3914.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 523) 875 208.4 1.6e-53 CCDS54842.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 489) 860 205.0 1.7e-52 CCDS54841.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 252) 290 75.1 1.1e-13 >>CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 (527 aa) initn: 3567 init1: 3567 opt: 3567 Z-score: 4386.3 bits: 821.3 E(32554): 0 Smith-Waterman score: 3567; 99.8% identity (100.0% similar) in 527 aa overlap (1-527:1-527) 10 20 30 40 50 60 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASGALF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASGALF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 ITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKDFHM ::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ITPTSNPSLTFEIYKVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKDFHM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 VSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPASTVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPASTVE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 KHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETLWKSWDSYYSKALGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 KHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETLWKSWDSYYSKALGR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 PTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQSSGKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 PTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQSSGKN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 GVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIPQNDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIPQNDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 LGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLNTMTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLNTMTS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 VDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAAHD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 VDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAAHD 430 440 450 460 470 480 490 500 510 520 pF1KE6 LTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE ::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE 490 500 510 520 >>CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 (536 aa) initn: 2948 init1: 2948 opt: 2953 Z-score: 3630.7 bits: 681.5 E(32554): 6.5e-196 Smith-Waterman score: 2953; 80.7% identity (93.1% similar) in 523 aa overlap (5-527:16-536) 10 20 30 40 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHN .:.:.: .. . .:.::::::: .::::::.:::..:::...:: CCDS56 MVSIRDFTMPKKFVQMLVFNLTLTEV--VLSGNVLIWPTDGSHWLNIKIILEELIQRNHN 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 VTVLVASGALFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQ ::::..:..:::. . . ..::. : . : :...:. ... :...::.: ::: ::. CCDS56 VTVLASSATLFINSNPDSPVNFEVIPVSYKKSNIDSLIEHMIMLWIDHRPTPLTIWAFYK 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 EMAKVIKDFHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMY :..:.. : ... ..::::::: .:::.:.:. :.:::.::: :::.::::::::::: CCDS56 ELGKLLDTFFQINIQLCDGVLKNPKLMARLQKGGFDVLVADPVTICGDLVALKLGIPFMY 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 SLRFSPASTVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETLWKS .::::::::::.::::.: : :::::.::::::::.: .::.: ::: ::::.:.. : CCDS56 TLRFSPASTVERHCGKIPAPVSYVPAALSELTDQMTFGERIKNTISYSLQDYIFQSYWGE 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 WDSYYSKALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKE :.::::: :::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 WNSYYSKILGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKE 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 MEEFIQSSGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MEEFIQSSGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNT 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 QLFDWIPQNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 QLFDWIPQNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGA 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE6 AVEVNLNTMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 AVEVNLNTMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHK 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE6 GAKHLRVAAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 GAKHLRVAAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE 480 490 500 510 520 530 >>CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 (527 aa) initn: 2821 init1: 2821 opt: 2917 Z-score: 3586.5 bits: 673.3 E(32554): 1.9e-193 Smith-Waterman score: 3106; 84.4% identity (84.6% similar) in 571 aa overlap (1-527:1-527) 10 20 30 40 50 60 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASGALF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASGALF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 ITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKDFHM ::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::: CCDS58 ITPTSNPSLTFEIYKVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKDFHM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 VSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPASTVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPASTVE 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 KHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETLWKSWDSYYSKALG- ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETLWKSWDSYYSKALGG 190 200 210 220 230 240 240 250 pF1KE6 -------------------------------------------RPTTLCETMGKAEIWLI ::::::::::::::::: CCDS58 LLLCCPGWSAVADLGSLQPLLPGFKRFSRLSLHCSWDYRLPAGRPTTLCETMGKAEIWLI 250 260 270 280 290 300 260 270 280 290 300 310 pF1KE6 RTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQSSGKNGVVVFSLGSMVKNLTE :::::::::::::::::::::::::::::::: CCDS58 RTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPK---------------------------- 310 320 330 320 330 340 350 360 370 pF1KE6 EKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIPQNDLLGHPKTKAFITHGGTN :::::::::::::::::::::::::::::::::::::::::::: CCDS58 ----------------VLWRYKGKKPATLGNNTQLFDWIPQNDLLGHPKTKAFITHGGTN 340 350 360 370 380 390 400 410 420 430 pF1KE6 GIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLNTMTSVDLLSALRTVINEPSY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLNTMTSVDLLSALRTVINEPSY 380 390 400 410 420 430 440 450 460 470 480 490 pF1KE6 KENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAAHDLTWFQYHSLDVIGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAAHDLTWFQYHSLDVIGFLL 440 450 460 470 480 490 500 510 520 pF1KE6 VCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE ::::::::::::::::::::::::::::::: CCDS58 VCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE 500 510 520 >>CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 (528 aa) initn: 2267 init1: 1641 opt: 2314 Z-score: 2844.6 bits: 536.0 E(32554): 4e-152 Smith-Waterman score: 2314; 64.0% identity (86.8% similar) in 508 aa overlap (21-527:24-528) 10 20 30 40 50 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG :.::.:: : :::.:.: :.:::... :.::::..:. CCDS43 MSMKWTSALLLIQLSCYFSSGSCGKVLVWPTEFSHWMNIKTILDELVQRGHEVTVLASSA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 ALFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD .. . :.: .: ::.: : . : ..: .::..: : : :. .:.: ..... ... CCDS43 SISFDPNSPSTLKFEVYPVSLTKTEFEDIIKQLVKRWAE-LPK-DTFWSYFSQVQEIMWT 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS :. . ...: ...:..:: ::..:.:.:...: ::: :...: : :::.:::::::. CCDS43 FNDILRKFCKDIVSNKKLMKKLQESRFDVVLADAVFPFGELLAELLKIPFVYSLRFSPGY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK ..::: : . .::::::.:.:::.:::.: .:..:.: .. :. . :.::..::. CCDS43 AIEKHSGGLLFPPSYVPVVMSELSDQMTFIERVKNMIYVLYFEFWFQIFDMKKWDQFYSE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS .::::::: :::.::.:::::.::::.::.: ::: :::::::::::::::::::::.:: CCDS43 VLGRPTTLSETMAKADIWLIRNYWDFQFPHPLLPNVEFVGGLHCKPAKPLPKEMEEFVQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP ::.::::::::::::.: .::.::.::::::.::::::::. :.:: ::: ::.:. ::: CCDS43 SGENGVVVFSLGSMVSNTSEERANVIASALAKIPQKVLWRFDGNKPDTLGLNTRLYKWIP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN ::::::::::.:::::::.::::::::::.::::::.:::::::::::::::::: .... CCDS43 QNDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGVPLFADQPDNIAHMKAKGAAVSLDFH 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV ::.:.:::.::.::::.: ::::::.:::::::::::::::::::::::::::::::::: CCDS43 TMSSTDLLNALKTVINDPLYKENAMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE ::::::::::::::: ::::.::.:.::.. .: :: :: . ::: ::. CCDS43 AAHDLTWFQYHSLDVTGFLLACVATVIFIITKC-LFCVWKFVRTGKKGKRD 480 490 500 510 520 >>CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 (529 aa) initn: 2229 init1: 1695 opt: 2287 Z-score: 2811.4 bits: 529.9 E(32554): 2.8e-150 Smith-Waterman score: 2287; 62.6% identity (86.8% similar) in 508 aa overlap (21-527:24-529) 10 20 30 40 50 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG :.::.: : :::.:.: :.::::.. :.::::..:. CCDS35 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 ALFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD .... :... .: .::: . . : ..:. : . . : . :. .:.: ..... .... CCDS35 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRW-SDLPK-DTFWLYFSQVQEIMSI 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS : .....: :..:...: :...:.:.:. .: .:::....: ..:::.::: :::. CCDS35 FGDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK : ::: : .::::::.:.:::::::.: .:..:.: :. :: . :.::..::. CCDS35 TFEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS .::::::: ::::::..::::. :.:.:: : ::: .::::::::::::::::::.:.:: CCDS35 VLGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP ::.::::::::::::.:.:::.::.:::::::::::::::. :.:: ::: ::.:. ::: CCDS35 SGENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN ::::::::::.:::::::.::::::::::.::::.:.:::::::::::::.::::.:..: CCDS35 QNDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV ::.:.:::.::. :::.::::::.:.::::.::::::::::::::::::::::::::::: CCDS35 TMSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRV 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE :::::::::::::::::::::::.:.::.: .:::: ::.. .:: : . CCDS35 AAHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND 480 490 500 510 520 >>CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 (530 aa) initn: 2242 init1: 1724 opt: 2275 Z-score: 2796.6 bits: 527.1 E(32554): 1.9e-149 Smith-Waterman score: 2275; 62.4% identity (86.0% similar) in 508 aa overlap (21-527:24-530) 10 20 30 40 50 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG :.::.:: : :::.:.: :..::... :.: ::..:. CCDS35 MSLKWMSVFLLMQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVIVLTSSA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 ALFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD ..... ... .. .:.: . . :. .: . . : . : .:.: ..... .. . CCDS35 SILVNASKSSAIKLEVYPTSLTKNDLEDFFMKMFDRWTYS-ISKNTFWSYFSQLQELCWE 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS . . ..:. .. :..:: ::..:::.::..: : :::...: :.:::.:::::: . CCDS35 YSDYNIKLCEDAVLNKKLMRKLQESKFDVLLADAVNPCGELLAELLNIPFLYSLRFSVGY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK ::::. : .::::::.:.:::.::: : .::.:.: . :. :.. :.::..::. CCDS35 TVEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIYMLYFDFWFQAYDLKKWDQFYSE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS .::::::: :::::::.::::::::::::::.::: .::::::::::::::::::::.:: CCDS35 VLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP ::.::.::::::::..:..::.::.:::::::::::::::. :::: :::.::.:. :.: CCDS35 SGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN :::::::::::::::::::::::::::::.::::.:.:::: ::::::::::::. :.. CCDS35 QNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV ::.: :::.::..:::.: :::: :.:::::::::::::::::::::::::::::::::: CCDS35 TMSSRDLLNALKSVINDPIYKENIMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE :::.:::.::::::::.:::.::.: ::.. .:::: .:..: ::::::. CCDS35 AAHNLTWIQYHSLDVIAFLLACVATMIFMITKCCLFCFRKLAKTGKKKKRD 480 490 500 510 520 530 >>CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 (530 aa) initn: 2115 init1: 1787 opt: 2255 Z-score: 2772.0 bits: 522.6 E(32554): 4.4e-148 Smith-Waterman score: 2255; 61.6% identity (86.4% similar) in 508 aa overlap (21-527:24-530) 10 20 30 40 50 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG :.::.:: : :::.:.: :..::... :.::::..:. CCDS35 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 ALFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD . ... ... .. .:.: . . :. .: . .. :. . : .:.: ..... .. . CCDS35 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGV-SKNTFWSYFSQLQELCWE 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS .. :...: .. :..:: ::..:::.:...: . :::...: ..:::.:::::: . CCDS35 YYDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK : ::. : .::::::.:.:::.::: : .::.:.: . :. :. :.::..::. CCDS35 TFEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS .::::::: :::::::.::::::::::::::.::: .::::::::::::::::::::.:: CCDS35 VLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP ::.::.::::::::..:..::.::.:::::::::::::::. :::: :::.::.:. :.: CCDS35 SGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN :::::::::::::::::::::::::::::.::::.:.:::: ::::::::::::. :.. CCDS35 QNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIR 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV ::.: :::.::..:::.: ::::.:.:::::::::.:::::::::::::::::::::::: CCDS35 TMSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRV 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE :::.:::.::::::::.:::.::.:.::.. . ::: .:..: ::::::. CCDS35 AAHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD 480 490 500 510 520 530 >>CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 (527 aa) initn: 2217 init1: 1753 opt: 2251 Z-score: 2767.1 bits: 521.7 E(32554): 8.3e-148 Smith-Waterman score: 2251; 62.7% identity (83.3% similar) in 528 aa overlap (5-527:8-527) 10 20 30 40 50 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG :... ::. .: . :.::.:: . :::::::.:..::: . :.::::. : CCDS35 MRSDKSALVFLLLQLFCVGCGFCGKVLVWPCDMSHWLNVKVILEELIVRGHEVTVLTHSK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 ALFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD .: . .: ::. ..: . . . .. :..:. : :. :: :. .. . . CCDS35 PSLIDYRKPSALKFEVVHMPQDRTEENEIFVDLALNVL---PGLST-WQSVIKLNDFFVE 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS .. . . .:.. . :: :: ::......:.. :::.::::..: :..::. .::.: .. CCDS35 IRGTLKMMCESFIYNQTLMKKLQETNYDVMLIDPVIPCGDLMAELLAVPFVLTLRISVGG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNF---ISYH--LQDYMFETLWKSWDS ..:. :::.: : ::::. .. :::.:.: .:..: . .: .::: .. :. CCDS35 NMERSCGKLPAPLSYVPVPMTGLTDRMTFLERVKNSMLSVLFHFWIQDYDYHF----WEE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 YYSKALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEE .::::::::::::::.:::::::::::::::::.:: ::::::::::::::: ::::::. CCDS35 FYSKALGRPTTLCETVGKAEIWLIRTYWDFEFPQPYQPNFEFVGGLHCKPAKALPKEMEN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 FIQSSGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLF :.::::..:.:::::::. .:.::::::.:::::::::::::::::::::.::: ::.:. CCDS35 FVQSSGEDGIVVFSLGSLFQNVTEEKANIIASALAQIPQKVLWRYKGKKPSTLGANTRLY 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 DWIPQNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVE :::::::::::::::::::::: :::::::::::::::::.:.:: :::::::::::::: CCDS35 DWIPQNDLLGHPKTKAFITHGGMNGIYEAIYHGVPMVGVPIFGDQLDNIAHMKAKGAAVE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 VNLNTMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAK .:..:::: ::: ::::::.. :::::::::::::::::::::::::::::::::::::: CCDS35 INFKTMTSEDLLRALRTVITDSSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAK 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 HLRVAAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE ::: :::::::::..:.:::::::.::.::::: .: :::::::.: : .::: CCDS35 HLRSAAHDLTWFQHYSIDVIGFLLACVATAIFLFTKCFLFSCQKFNKTRKIEKRE 480 490 500 510 520 >>CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 (529 aa) initn: 2186 init1: 1642 opt: 2218 Z-score: 2726.5 bits: 514.2 E(32554): 1.5e-145 Smith-Waterman score: 2218; 59.6% identity (86.0% similar) in 508 aa overlap (21-527:24-529) 10 20 30 40 50 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG :.::.: : :::.:.: :. ::... :.::::..:. CCDS35 MTLKWTSVLLLIHLSCYFSSGSCGKVLVWAAEYSHWMNMKTILKELVQRGHEVTVLASSA 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 ALFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD .... :.. .: ::.: . . : ..:..: . : : . : . ..: .... ... . CCDS35 SILFDPNDASTLKFEVYPTSLTKTEFENIIMQQVKRWSDIRKD--SFWLYFSQEQEILWE 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS .. . ...: :..:...: ::..:.:... .: :::::...: :.: :.:::::.:. CCDS35 LYDIFRNFCKDVVSNKKVMKKLQESRFDIVFADAVFPCGELLAALLNIRFVYSLRFTPGY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFE-TLWKSWDSYYSK :.:.: : . .::::.: :.:.:.:::.: .:..:.: :. :. . :.::..::. CCDS35 TIERHSGGLIFPPSYIPIVMSKLSDQMTFMERVKNMIYVLYFDFWFQMSDMKKWDQFYSE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS .::::::: ::::::.:::.:. :.:.::.:.::: .::::.:::::::::::::::.:: CCDS35 VLGRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNVDFVGGFHCKPAKPLPKEMEEFVQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP ::.::::::::::...:.: :.::.::.:::.::::::::. :.:: .:: ::.:. ::: CCDS35 SGENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN ::::::::::.:::::::.::::::::::.::::.:.: ::::::::::::::::....: CCDS35 QNDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRLDFN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV ::.:.:::.::.::::.: :::: :.::::.::::::::::::::::::: ::::::::: CCDS35 TMSSTDLLNALKTVINDPLYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMPHKGAKHLRV 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE ::::::::::::::::::::.::.:.::.. . ::: ::.. ::: ::. CCDS35 AAHDLTWFQYHSLDVIGFLLACVATVIFIITKFCLFCFWKFARKGKKGKRD 480 490 500 510 520 >>CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 (528 aa) initn: 2146 init1: 1679 opt: 2189 Z-score: 2690.8 bits: 507.6 E(32554): 1.5e-143 Smith-Waterman score: 2189; 59.6% identity (85.6% similar) in 508 aa overlap (21-527:23-528) 10 20 30 40 50 pF1KE6 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASGA :.::.: : : :.:.: :. ::... :.::::..:.. CCDS75 MALKWTTVLLIQLSFYFSSGSCGKVLVWAAEYSLWMNMKTILKELVQRGHEVTVLASSAS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 LFITPTSNPSLTFEIYRVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKDF ... :... .: .:.: . . : ..:..: ..: : . . :.: ... ... . CCDS75 ILFDPNDSSTLKLEVYPTSLTKTEFENIIMQLVKRLSEIQKD--TFWLPFSQEQEILWAI 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 HMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAST . . ...: :..:..:: ::..:.:... .: .:::...: ..:::.:: :::. . CCDS75 NDIIRNFCKDVVSNKKLMKKLQESRFDIVFADAYLPCGELLAELFNIPFVYSHSFSPGYS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 VEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSKA :.: : .::::::.:.:.:.:::.: .:..:.. :. :. . :.::..::.. CCDS75 FERHSGGFIFPPSYVPVVMSKLSDQMTFMERVKNMLYVLYFDFWFQIFNMKKWDQFYSEV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 LGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQSS ::::::: ::: ::.:::.:. :.:.::.:.::: .::::::::::::::::::::.::: CCDS75 LGRPTTLSETMRKADIWLMRNSWNFKFPHPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 GKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIPQ :.::::::::::::.:.:::.::.::.:::.::::::::. :.:: .:: ::.:. :::: CCDS75 GENGVVVFSLGSMVSNMTEERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 NDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLNT :::::::::.:::::::.::::::::::.::::.:.: ::::::::::::::::.:..:: CCDS75 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRVDFNT 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 MTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA :.:.:::.::.::::.:::::: :.::::.:::::::::::::::::::::::::::::: CCDS75 MSSTDLLNALKTVINDPSYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA 420 430 440 450 460 470 480 490 500 510 520 pF1KE6 AHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE ::.::::::::::::::::.::.:..:.. .:::: ::.. ::: ::. CCDS75 AHNLTWFQYHSLDVIGFLLACVATVLFIITKCCLFCFWKFARKGKKGKRD 480 490 500 510 520 527 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:25:42 2016 done: Tue Nov 8 13:25:42 2016 Total Scan time: 2.040 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]