FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4507, 530 aa 1>>>pF1KE4507 530 - 530 aa - 530 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1093+/-0.00102; mu= 13.4015+/- 0.060 mean_var=64.1171+/-13.144, 0's: 0 Z-trim(103.1): 40 B-trim: 2 in 1/47 Lambda= 0.160172 statistics sampled from 7216 (7254) to 7216 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.593), E-opt: 0.2 (0.223), width: 16 Scan time: 3.150 The best scores are: opt bits E(32554) CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 ( 530) 3587 838.0 0 CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 ( 530) 3412 797.6 0 CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 528) 2890 677.0 1.5e-194 CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 ( 529) 2878 674.2 1e-193 CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 529) 2873 673.0 2.3e-193 CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 528) 2841 665.6 3.8e-191 CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 529) 2825 661.9 5e-190 CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 536) 2280 536.0 4.1e-152 CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 2257 530.7 1.6e-150 CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 ( 527) 2221 522.4 5.1e-148 CCDS75137.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 369) 1925 454.0 1.4e-127 CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 369) 1908 450.0 2.1e-126 CCDS75135.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 444) 1715 405.4 6.8e-113 CCDS56330.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 335) 1712 404.7 8.4e-113 CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1652 390.9 1.9e-108 CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 ( 530) 1535 363.9 2.7e-100 CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 ( 530) 1516 359.5 5.6e-99 CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 ( 534) 1512 358.5 1.1e-98 CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 ( 530) 1511 358.3 1.3e-98 CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 ( 530) 1511 358.3 1.3e-98 CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 ( 533) 1476 350.2 3.4e-96 CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 ( 534) 1474 349.8 4.8e-96 CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 ( 534) 1466 347.9 1.7e-95 CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 532) 1460 346.5 4.5e-95 CCDS3705.1 UGT8 gene_id:7368|Hs108|chr4 ( 541) 1116 267.0 3.9e-71 CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 265) 1095 262.2 5.5e-70 CCDS77925.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 483) 1085 259.9 4.9e-69 CCDS77924.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 492) 1085 259.9 5e-69 CCDS58902.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 693) 1085 259.9 7e-69 CCDS3913.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 523) 881 212.7 8.3e-55 CCDS3914.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 523) 871 210.4 4.1e-54 CCDS54842.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 489) 857 207.2 3.6e-53 CCDS54841.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 252) 311 81.0 1.8e-15 >>CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 (530 aa) initn: 3587 init1: 3587 opt: 3587 Z-score: 4476.8 bits: 838.0 E(32554): 0 Smith-Waterman score: 3587; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA 430 440 450 460 470 480 490 500 510 520 530 pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD 490 500 510 520 530 >>CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 (530 aa) initn: 3412 init1: 3412 opt: 3412 Z-score: 4258.2 bits: 797.6 E(32554): 0 Smith-Waterman score: 3412; 94.2% identity (97.5% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA ::::: :::::.::::::::::::::::::::::::::::::::::::::::: :::::: CCDS35 MSLKWMSVFLLMQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVIVLTSSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY : :::::::::::::::::::::: ::: ..:..::: :..::::::::::::::::::: CCDS35 SILVNASKSSAIKLEVYPTSLTKNDLEDFFMKMFDRWTYSISKNTFWSYFSQLQELCWEY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT ::. :::.::::::::: :::::::::.::::.::::::::::.::::::::::::::: CCDS35 SDYNIKLCEDAVLNKKLMRKLQESKFDVLLADAVNPCGELLAELLNIPFLYSLRFSVGYT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV :::::::::::::::::::::::::::::::::::.::::::::: ::::::::::::: CCDS35 VEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIYMLYFDFWFQAYDLKKWDQFYSEV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA :::::::::::::::::.::::.:::::::::::.::::::::::::::::::::::::: CCDS35 MSSRDLLNALKSVINDPIYKENIMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA 430 440 450 460 470 480 490 500 510 520 530 pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD ::::::::::::::::::::::::.::.::: :::::::::: ::::::: CCDS35 AHNLTWIQYHSLDVIAFLLACVATMIFMITKCCLFCFRKLAKTGKKKKRD 490 500 510 520 530 >>CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 (528 aa) initn: 2889 init1: 2368 opt: 2890 Z-score: 3606.3 bits: 677.0 E(32554): 1.5e-194 Smith-Waterman score: 2890; 78.3% identity (92.8% similar) in 530 aa overlap (1-530:1-528) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA ::.::::..:::::::::::::::::::::::.:::.:.::::.::::::::::::.::: CCDS43 MSMKWTSALLLIQLSCYFSSGSCGKVLVWPTEFSHWMNIKTILDELVQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY : . .. :..:.::::.::::. .:: . ... :: . :.::::::::.::. : . CCDS43 SISFDPNSPSTLKFEVYPVSLTKTEFEDIIKQLVKRWAE-LPKDTFWSYFSQVQEIMWTF 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT : :.::: : ::::: :::::.:::.::::. : :::::::..:::.:::::: ::. CCDS43 NDILRKFCKDIVSNKKLMKKLQESRFDVVLADAVFPFGELLAELLKIPFVYSLRFSPGYA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV .::..::.:::::::::::::::::: :.::.::::..:::.:::::.:.:::::::::: CCDS43 IEKHSGGLLFPPSYVPVVMSELSDQMTFIERVKNMIYVLYFEFWFQIFDMKKWDQFYSEV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS ::::::: :::.::..::::.::::.::.:.::::.:::::::::::::::::::::::: CCDS43 LGRPTTLSETMAKADIWLIRNYWDFQFPHPLLPNVEFVGGLHCKPAKPLPKEMEEFVQSS 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ ::::.::::::::.:: ::: ::.::::::.:::::::::::.::.::: :::::::.:: CCDS43 GENGVVVFSLGSMVSNTSEERANVIASALAKIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT :::::::::.:::::::.:::::::::::::::.:::::: ::::::::::::.:.:..: CCDS43 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGVPLFADQPDNIAHMKAKGAAVSLDFHT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA ::: :::::::.:::::.::::.:::::::::::.::::::::::::::::::::::::: CCDS43 MSSTDLLNALKTVINDPLYKENAMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA 420 430 440 450 460 470 490 500 510 520 530 pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD ::.:::.::::::: .::::::::::::::: :::: :... ::: ::: CCDS43 AHDLTWFQYHSLDVTGFLLACVATVIFIITK-CLFCVWKFVRTGKKGKRD 480 490 500 510 520 >>CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 (529 aa) initn: 2879 init1: 2428 opt: 2878 Z-score: 3591.3 bits: 674.2 E(32554): 1e-193 Smith-Waterman score: 2878; 76.8% identity (92.5% similar) in 530 aa overlap (1-530:1-529) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA :.::::::.:::.:::::::::::::::: .:::::.::::::.::::::::::::.::: CCDS35 MTLKWTSVLLLIHLSCYFSSGSCGKVLVWAAEYSHWMNMKTILKELVQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY : : . . .:..:.:::::::::. .:. ... . :: . :..:: :::: ::. :: CCDS35 SILFDPNDASTLKFEVYPTSLTKTEFENIIMQQVKRW-SDIRKDSFWLYFSQEQEILWEL 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT :: ..:::.: :::.: :::::.::...:::. ::::::: :.:: :.:::::. ::: CCDS35 YDIFRNFCKDVVSNKKVMKKLQESRFDIVFADAVFPCGELLAALLNIRFVYSLRFTPGYT 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV .:...::..:::::.:.:::.::::: ::::.::::..::::::::. :.:::::::::: CCDS35 IERHSGGLIFPPSYIPIVMSKLSDQMTFMERVKNMIYVLYFDFWFQMSDMKKWDQFYSEV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS ::::::::::::::..::.:. :.:.::.:::::::::::.::::::::::::::::::: CCDS35 LGRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNVDFVGGFHCKPAKPLPKEMEEFVQSS 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ ::::.:::::::.::::. : ::.::.:::.:::::::::::.::..:: :::::::.:: CCDS35 GENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT :::::::::.:::::::.::::::::::::::::::: :: ::::::::::::. .:. : CCDS35 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRLDFNT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA ::: :::::::.:::::.::::.::::::.::::.:::::::::::::: :::::::::: CCDS35 MSSTDLLNALKTVINDPLYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMPHKGAKHLRVA 420 430 440 450 460 470 490 500 510 520 530 pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD ::.:::.::::::::.::::::::::::::::::::: :.:.:::: ::: CCDS35 AHDLTWFQYHSLDVIGFLLACVATVIFIITKFCLFCFWKFARKGKKGKRD 480 490 500 510 520 >>CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 (529 aa) initn: 2909 init1: 2431 opt: 2873 Z-score: 3585.1 bits: 673.0 E(32554): 2.3e-193 Smith-Waterman score: 2873; 77.9% identity (92.1% similar) in 530 aa overlap (1-530:1-529) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA ::.:::::.:::::: ::::.::::::: .:::::.:.::::.::.:::::::::.::: CCDS35 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY : : . ..:::.:.:.:::::::. ::. ... . :: . :.::: ::::.::. . CCDS35 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRW-SDLPKDTFWLYFSQVQEIMSIF 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT : . :.:::.: :::.: :.:::.::::.:::. ::.:::::::::::.::: :: ::: CCDS35 GDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYT 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV :::..:::.:::::::::::::.::: ::::.::::..:::::::.:.:.:::::::::: CCDS35 FEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS ::::::: ::::::..::::. :.:.:: :.:::::::::::::::::::::::.::::: CCDS35 LGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSS 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ ::::.::::::::.:::.:: ::.::::::::::::::::::.::.::: :::::::.:: CCDS35 GENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT :::::::::.:::::::.:::::::::::::::::::::: ::::::::.:::. ::. : CCDS35 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA ::: ::::::: ::::: :::::::::::.::::.::::::::::::::::::::::::: CCDS35 MSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA 420 430 440 450 460 470 490 500 510 520 530 pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD ::.:::.::::::::.:::.::::::::.:: ::::: :.:.:.:: : : CCDS35 AHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND 480 490 500 510 520 >>CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 (528 aa) initn: 2809 init1: 2432 opt: 2841 Z-score: 3545.1 bits: 665.6 E(32554): 3.8e-191 Smith-Waterman score: 2841; 77.4% identity (91.3% similar) in 530 aa overlap (1-530:1-528) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA :.::::.: :::::: ::::::::::::: .::: :.::::::.::::::::::::.::: CCDS75 MALKWTTV-LLIQLSFYFSSGSCGKVLVWAAEYSLWMNMKTILKELVQRGHEVTVLASSA 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY : : . . ::..:::::::::::. .:. ..... : . ..:.::: ::: ::. : CCDS75 SILFDPNDSSTLKLEVYPTSLTKTEFENIIMQLVKR-LSEIQKDTFWLPFSQEQEILWAI 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT : ..:::.: ::::: :::::.::...::: ::::::::::::::.:: :: ::. CCDS75 NDIIRNFCKDVVSNKKLMKKLQESRFDIVFADAYLPCGELLAELFNIPFVYSHSFSPGYS 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV ::...:::.:::::::::::.::::: ::::.:::...:::::::::...:::::::::: CCDS75 FERHSGGFIFPPSYVPVVMSKLSDQMTFMERVKNMLYVLYFDFWFQIFNMKKWDQFYSEV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS ::::::: ::: ::..::.:. :.:.::.::::::::::::::::::::::::::::::: CCDS75 LGRPTTLSETMRKADIWLMRNSWNFKFPHPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ ::::.::::::::.:::.:: ::.::.:::.:::::::::::.::..:: :::::::.:: CCDS75 GENGVVVFSLGSMVSNMTEERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT :::::::::.:::::::.::::::::::::::::::: :: ::::::::::::. ::. : CCDS75 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRVDFNT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA ::: :::::::.::::: ::::.::::::.::::.::::::::::::::::::::::::: CCDS75 MSSTDLLNALKTVINDPSYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA 420 430 440 450 460 470 490 500 510 520 530 pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD ::::::.::::::::.:::::::::.::::: ::::: :.:.:::: ::: CCDS75 AHNLTWFQYHSLDVIGFLLACVATVLFIITKCCLFCFWKFARKGKKGKRD 480 490 500 510 520 >>CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 (529 aa) initn: 2826 init1: 2387 opt: 2825 Z-score: 3525.1 bits: 661.9 E(32554): 5e-190 Smith-Waterman score: 2825; 75.8% identity (91.9% similar) in 530 aa overlap (1-530:1-529) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA :.::::::.:::.:.:::::::::::::: :::::.::::::.::::::::::::.::: CCDS35 MALKWTSVLLLIHLGCYFSSGSCGKVLVWTGEYSHWMNMKTILKELVQRGHEVTVLASSA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY : : . . . ..:::::::::::. .:. ... . :: ..:..:: :::: ::. ::. CCDS35 SILFDPNDAFTLKLEVYPTSLTKTEFENIIMQQVKRW-SDIQKDSFWLYFSQEQEILWEF 70 80 90 100 110 130 140 150 160 170 180 pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT .: ..:::.: :::.: :::::.::.:.:::. ::::::: :.::::.::: :. ::: CCDS35 HDIFRNFCKDVVSNKKVMKKLQESRFDIIFADAFFPCGELLAALLNIPFVYSLCFTPGYT 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV .:...::..:::::.:::::.::::: ::::.::::..::::::::. :.:::::::::: CCDS35 IERHSGGLIFPPSYIPVVMSKLSDQMTFMERVKNMIYVLYFDFWFQMCDMKKWDQFYSEV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS ::::::::::::::..::.:. :.:.::.:::::.::::::::::::::::::::::::: CCDS35 LGRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNIDFVGGLHCKPAKPLPKEMEEFVQSS 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ ::::.:::::::.::::. : ::.::.:::.:::::::::::.::..:: :::::::.:: CCDS35 GENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT ::::: :::.:::::::.::::::::::::::::::: :: ::::::::::::. .:..: CCDS35 NDLLGLPKTRAFITHGGANGIYEAIYHGIPMVGIPLFWDQPDNIAHMKAKGAAVRLDFHT 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA ::: :::::::.::::: ::::::::: :.::::.::: :::::::::: :::::::::: CCDS35 MSSTDLLNALKTVINDPSYKENVMKLSIIQHDQPVKPLHRAVFWIEFVMCHKGAKHLRVA 420 430 440 450 460 470 490 500 510 520 530 pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD :..:::.::::::::.:::::::::::..:::::::: :.:.:::: ::: CCDS35 ARDLTWFQYHSLDVIGFLLACVATVIFVVTKFCLFCFWKFARKGKKGKRD 480 490 500 510 520 >>CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 (536 aa) initn: 2125 init1: 1815 opt: 2280 Z-score: 2844.4 bits: 536.0 E(32554): 4.1e-152 Smith-Waterman score: 2280; 63.6% identity (86.4% similar) in 508 aa overlap (24-530:30-536) 10 20 30 40 50 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVT :.::.:::. :::.:.: :::::.::.:.:: CCDS56 MVSIRDFTMPKKFVQMLVFNLTLTEVVLSGNVLIWPTDGSHWLNIKIILEELIQRNHNVT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 VLTSSASTLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWI-YGVSKNTFWSYFSQL ::.:::. ..:.. .: ...:: :.: :. ... . ... :: . . :.:.....: CCDS56 VLASSATLFINSNPDSPVNFEVIPVSYKKSNIDSLIEHMIMLWIDHRPTPLTIWAFYKEL 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 QELCWEYYDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSL .: ... . .:: .. : ::: .::.. :::..:: .. ::.:.: ..:::.:.: CCDS56 GKLLDTFFQINIQLCDGVLKNPKLMARLQKGGFDVLVADPVTICGDLVALKLGIPFMYTL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 RFSVGYTFEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKW ::: . : :.. : . : ::::...:::.::: : ::::: : . :. :: : .: CCDS56 RFSPASTVERHCGKIPAPVSYVPAALSELTDQMTFGERIKNTISYSLQDYIFQSY-WGEW 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 DQFYSEVLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEM ...::..::::::: :::::::.::::::::::::::.::: .::::::::::::::::: CCDS56 NSYYSKILGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 EEFVQSSGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTR :::.::::.::.::::::::..:..::.::.:::::::::::::::. :::: :::.::. CCDS56 EEFIQSSGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 LYKWLPQNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAA :. :.::::::::::::::::::::::::::::::.::::.:.:::: :::::::::::: CCDS56 LFDWIPQNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 LSVDIRTMSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKG . :.. ::.: :::.::..:::.: ::::.:.:::::::::.:::::::::::::::::: CCDS56 VEVNLNTMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKG 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE4 AKHLRVAAHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD :::::::::.:::.::::::::.:::.::.:.::.. . ::: .:..: ::::::. CCDS56 AKHLRVAAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE 480 490 500 510 520 530 >>CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 (527 aa) initn: 2117 init1: 1789 opt: 2257 Z-score: 2815.8 bits: 530.7 E(32554): 1.6e-150 Smith-Waterman score: 2257; 61.6% identity (86.4% similar) in 508 aa overlap (24-530:21-527) 10 20 30 40 50 60 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA :.::.:: : :::.:.: :..::... :.::::..:. CCDS35 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG 10 20 30 40 50 70 80 90 100 110 pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGV-SKNTFWSYFSQLQELCWE . ... ... .. .:.: . . :. .: . .. :. . : .:.: ..... .. . CCDS35 ALFITPTSNPSLTFEIYKVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 YYDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGY .. :...: .. :..:: ::..:::.:...: . :::...: ..:::.:::::: . CCDS35 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 TFEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSE : ::. : .::::::.:.:::.::: : .::.:.: . :. :. :.::..::. CCDS35 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 VLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQS .::::::: :::::::.::::::::::::::.::: .::::::::::::::::::::.:: CCDS35 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 SGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLP ::.::.::::::::..:..::.::.:::::::::::::::. :::: :::.::.:. :.: CCDS35 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 QNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIR :::::::::::::::::::::::::::::.::::.:.:::: ::::::::::::. :.. CCDS35 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 TMSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRV ::.: :::.::..:::.: ::::.:.:::::::::.:::::::::::::::::::::::: CCDS35 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE4 AAHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD :::.:::.::::::::.:::.::.:.::.. . ::: .:..: ::::::. CCDS35 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE 480 490 500 510 520 >>CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 (527 aa) initn: 2194 init1: 1925 opt: 2221 Z-score: 2770.9 bits: 522.4 E(32554): 5.1e-148 Smith-Waterman score: 2221; 61.6% identity (83.4% similar) in 523 aa overlap (8-530:9-527) 10 20 30 40 50 pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSS ::::.:: : . : :::::::: ..:::.:.:.:::::. ::::::::: : CCDS35 MRSDKSALVFLLLQLFCV-GCGFCGKVLVWPCDMSHWLNVKVILEELIVRGHEVTVLTHS 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 ASTLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWE .:.. : ::.:.:: . . .. :.. . ..: . . . :. .:... : CCDS35 KPSLIDYRKPSALKFEV--VHMPQDRTEENEI-FVDLALNVLPGLSTWQSVIKLNDFFVE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 YYDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGY . .:.. . :. :: ::::...::.: : . :::.:.:::. .::. .::.::: CCDS35 IRGTLKMMCESFIYNQTLMKKLQETNYDVMLIDPVIPCGDLMAELLAVPFVLTLRISVGG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 TFEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSE ..:.. : . : ::::: :. :.:.: :.::.:: . . : ::.: :: . :..:::. CCDS35 NMERSCGKLPAPLSYVPVPMTGLTDRMTFLERVKNSMLSVLFHFWIQDYDYHFWEEFYSK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 VLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQS .::::::: ::.::::.::::::::::::.:. :: .::::::::::: ::::::.:::: CCDS35 ALGRPTTLCETVGKAEIWLIRTYWDFEFPQPYQPNFEFVGGLHCKPAKALPKEMENFVQS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 SGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLP :::.:::::::::...:..::.::.:::::::::::::::. ::::.:::.::::: :.: CCDS35 SGEDGIVVFSLGSLFQNVTEEKANIIASALAQIPQKVLWRYKGKKPSTLGANTRLYDWIP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 QNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIR :::::::::::::::::: ::::::::::.::::.:.:.:: ::::::::::::. .... CCDS35 QNDLLGHPKTKAFITHGGMNGIYEAIYHGVPMVGVPIFGDQLDNIAHMKAKGAAVEINFK 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 TMSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRV ::.:.::: ::..::.: ::::.:.:::::::::.::::::::::::::::::::::: CCDS35 TMTSEDLLRALRTVITDSSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRS 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE4 AAHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD :::.:::.:..:.:::.::::::::.::..:: :: .:. : : .::. CCDS35 AAHDLTWFQHYSIDVIGFLLACVATAIFLFTKCFLFSCQKFNKTRKIEKRE 480 490 500 510 520 530 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:23:21 2016 done: Sun Nov 6 00:23:21 2016 Total Scan time: 3.150 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]