FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4507, 530 aa
1>>>pF1KE4507 530 - 530 aa - 530 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1093+/-0.00102; mu= 13.4015+/- 0.060
mean_var=64.1171+/-13.144, 0's: 0 Z-trim(103.1): 40 B-trim: 2 in 1/47
Lambda= 0.160172
statistics sampled from 7216 (7254) to 7216 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.593), E-opt: 0.2 (0.223), width: 16
Scan time: 3.150
The best scores are: opt bits E(32554)
CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 ( 530) 3587 838.0 0
CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 ( 530) 3412 797.6 0
CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 528) 2890 677.0 1.5e-194
CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 ( 529) 2878 674.2 1e-193
CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 529) 2873 673.0 2.3e-193
CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 528) 2841 665.6 3.8e-191
CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 529) 2825 661.9 5e-190
CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 536) 2280 536.0 4.1e-152
CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 2257 530.7 1.6e-150
CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 ( 527) 2221 522.4 5.1e-148
CCDS75137.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 369) 1925 454.0 1.4e-127
CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 369) 1908 450.0 2.1e-126
CCDS75135.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 444) 1715 405.4 6.8e-113
CCDS56330.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 335) 1712 404.7 8.4e-113
CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1652 390.9 1.9e-108
CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 ( 530) 1535 363.9 2.7e-100
CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 ( 530) 1516 359.5 5.6e-99
CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 ( 534) 1512 358.5 1.1e-98
CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 ( 530) 1511 358.3 1.3e-98
CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 ( 530) 1511 358.3 1.3e-98
CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 ( 533) 1476 350.2 3.4e-96
CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 ( 534) 1474 349.8 4.8e-96
CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 ( 534) 1466 347.9 1.7e-95
CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 532) 1460 346.5 4.5e-95
CCDS3705.1 UGT8 gene_id:7368|Hs108|chr4 ( 541) 1116 267.0 3.9e-71
CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 265) 1095 262.2 5.5e-70
CCDS77925.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 483) 1085 259.9 4.9e-69
CCDS77924.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 492) 1085 259.9 5e-69
CCDS58902.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 693) 1085 259.9 7e-69
CCDS3913.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 523) 881 212.7 8.3e-55
CCDS3914.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 523) 871 210.4 4.1e-54
CCDS54842.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 489) 857 207.2 3.6e-53
CCDS54841.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 252) 311 81.0 1.8e-15
>>CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 (530 aa)
initn: 3587 init1: 3587 opt: 3587 Z-score: 4476.8 bits: 838.0 E(32554): 0
Smith-Waterman score: 3587; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
430 440 450 460 470 480
490 500 510 520 530
pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
490 500 510 520 530
>>CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 (530 aa)
initn: 3412 init1: 3412 opt: 3412 Z-score: 4258.2 bits: 797.6 E(32554): 0
Smith-Waterman score: 3412; 94.2% identity (97.5% similar) in 530 aa overlap (1-530:1-530)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
::::: :::::.::::::::::::::::::::::::::::::::::::::::: ::::::
CCDS35 MSLKWMSVFLLMQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVIVLTSSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
: :::::::::::::::::::::: ::: ..:..::: :..:::::::::::::::::::
CCDS35 SILVNASKSSAIKLEVYPTSLTKNDLEDFFMKMFDRWTYSISKNTFWSYFSQLQELCWEY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
::. :::.::::::::: :::::::::.::::.::::::::::.:::::::::::::::
CCDS35 SDYNIKLCEDAVLNKKLMRKLQESKFDVLLADAVNPCGELLAELLNIPFLYSLRFSVGYT
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
:::::::::::::::::::::::::::::::::::.::::::::: :::::::::::::
CCDS35 VEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIYMLYFDFWFQAYDLKKWDQFYSEV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
:::::::::::::::::.::::.:::::::::::.:::::::::::::::::::::::::
CCDS35 MSSRDLLNALKSVINDPIYKENIMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA
430 440 450 460 470 480
490 500 510 520 530
pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
::::::::::::::::::::::::.::.::: :::::::::: :::::::
CCDS35 AHNLTWIQYHSLDVIAFLLACVATMIFMITKCCLFCFRKLAKTGKKKKRD
490 500 510 520 530
>>CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 (528 aa)
initn: 2889 init1: 2368 opt: 2890 Z-score: 3606.3 bits: 677.0 E(32554): 1.5e-194
Smith-Waterman score: 2890; 78.3% identity (92.8% similar) in 530 aa overlap (1-530:1-528)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
::.::::..:::::::::::::::::::::::.:::.:.::::.::::::::::::.:::
CCDS43 MSMKWTSALLLIQLSCYFSSGSCGKVLVWPTEFSHWMNIKTILDELVQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
: . .. :..:.::::.::::. .:: . ... :: . :.::::::::.::. : .
CCDS43 SISFDPNSPSTLKFEVYPVSLTKTEFEDIIKQLVKRWAE-LPKDTFWSYFSQVQEIMWTF
70 80 90 100 110
130 140 150 160 170 180
pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
: :.::: : ::::: :::::.:::.::::. : :::::::..:::.:::::: ::.
CCDS43 NDILRKFCKDIVSNKKLMKKLQESRFDVVLADAVFPFGELLAELLKIPFVYSLRFSPGYA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
.::..::.:::::::::::::::::: :.::.::::..:::.:::::.:.::::::::::
CCDS43 IEKHSGGLLFPPSYVPVVMSELSDQMTFIERVKNMIYVLYFEFWFQIFDMKKWDQFYSEV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
::::::: :::.::..::::.::::.::.:.::::.::::::::::::::::::::::::
CCDS43 LGRPTTLSETMAKADIWLIRNYWDFQFPHPLLPNVEFVGGLHCKPAKPLPKEMEEFVQSS
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
::::.::::::::.:: ::: ::.::::::.:::::::::::.::.::: :::::::.::
CCDS43 GENGVVVFSLGSMVSNTSEERANVIASALAKIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
:::::::::.:::::::.:::::::::::::::.:::::: ::::::::::::.:.:..:
CCDS43 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGVPLFADQPDNIAHMKAKGAAVSLDFHT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
::: :::::::.:::::.::::.:::::::::::.:::::::::::::::::::::::::
CCDS43 MSSTDLLNALKTVINDPLYKENAMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA
420 430 440 450 460 470
490 500 510 520 530
pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
::.:::.::::::: .::::::::::::::: :::: :... ::: :::
CCDS43 AHDLTWFQYHSLDVTGFLLACVATVIFIITK-CLFCVWKFVRTGKKGKRD
480 490 500 510 520
>>CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 (529 aa)
initn: 2879 init1: 2428 opt: 2878 Z-score: 3591.3 bits: 674.2 E(32554): 1e-193
Smith-Waterman score: 2878; 76.8% identity (92.5% similar) in 530 aa overlap (1-530:1-529)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
:.::::::.:::.:::::::::::::::: .:::::.::::::.::::::::::::.:::
CCDS35 MTLKWTSVLLLIHLSCYFSSGSCGKVLVWAAEYSHWMNMKTILKELVQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
: : . . .:..:.:::::::::. .:. ... . :: . :..:: :::: ::. ::
CCDS35 SILFDPNDASTLKFEVYPTSLTKTEFENIIMQQVKRW-SDIRKDSFWLYFSQEQEILWEL
70 80 90 100 110
130 140 150 160 170 180
pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
:: ..:::.: :::.: :::::.::...:::. ::::::: :.:: :.:::::. :::
CCDS35 YDIFRNFCKDVVSNKKVMKKLQESRFDIVFADAVFPCGELLAALLNIRFVYSLRFTPGYT
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
.:...::..:::::.:.:::.::::: ::::.::::..::::::::. :.::::::::::
CCDS35 IERHSGGLIFPPSYIPIVMSKLSDQMTFMERVKNMIYVLYFDFWFQMSDMKKWDQFYSEV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
::::::::::::::..::.:. :.:.::.:::::::::::.:::::::::::::::::::
CCDS35 LGRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNVDFVGGFHCKPAKPLPKEMEEFVQSS
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
::::.:::::::.::::. : ::.::.:::.:::::::::::.::..:: :::::::.::
CCDS35 GENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQ
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
:::::::::.:::::::.::::::::::::::::::: :: ::::::::::::. .:. :
CCDS35 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRLDFNT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
::: :::::::.:::::.::::.::::::.::::.:::::::::::::: ::::::::::
CCDS35 MSSTDLLNALKTVINDPLYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMPHKGAKHLRVA
420 430 440 450 460 470
490 500 510 520 530
pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
::.:::.::::::::.::::::::::::::::::::: :.:.:::: :::
CCDS35 AHDLTWFQYHSLDVIGFLLACVATVIFIITKFCLFCFWKFARKGKKGKRD
480 490 500 510 520
>>CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 (529 aa)
initn: 2909 init1: 2431 opt: 2873 Z-score: 3585.1 bits: 673.0 E(32554): 2.3e-193
Smith-Waterman score: 2873; 77.9% identity (92.1% similar) in 530 aa overlap (1-530:1-529)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
::.:::::.:::::: ::::.::::::: .:::::.:.::::.::.:::::::::.:::
CCDS35 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
: : . ..:::.:.:.:::::::. ::. ... . :: . :.::: ::::.::. .
CCDS35 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRW-SDLPKDTFWLYFSQVQEIMSIF
70 80 90 100 110
130 140 150 160 170 180
pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
: . :.:::.: :::.: :.:::.::::.:::. ::.:::::::::::.::: :: :::
CCDS35 GDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYT
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
:::..:::.:::::::::::::.::: ::::.::::..:::::::.:.:.::::::::::
CCDS35 FEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
::::::: ::::::..::::. :.:.:: :.:::::::::::::::::::::::.:::::
CCDS35 LGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSS
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
::::.::::::::.:::.:: ::.::::::::::::::::::.::.::: :::::::.::
CCDS35 GENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
:::::::::.:::::::.:::::::::::::::::::::: ::::::::.:::. ::. :
CCDS35 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
::: ::::::: ::::: :::::::::::.::::.:::::::::::::::::::::::::
CCDS35 MSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA
420 430 440 450 460 470
490 500 510 520 530
pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
::.:::.::::::::.:::.::::::::.:: ::::: :.:.:.:: : :
CCDS35 AHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
480 490 500 510 520
>>CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 (528 aa)
initn: 2809 init1: 2432 opt: 2841 Z-score: 3545.1 bits: 665.6 E(32554): 3.8e-191
Smith-Waterman score: 2841; 77.4% identity (91.3% similar) in 530 aa overlap (1-530:1-528)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
:.::::.: :::::: ::::::::::::: .::: :.::::::.::::::::::::.:::
CCDS75 MALKWTTV-LLIQLSFYFSSGSCGKVLVWAAEYSLWMNMKTILKELVQRGHEVTVLASSA
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
: : . . ::..:::::::::::. .:. ..... : . ..:.::: ::: ::. :
CCDS75 SILFDPNDSSTLKLEVYPTSLTKTEFENIIMQLVKR-LSEIQKDTFWLPFSQEQEILWAI
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
: ..:::.: ::::: :::::.::...::: ::::::::::::::.:: :: ::.
CCDS75 NDIIRNFCKDVVSNKKLMKKLQESRFDIVFADAYLPCGELLAELFNIPFVYSHSFSPGYS
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
::...:::.:::::::::::.::::: ::::.:::...:::::::::...::::::::::
CCDS75 FERHSGGFIFPPSYVPVVMSKLSDQMTFMERVKNMLYVLYFDFWFQIFNMKKWDQFYSEV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
::::::: ::: ::..::.:. :.:.::.:::::::::::::::::::::::::::::::
CCDS75 LGRPTTLSETMRKADIWLMRNSWNFKFPHPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
::::.::::::::.:::.:: ::.::.:::.:::::::::::.::..:: :::::::.::
CCDS75 GENGVVVFSLGSMVSNMTEERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQ
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
:::::::::.:::::::.::::::::::::::::::: :: ::::::::::::. ::. :
CCDS75 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRVDFNT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
::: :::::::.::::: ::::.::::::.::::.:::::::::::::::::::::::::
CCDS75 MSSTDLLNALKTVINDPSYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA
420 430 440 450 460 470
490 500 510 520 530
pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
::::::.::::::::.:::::::::.::::: ::::: :.:.:::: :::
CCDS75 AHNLTWFQYHSLDVIGFLLACVATVLFIITKCCLFCFWKFARKGKKGKRD
480 490 500 510 520
>>CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 (529 aa)
initn: 2826 init1: 2387 opt: 2825 Z-score: 3525.1 bits: 661.9 E(32554): 5e-190
Smith-Waterman score: 2825; 75.8% identity (91.9% similar) in 530 aa overlap (1-530:1-529)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
:.::::::.:::.:.:::::::::::::: :::::.::::::.::::::::::::.:::
CCDS35 MALKWTSVLLLIHLGCYFSSGSCGKVLVWTGEYSHWMNMKTILKELVQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
: : . . . ..:::::::::::. .:. ... . :: ..:..:: :::: ::. ::.
CCDS35 SILFDPNDAFTLKLEVYPTSLTKTEFENIIMQQVKRW-SDIQKDSFWLYFSQEQEILWEF
70 80 90 100 110
130 140 150 160 170 180
pF1KE4 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
.: ..:::.: :::.: :::::.::.:.:::. ::::::: :.::::.::: :. :::
CCDS35 HDIFRNFCKDVVSNKKVMKKLQESRFDIIFADAFFPCGELLAALLNIPFVYSLCFTPGYT
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
.:...::..:::::.:::::.::::: ::::.::::..::::::::. :.::::::::::
CCDS35 IERHSGGLIFPPSYIPVVMSKLSDQMTFMERVKNMIYVLYFDFWFQMCDMKKWDQFYSEV
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
::::::::::::::..::.:. :.:.::.:::::.:::::::::::::::::::::::::
CCDS35 LGRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNIDFVGGLHCKPAKPLPKEMEEFVQSS
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
::::.:::::::.::::. : ::.::.:::.:::::::::::.::..:: :::::::.::
CCDS35 GENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQ
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE4 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
::::: :::.:::::::.::::::::::::::::::: :: ::::::::::::. .:..:
CCDS35 NDLLGLPKTRAFITHGGANGIYEAIYHGIPMVGIPLFWDQPDNIAHMKAKGAAVRLDFHT
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE4 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
::: :::::::.::::: ::::::::: :.::::.::: :::::::::: ::::::::::
CCDS35 MSSTDLLNALKTVINDPSYKENVMKLSIIQHDQPVKPLHRAVFWIEFVMCHKGAKHLRVA
420 430 440 450 460 470
490 500 510 520 530
pF1KE4 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
:..:::.::::::::.:::::::::::..:::::::: :.:.:::: :::
CCDS35 ARDLTWFQYHSLDVIGFLLACVATVIFVVTKFCLFCFWKFARKGKKGKRD
480 490 500 510 520
>>CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 (536 aa)
initn: 2125 init1: 1815 opt: 2280 Z-score: 2844.4 bits: 536.0 E(32554): 4.1e-152
Smith-Waterman score: 2280; 63.6% identity (86.4% similar) in 508 aa overlap (24-530:30-536)
10 20 30 40 50
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVT
:.::.:::. :::.:.: :::::.::.:.::
CCDS56 MVSIRDFTMPKKFVQMLVFNLTLTEVVLSGNVLIWPTDGSHWLNIKIILEELIQRNHNVT
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 VLTSSASTLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWI-YGVSKNTFWSYFSQL
::.:::. ..:.. .: ...:: :.: :. ... . ... :: . . :.:.....:
CCDS56 VLASSATLFINSNPDSPVNFEVIPVSYKKSNIDSLIEHMIMLWIDHRPTPLTIWAFYKEL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 QELCWEYYDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSL
.: ... . .:: .. : ::: .::.. :::..:: .. ::.:.: ..:::.:.:
CCDS56 GKLLDTFFQINIQLCDGVLKNPKLMARLQKGGFDVLVADPVTICGDLVALKLGIPFMYTL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 RFSVGYTFEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKW
::: . : :.. : . : ::::...:::.::: : ::::: : . :. :: : .:
CCDS56 RFSPASTVERHCGKIPAPVSYVPAALSELTDQMTFGERIKNTISYSLQDYIFQSY-WGEW
190 200 210 220 230
240 250 260 270 280 290
pF1KE4 DQFYSEVLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEM
...::..::::::: :::::::.::::::::::::::.::: .:::::::::::::::::
CCDS56 NSYYSKILGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEM
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 EEFVQSSGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTR
:::.::::.::.::::::::..:..::.::.:::::::::::::::. :::: :::.::.
CCDS56 EEFIQSSGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 LYKWLPQNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAA
:. :.::::::::::::::::::::::::::::::.::::.:.:::: ::::::::::::
CCDS56 LFDWIPQNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 LSVDIRTMSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKG
. :.. ::.: :::.::..:::.: ::::.:.:::::::::.::::::::::::::::::
CCDS56 VEVNLNTMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKG
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE4 AKHLRVAAHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
:::::::::.:::.::::::::.:::.::.:.::.. . ::: .:..: ::::::.
CCDS56 AKHLRVAAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE
480 490 500 510 520 530
>>CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 (527 aa)
initn: 2117 init1: 1789 opt: 2257 Z-score: 2815.8 bits: 530.7 E(32554): 1.6e-150
Smith-Waterman score: 2257; 61.6% identity (86.4% similar) in 508 aa overlap (24-530:21-527)
10 20 30 40 50 60
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
:.::.:: : :::.:.: :..::... :.::::..:.
CCDS35 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG
10 20 30 40 50
70 80 90 100 110
pF1KE4 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGV-SKNTFWSYFSQLQELCWE
. ... ... .. .:.: . . :. .: . .. :. . : .:.: ..... .. .
CCDS35 ALFITPTSNPSLTFEIYKVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE4 YYDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGY
.. :...: .. :..:: ::..:::.:...: . :::...: ..:::.:::::: .
CCDS35 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE4 TFEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSE
: ::. : .::::::.:.:::.::: : .::.:.: . :. :. :.::..::.
CCDS35 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE4 VLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQS
.::::::: :::::::.::::::::::::::.::: .::::::::::::::::::::.::
CCDS35 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 SGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLP
::.::.::::::::..:..::.::.:::::::::::::::. :::: :::.::.:. :.:
CCDS35 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 QNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIR
:::::::::::::::::::::::::::::.::::.:.:::: ::::::::::::. :..
CCDS35 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 TMSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRV
::.: :::.::..:::.: ::::.:.:::::::::.::::::::::::::::::::::::
CCDS35 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE4 AAHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
:::.:::.::::::::.:::.::.:.::.. . ::: .:..: ::::::.
CCDS35 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE
480 490 500 510 520
>>CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 (527 aa)
initn: 2194 init1: 1925 opt: 2221 Z-score: 2770.9 bits: 522.4 E(32554): 5.1e-148
Smith-Waterman score: 2221; 61.6% identity (83.4% similar) in 523 aa overlap (8-530:9-527)
10 20 30 40 50
pF1KE4 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSS
::::.:: : . : :::::::: ..:::.:.:.:::::. ::::::::: :
CCDS35 MRSDKSALVFLLLQLFCV-GCGFCGKVLVWPCDMSHWLNVKVILEELIVRGHEVTVLTHS
10 20 30 40 50
60 70 80 90 100 110
pF1KE4 ASTLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWE
.:.. : ::.:.:: . . .. :.. . ..: . . . :. .:... :
CCDS35 KPSLIDYRKPSALKFEV--VHMPQDRTEENEI-FVDLALNVLPGLSTWQSVIKLNDFFVE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE4 YYDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGY
. .:.. . :. :: ::::...::.: : . :::.:.:::. .::. .::.:::
CCDS35 IRGTLKMMCESFIYNQTLMKKLQETNYDVMLIDPVIPCGDLMAELLAVPFVLTLRISVGG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE4 TFEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSE
..:.. : . : ::::: :. :.:.: :.::.:: . . : ::.: :: . :..:::.
CCDS35 NMERSCGKLPAPLSYVPVPMTGLTDRMTFLERVKNSMLSVLFHFWIQDYDYHFWEEFYSK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE4 VLGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQS
.::::::: ::.::::.::::::::::::.:. :: .::::::::::: ::::::.::::
CCDS35 ALGRPTTLCETVGKAEIWLIRTYWDFEFPQPYQPNFEFVGGLHCKPAKALPKEMENFVQS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 SGENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLP
:::.:::::::::...:..::.::.:::::::::::::::. ::::.:::.::::: :.:
CCDS35 SGEDGIVVFSLGSLFQNVTEEKANIIASALAQIPQKVLWRYKGKKPSTLGANTRLYDWIP
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 QNDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIR
:::::::::::::::::: ::::::::::.::::.:.:.:: ::::::::::::. ....
CCDS35 QNDLLGHPKTKAFITHGGMNGIYEAIYHGVPMVGVPIFGDQLDNIAHMKAKGAAVEINFK
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 TMSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRV
::.:.::: ::..::.: ::::.:.:::::::::.:::::::::::::::::::::::
CCDS35 TMTSEDLLRALRTVITDSSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRS
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE4 AAHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
:::.:::.:..:.:::.::::::::.::..:: :: .:. : : .::.
CCDS35 AAHDLTWFQHYSIDVIGFLLACVATAIFLFTKCFLFSCQKFNKTRKIEKRE
480 490 500 510 520
530 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 00:23:21 2016 done: Sun Nov 6 00:23:21 2016
Total Scan time: 3.150 Total Display time: 0.140
Function used was FASTA [36.3.4 Apr, 2011]