FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4506, 529 aa
1>>>pF1KE4506 529 - 529 aa - 529 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5679+/-0.00102; mu= 16.6282+/- 0.061
mean_var=65.4690+/-13.394, 0's: 0 Z-trim(103.0): 35 B-trim: 0 in 0/48
Lambda= 0.158510
statistics sampled from 7171 (7205) to 7171 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.589), E-opt: 0.2 (0.221), width: 16
Scan time: 2.330
The best scores are: opt bits E(32554)
CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 529) 3604 833.5 0
CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 528) 3225 746.8 1.4e-215
CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 ( 529) 3185 737.7 7.9e-213
CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 528) 3147 729.0 3.3e-210
CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 529) 3147 729.0 3.3e-210
CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 ( 530) 2873 666.3 2.4e-191
CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 ( 530) 2872 666.1 2.8e-191
CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 369) 2460 571.8 4.7e-163
CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 2289 532.8 3.8e-151
CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 536) 2267 527.7 1.3e-149
CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 ( 527) 2186 509.2 4.7e-144
CCDS75137.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 369) 2124 495.0 6.3e-140
CCDS56330.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 335) 1920 448.3 6.4e-126
CCDS75135.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 444) 1893 442.2 5.9e-124
CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1714 401.3 1.5e-111
CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 ( 530) 1495 351.2 1.7e-96
CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 ( 533) 1481 348.0 1.6e-95
CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 ( 534) 1478 347.3 2.6e-95
CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 ( 530) 1474 346.4 4.9e-95
CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 ( 530) 1470 345.5 9.1e-95
CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 ( 534) 1469 345.3 1.1e-94
CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 ( 530) 1465 344.3 2e-94
CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 532) 1440 338.6 1.1e-92
CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 ( 534) 1428 335.9 7.2e-92
CCDS77925.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 483) 1112 263.6 3.7e-70
CCDS77924.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 492) 1112 263.6 3.8e-70
CCDS58902.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 693) 1112 263.7 5.1e-70
CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 265) 1083 256.9 2.2e-68
CCDS3705.1 UGT8 gene_id:7368|Hs108|chr4 ( 541) 1035 246.0 8.2e-65
CCDS3913.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 523) 912 217.9 2.3e-56
CCDS3914.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 523) 884 211.5 2e-54
CCDS54842.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 489) 877 209.9 5.7e-54
CCDS54841.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 252) 349 89.0 7e-18
>>CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 (529 aa)
initn: 3604 init1: 3604 opt: 3604 Z-score: 4452.2 bits: 833.5 E(32554): 0
Smith-Waterman score: 3604; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
430 440 450 460 470 480
490 500 510 520
pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
490 500 510 520
>>CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 (528 aa)
initn: 3195 init1: 3195 opt: 3225 Z-score: 3983.8 bits: 746.8 E(32554): 1.4e-215
Smith-Waterman score: 3225; 87.5% identity (96.6% similar) in 529 aa overlap (1-529:1-528)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
:..:::.: ::::::: ::::.:::::::::::: :::.:::: ::.:::::::::::::
CCDS75 MALKWTTV-LLIQLSFYFSSGSCGKVLVWAAEYSLWMNMKTILKELVQRGHEVTVLASSA
10 20 30 40 50
70 80 90 100 110 120
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
:::::::.::.::.:.:::::::::.::.::: .:: :.. :::::: ::: :::. ..
CCDS75 SILFDPNDSSTLKLEVYPTSLTKTEFENIIMQLVKRLSEIQKDTFWLPFSQEQEILWAIN
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
:: :.::::::::::.:::.::::::..:::: .::.:::::::::::::: ::::::.:
CCDS75 DIIRNFCKDVVSNKKLMKKLQESRFDIVFADAYLPCGELLAELFNIPFVYSHSFSPGYSF
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
:.:::::::::::::::::.:.::::::::::::.:::::::::.::.::::::::::::
CCDS75 ERHSGGFIFPPSYVPVVMSKLSDQMTFMERVKNMLYVLYFDFWFQIFNMKKWDQFYSEVL
180 190 200 210 220 230
250 260 270 280 290 300
pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
:::::::::: :::.::.::::::.::.:.:::::::::::::::::::::::.::::::
CCDS75 GRPTTLSETMRKADIWLMRNSWNFKFPHPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSSG
240 250 260 270 280 290
310 320 330 340 350 360
pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
:::::::::::::::::::::::::.:::.:::::::::::::::.::::::::::::::
CCDS75 ENGVVVFSLGSMVSNMTEERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQN
300 310 320 330 340 350
370 380 390 400 410 420
pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM
:::::::::::::::::::::::::::::::::::: :::::::::::.:::::::::::
CCDS75 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRVDFNTM
360 370 380 390 400 410
430 440 450 460 470 480
pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
:::::::::: ::::::::::.::::::::::::::::::::::::::::::::::::::
CCDS75 SSTDLLNALKTVINDPSYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
420 430 440 450 460 470
490 500 510 520
pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
:.::::::::::::::::.:::::.::.::::::::::::::.:::: :
CCDS75 HNLTWFQYHSLDVIGFLLACVATVLFIITKCCLFCFWKFARKGKKGKRD
480 490 500 510 520
>>CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 (529 aa)
initn: 3213 init1: 3175 opt: 3185 Z-score: 3934.4 bits: 737.7 E(32554): 7.9e-213
Smith-Waterman score: 3185; 85.6% identity (95.8% similar) in 529 aa overlap (1-529:1-529)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
:..:::::.:::.:: ::::.::::::::::::::::.:::: ::.:::::::::::::
CCDS35 MTLKWTSVLLLIHLSCYFSSGSCGKVLVWAAEYSHWMNMKTILKELVQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
:::::::..:.::.:.:::::::::.::.::::.:::::. ::.::::::: :::. .
CCDS35 SILFDPNDASTLKFEVYPTSLTKTEFENIIMQQVKRWSDIRKDSFWLYFSQEQEILWELY
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
:: :.:::::::::: :::.::::::..::::.:::.:::: :.:: ::::: :.::::.
CCDS35 DIFRNFCKDVVSNKKVMKKLQESRFDIVFADAVFPCGELLAALLNIRFVYSLRFTPGYTI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
:.::::.::::::.:.:::.:.::::::::::::::::::::::.. :::::::::::::
CCDS35 ERHSGGLIFPPSYIPIVMSKLSDQMTFMERVKNMIYVLYFDFWFQMSDMKKWDQFYSEVL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
:::::: :::::::.::.::::.::::.:.:::::::::.:::::::::::::.::::::
CCDS35 GRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNVDFVGGFHCKPAKPLPKEMEEFVQSSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
:::::::::::..:::: :::::::.:::.:::::::::::::::.::::::::::::::
CCDS35 ENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM
:::::::::::::::::::::::::::::::::::: :::::::::::.:::::.:::::
CCDS35 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFFDQPDNIAHMKAKGAAVRLDFNTM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
:::::::::: ::::: ::::.:::::::::::::::::::::::::: :::::::::::
CCDS35 SSTDLLNALKTVINDPLYKENIMKLSRIQHDQPVKPLDRAVFWIEFVMPHKGAKHLRVAA
430 440 450 460 470 480
490 500 510 520
pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
::::::::::::::::::.::::::::.:: :::::::::::.:::: :
CCDS35 HDLTWFQYHSLDVIGFLLACVATVIFIITKFCLFCFWKFARKGKKGKRD
490 500 510 520
>>CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 (528 aa)
initn: 3158 init1: 3066 opt: 3147 Z-score: 3887.4 bits: 729.0 E(32554): 3.3e-210
Smith-Waterman score: 3147; 85.4% identity (95.7% similar) in 529 aa overlap (1-529:1-528)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
::.::::..:::::: ::::.::::::: .:.:::::::::::::.:::::::::::::
CCDS43 MSMKWTSALLLIQLSCYFSSGSCGKVLVWPTEFSHWMNIKTILDELVQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
:: ::::. :.::.:.::.::::::.:..: : .:::..::::::: ::::::::: :.
CCDS43 SISFDPNSPSTLKFEVYPVSLTKTEFEDIIKQLVKRWAELPKDTFWSYFSQVQEIMWTFN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
:: ::::::.:::::.:::.:::::::..:::.:: .::::::..::::::: :::::..
CCDS43 DILRKFCKDIVSNKKLMKKLQESRFDVVLADAVFPFGELLAELLKIPFVYSLRFSPGYAI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
::::::..:::::::::::::.:::::.::::::::::::.:::.:::::::::::::::
CCDS43 EKHSGGLLFPPSYVPVVMSELSDQMTFIERVKNMIYVLYFEFWFQIFDMKKWDQFYSEVL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
::::::::::.:::.::::: :.::::.::::::.::::::::::::::::::.::::::
CCDS43 GRPTTLSETMAKADIWLIRNYWDFQFPHPLLPNVEFVGGLHCKPAKPLPKEMEEFVQSSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
::::::::::::::: .::::::::::::.::::::::::::::::::::::::::::::
CCDS43 ENGVVVFSLGSMVSNTSEERANVIASALAKIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM
::::::::::::::::::::::::::::::::.:::::::::::::::.:::: .::.::
CCDS43 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGVPLFADQPDNIAHMKAKGAAVSLDFHTM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
:::::::::: ::::: ::::.::::::.:::::::::::::::::::::::::::::::
CCDS43 SSTDLLNALKTVINDPLYKENAMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
430 440 450 460 470 480
490 500 510 520
pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
::::::::::::: ::::.::::::::.::: ::: :::.: .:::: :
CCDS43 HDLTWFQYHSLDVTGFLLACVATVIFIITKC-LFCVWKFVRTGKKGKRD
490 500 510 520
>>CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 (529 aa)
initn: 3176 init1: 3138 opt: 3147 Z-score: 3887.4 bits: 729.0 E(32554): 3.3e-210
Smith-Waterman score: 3147; 85.1% identity (95.5% similar) in 529 aa overlap (1-529:1-529)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
:..:::::.:::.:. ::::.:::::::..:::::::.:::: ::.:::::::::::::
CCDS35 MALKWTSVLLLIHLGCYFSSGSCGKVLVWTGEYSHWMNMKTILKELVQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
:::::::.. .::.:.:::::::::.::.::::.:::::. ::.::::::: :::. :
CCDS35 SILFDPNDAFTLKLEVYPTSLTKTEFENIIMQQVKRWSDIQKDSFWLYFSQEQEILWEFH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
:: :.:::::::::: :::.::::::.:::::.:::.:::: :.:::::::: :.::::.
CCDS35 DIFRNFCKDVVSNKKVMKKLQESRFDIIFADAFFPCGELLAALLNIPFVYSLCFTPGYTI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
:.::::.::::::.:::::.:.::::::::::::::::::::::.. :::::::::::::
CCDS35 ERHSGGLIFPPSYIPVVMSKLSDQMTFMERVKNMIYVLYFDFWFQMCDMKKWDQFYSEVL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
:::::: :::::::.::.::::.::::.:.:::.:::::::::::::::::::.::::::
CCDS35 GRPTTLFETMGKADIWLMRNSWSFQFPHPFLPNIDFVGGLHCKPAKPLPKEMEEFVQSSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
:::::::::::..:::: :::::::.:::.:::::::::::::::.::::::::::::::
CCDS35 ENGVVVFSLGSVISNMTAERANVIATALAKIPQKVLWRFDGNKPDALGLNTRLYKWIPQN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM
:::: ::::::::::::::::::::::::::::::: :::::::::::.:::::.::.::
CCDS35 DLLGLPKTRAFITHGGANGIYEAIYHGIPMVGIPLFWDQPDNIAHMKAKGAAVRLDFHTM
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 SSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVAA
:::::::::: ::::::::::::::: :::::::::: :::::::::: :::::::::::
CCDS35 SSTDLLNALKTVINDPSYKENVMKLSIIQHDQPVKPLHRAVFWIEFVMCHKGAKHLRVAA
430 440 450 460 470 480
490 500 510 520
pF1KE4 HDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
.:::::::::::::::::.:::::::.::: :::::::::::.:::: :
CCDS35 RDLTWFQYHSLDVIGFLLACVATVIFVVTKFCLFCFWKFARKGKKGKRD
490 500 510 520
>>CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 (530 aa)
initn: 2909 init1: 2431 opt: 2873 Z-score: 3548.8 bits: 666.3 E(32554): 2.4e-191
Smith-Waterman score: 2873; 77.9% identity (92.1% similar) in 530 aa overlap (1-529:1-530)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
::.:::::.:::::: ::::.::::::: .:::::.:.::::.::.:::::::::.:::
CCDS35 MSLKWTSVFLLIQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVTVLTSSA
10 20 30 40 50 60
70 80 90 100 110
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRW-SDLPKDTFWLYFSQVQEIMSIF
: : . ..:::.:.:.:::::::. ::. ... . :: . :.::: ::::.::. .
CCDS35 STLVNASKSSAIKLEVYPTSLTKNYLEDSLLKILDRWIYGVSKNTFWSYFSQLQELCWEY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 GDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYT
: . :.:::.: :::.: :.:::.::::.:::. ::.:::::::::::.::: :: :::
CCDS35 YDYSNKLCKDAVLNKKLMMKLQESKFDVILADALNPCGELLAELFNIPFLYSLRFSVGYT
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 FEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEV
:::..:::.:::::::::::::.::: ::::.::::..:::::::.:.:.::::::::::
CCDS35 FEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIHMLYFDFWFQIYDLKKWDQFYSEV
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 LGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSS
::::::: ::::::..::::. :.:.:: :.:::::::::::::::::::::::.:::::
CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 GENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ
::::.::::::::.:::.:: ::.::::::::::::::::::.::.::: :::::::.::
CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE4 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNT
:::::::::.:::::::.:::::::::::::::::::::: ::::::::.:::. ::. :
CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE4 MSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA
::: ::::::: ::::: :::::::::::.::::.:::::::::::::::::::::::::
CCDS35 MSSRDLLNALKSVINDPVYKENVMKLSRIHHDQPMKPLDRAVFWIEFVMRHKGAKHLRVA
430 440 450 460 470 480
480 490 500 510 520
pF1KE4 AHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
::.:::.::::::::.:::.::::::::.:: ::::: :.:.:.:: : :
CCDS35 AHNLTWIQYHSLDVIAFLLACVATVIFIITKFCLFCFRKLAKKGKKKKRD
490 500 510 520 530
>>CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 (530 aa)
initn: 2861 init1: 2415 opt: 2872 Z-score: 3547.5 bits: 666.1 E(32554): 2.8e-191
Smith-Waterman score: 2872; 76.8% identity (92.8% similar) in 530 aa overlap (1-529:1-530)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
::.:: ::.::.::: ::::.::::::: .:::::.:.::::.::.:::::: ::.:::
CCDS35 MSLKWMSVFLLMQLSCYFSSGSCGKVLVWPTEYSHWINMKTILEELVQRGHEVIVLTSSA
10 20 30 40 50 60
70 80 90 100 110
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWS-DLPKDTFWLYFSQVQEIMSIF
::: . ..:::.:.:.:::::::..::.:.:... ::. .. :.::: ::::.::. .
CCDS35 SILVNASKSSAIKLEVYPTSLTKNDLEDFFMKMFDRWTYSISKNTFWSYFSQLQELCWEY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 GDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYT
.: . :.:.:.: :::.:.:.:::.:::..:::. ::.::::::.::::.::: :: :::
CCDS35 SDYNIKLCEDAVLNKKLMRKLQESKFDVLLADAVNPCGELLAELLNIPFLYSLRFSVGYT
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 FEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEV
::..:::.:::::::::::::.::: ::::.:::::.:::::::. .:.::::::::::
CCDS35 VEKNGGGFLFPPSYVPVVMSELSDQMIFMERIKNMIYMLYFDFWFQAYDLKKWDQFYSEV
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE4 LGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSS
::::::: ::::::..::::. :.:.:: :.:::::::::::::::::::::::.:::::
CCDS35 LGRPTTLFETMGKAEMWLIRTYWDFEFPRPFLPNVDFVGGLHCKPAKPLPKEMEEFVQSS
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE4 GENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQ
::::.::::::::.:::.:: ::.::::::::::::::::::.::.::: :::::::.::
CCDS35 GENGIVVFSLGSMISNMSEESANMIASALAQIPQKVLWRFDGKKPNTLGSNTRLYKWLPQ
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE4 NDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNT
:::::::::.:::::::.:::::::::::::::::::::: ::::::::.:::. ::. :
CCDS35 NDLLGHPKTKAFITHGGTNGIYEAIYHGIPMVGIPLFADQHDNIAHMKAKGAALSVDIRT
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE4 MSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA
::: ::::::: ::::: ::::.::::::.::::::::::::::::::::::::::::::
CCDS35 MSSRDLLNALKSVINDPIYKENIMKLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRVA
430 440 450 460 470 480
480 490 500 510 520
pF1KE4 AHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
::.:::.::::::::.:::.::::.::..:::::::: :.:. .:: : :
CCDS35 AHNLTWIQYHSLDVIAFLLACVATMIFMITKCCLFCFRKLAKTGKKKKRD
490 500 510 520 530
>>CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 (369 aa)
initn: 2460 init1: 2460 opt: 2460 Z-score: 3040.8 bits: 571.8 E(32554): 4.7e-163
Smith-Waterman score: 2460; 100.0% identity (100.0% similar) in 363 aa overlap (1-363:1-363)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDLPKDTFWLYFSQVQEIMSIFG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 DITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGYTF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 EKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSEVL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 GRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQSSG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 ENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIPQN
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 DLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFNTM
:::
CCDS82 DLLDIKRML
>>CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 (527 aa)
initn: 2235 init1: 1695 opt: 2289 Z-score: 2827.0 bits: 532.8 E(32554): 3.8e-151
Smith-Waterman score: 2289; 62.6% identity (86.8% similar) in 508 aa overlap (24-529:21-527)
10 20 30 40 50 60
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVTVLASSA
:.::.: : :::.:.: :.::::.. :.::::..:.
CCDS35 MLNNLLLFSLQISLIGTTLGGNVLIWPMEGSHWLNVKIIIDELIKKEHNVTVLVASG
10 20 30 40 50
70 80 90 100 110
pF1KE4 SILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRW-SDLPK-DTFWLYFSQVQEIMSI
.... :... .: .::: . . : ..:. : . . : . :. .:.: ..... ....
CCDS35 ALFITPTSNPSLTFEIYKVPFGKERIEGVIKDFVLTWLENRPSPSTIWRFYQEMAKVIKD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE4 FGDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSLSFSPGY
: .....: :..:...: :...:.:.:. .: .:::....: ..:::.::: :::.
CCDS35 FHMVSQEICDGVLKNQQLMAKLKKSKFEVLVSDPVFPCGDIVALKLGIPFMYSLRFSPAS
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE4 TFEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKWDQFYSE
: ::: : .::::::.:.:::::::.: .:..:.: :. :: . :.::..::.
CCDS35 TVEKHCGKVPYPPSYVPAVLSELTDQMSFTDRIRNFISYHLQDYMFETL-WKSWDSYYSK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE4 VLGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEMEDFVQS
.::::::: ::::::..::::. :.:.:: : ::: .::::::::::::::::::.:.::
CCDS35 ALGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEMEEFIQS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 SGENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTRLYKWIP
::.::::::::::::.:.:::.::.:::::::::::::::. :.:: ::: ::.:. :::
CCDS35 SGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQLFDWIP
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 QNDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAAVRVDFN
::::::::::.:::::::.::::::::::.::::.:.:::::::::::::.::::.:..:
CCDS35 QNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAAVEVNLN
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 TMSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKGAKHLRV
::.:.:::.::. :::.::::::.:.::::.:::::::::::::::::::::::::::::
CCDS35 TMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKGAKHLRV
420 430 440 450 460 470
480 490 500 510 520
pF1KE4 AAHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
:::::::::::::::::::::::.:.::.: .:::: ::.. .:: : .
CCDS35 AAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE
480 490 500 510 520
>>CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 (536 aa)
initn: 2228 init1: 1672 opt: 2267 Z-score: 2799.7 bits: 527.7 E(32554): 1.3e-149
Smith-Waterman score: 2267; 63.4% identity (86.0% similar) in 508 aa overlap (24-529:30-536)
10 20 30 40 50
pF1KE4 MSVKWTSVILLIQLSFCFSSGNCGKVLVWAAEYSHWMNIKTILDELIQRGHEVT
:.::.: .. :::.::: ::.:::::.:.::
CCDS56 MVSIRDFTMPKKFVQMLVFNLTLTEVVLSGNVLIWPTDGSHWLNIKIILEELIQRNHNVT
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 VLASSASILFDPNNSSALKIEIYPTSLTKTELENFIMQQIKRWSDL-PKD-TFWLYFSQV
::::::..... : .: ...:. :.: :......: ..: : : : :.: .....
CCDS56 VLASSATLFINSNPDSPVNFEVIPVSYKKSNIDSLIEHMIMLWIDHRPTPLTIWAFYKEL
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE4 QEIMSIFGDITRKFCKDVVSNKKFMKKVQESRFDVIFADAIFPCSELLAELFNIPFVYSL
.... : .:. ..: :..: :.: ..:.. :::. :: . :..:.: ..:::.:.:
CCDS56 GKLLDTFFQINIQLCDGVLKNPKLMARLQKGGFDVLVADPVTICGDLVALKLGIPFMYTL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 SFSPGYTFEKHSGGFIFPPSYVPVVMSELTDQMTFMERVKNMIYVLYFDFWFEIFDMKKW
:::. : :.: : . : ::::...::::::::: ::.:: : :. :. . .:
CCDS56 RFSPASTVERHCGKIPAPVSYVPAALSELTDQMTFGERIKNTISYSLQDYIFQSY-WGEW
190 200 210 220 230
240 250 260 270 280 290
pF1KE4 DQFYSEVLGRPTTLSETMGKADVWLIRNSWNFQFPYPLLPNVDFVGGLHCKPAKPLPKEM
...::..::::::: ::::::..::::. :.:.:: : ::: .:::::::::::::::::
CCDS56 NSYYSKILGRPTTLCETMGKAEIWLIRTYWDFEFPRPYLPNFEFVGGLHCKPAKPLPKEM
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE4 EDFVQSSGENGVVVFSLGSMVSNMTEERANVIASALAQIPQKVLWRFDGNKPDTLGLNTR
:.:.::::.::::::::::::.:.:::.::.:::::::::::::::. :.:: ::: ::.
CCDS56 EEFIQSSGKNGVVVFSLGSMVKNLTEEKANLIASALAQIPQKVLWRYKGKKPATLGNNTQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE4 LYKWIPQNDLLGHPKTRAFITHGGANGIYEAIYHGIPMVGIPLFADQPDNIAHMKARGAA
:. :::::::::::::.:::::::.::::::::::.::::.:.:::::::::::::.:::
CCDS56 LFDWIPQNDLLGHPKTKAFITHGGTNGIYEAIYHGVPMVGVPMFADQPDNIAHMKAKGAA
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE4 VRVDFNTMSSTDLLNALKRVINDPSYKENVMKLSRIQHDQPVKPLDRAVFWIEFVMRHKG
:.:..:::.:.:::.::. :::.::::::.:.::::.:::::::::::::::::::::::
CCDS56 VEVNLNTMTSVDLLSALRTVINEPSYKENAMRLSRIHHDQPVKPLDRAVFWIEFVMRHKG
420 430 440 450 460 470
480 490 500 510 520
pF1KE4 AKHLRVAAHDLTWFQYHSLDVIGFLLVCVATVIFIVTKCCLFCFWKFARKAKKGKND
:::::::::::::::::::::::::::::.:.::.: .:::: ::.. .:: : .
CCDS56 AKHLRVAAHDLTWFQYHSLDVIGFLLVCVTTAIFLVIQCCLFSCQKFGKIGKKKKRE
480 490 500 510 520 530
529 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 14:38:45 2016 done: Mon Nov 7 14:38:45 2016
Total Scan time: 2.330 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]