FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5670, 533 aa 1>>>pF1KE5670 533 - 533 aa - 533 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6818+/-0.00105; mu= 16.1685+/- 0.063 mean_var=68.7374+/-13.953, 0's: 0 Z-trim(103.8): 35 B-trim: 209 in 1/46 Lambda= 0.154695 statistics sampled from 7570 (7605) to 7570 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.603), E-opt: 0.2 (0.234), width: 16 Scan time: 2.480 The best scores are: opt bits E(32554) CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 ( 533) 3576 807.6 0 CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 ( 534) 2637 598.0 8.9e-171 CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 ( 534) 2635 597.6 1.2e-170 CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 ( 534) 2605 590.9 1.3e-168 CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 532) 2477 562.3 5e-160 CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 ( 530) 2392 543.3 2.6e-154 CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 ( 530) 2376 539.7 3e-153 CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 ( 530) 2373 539.1 4.8e-153 CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 ( 530) 2357 535.5 5.8e-152 CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 ( 265) 1746 399.0 3.5e-111 CCDS3529.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1557 357.0 3.2e-98 CCDS56331.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 536) 1517 348.0 1.6e-95 CCDS3523.1 UGT2B17 gene_id:7367|Hs108|chr4 ( 530) 1510 346.5 4.6e-95 CCDS43234.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 528) 1508 346.0 6.3e-95 CCDS3525.1 UGT2A3 gene_id:79799|Hs108|chr4 ( 527) 1506 345.6 8.5e-95 CCDS75136.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 528) 1505 345.4 1e-94 CCDS3526.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 529) 1481 340.0 4.1e-93 CCDS3524.1 UGT2B15 gene_id:7366|Hs108|chr4 ( 530) 1476 338.9 8.9e-93 CCDS3528.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 529) 1463 336.0 6.6e-92 CCDS3527.1 UGT2B11 gene_id:10720|Hs108|chr4 ( 529) 1445 332.0 1.1e-90 CCDS58901.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 527) 1193 275.7 9.1e-74 CCDS75135.1 UGT2B10 gene_id:7365|Hs108|chr4 ( 444) 1157 267.7 2.1e-71 CCDS3705.1 UGT8 gene_id:7368|Hs108|chr4 ( 541) 993 231.1 2.5e-60 CCDS3914.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 523) 919 214.6 2.3e-55 CCDS3913.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 523) 888 207.7 2.8e-53 CCDS77925.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 483) 858 200.9 2.7e-51 CCDS77924.1 UGT2A2 gene_id:574537|Hs108|chr4 ( 492) 858 200.9 2.8e-51 CCDS58902.1 UGT2A1 gene_id:10941|Hs108|chr4 ( 693) 858 201.0 3.7e-51 CCDS54842.1 UGT3A2 gene_id:167127|Hs108|chr5 ( 489) 838 196.5 6e-50 CCDS75137.1 UGT2B4 gene_id:7363|Hs108|chr4 ( 369) 799 187.7 2e-47 CCDS82930.1 UGT2B7 gene_id:7364|Hs108|chr4 ( 369) 773 181.9 1.1e-45 CCDS56330.1 UGT2B28 gene_id:54490|Hs108|chr4 ( 335) 669 158.7 9.8e-39 CCDS54841.1 UGT3A1 gene_id:133688|Hs108|chr5 ( 252) 313 79.2 6.3e-15 >>CCDS2510.1 UGT1A1 gene_id:54658|Hs108|chr2 (533 aa) initn: 3576 init1: 3576 opt: 3576 Z-score: 4312.0 bits: 807.6 E(32554): 0 Smith-Waterman score: 3576; 100.0% identity (100.0% similar) in 533 aa overlap (1-533:1-533) 10 20 30 40 50 60 pF1KE5 MAVESQGGRPLVLGLLLCVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 MAVESQGGRPLVLGLLLCVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVVL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 APDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKKDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 APDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKKDS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 AMLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHALPCSLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 AMLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHALPCSLE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 FEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLASEFLQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLASEFLQR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 EVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINASGEH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINASGEH 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 GIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 GIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQNDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 LGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 LGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMTS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 EDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAHD 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 LTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH ::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 LTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS2509.1 UGT1A3 gene_id:54659|Hs108|chr2 (534 aa) initn: 2633 init1: 2633 opt: 2637 Z-score: 3179.4 bits: 598.0 E(32554): 8.9e-171 Smith-Waterman score: 2637; 72.6% identity (88.1% similar) in 536 aa overlap (1-533:1-534) 10 20 30 40 50 pF1KE5 MAVESQGGRP-LVLGLLLCVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVV ::. : : :. :::: . ...::.:..:.:::::::: ....:. :::. :: CCDS25 MATGLQVPLPWLATGLLLLLSVQPWAESGKVLVVPIDGSHWLSMREVLRELHARGHQAVV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 LAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHN--VFENDSFLQRVIKTYKKIK :.:.....:.. :.:: :: . . ... . :::. ::.. ::.. .... .. CCDS25 LTPEVNMHIKEENFFTLTTYAISWTQDEFDRHV--LGHTQLYFETEHFLKKFFRSMAMLN 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 KDSAMLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHALPC . : . .: .::::. :. : .::::.:::: :. ..:.:::.::::::. .:: CCDS25 NMSLVYHRSCVELLHNEALIRHLNATSFDVVLTDPVNLCAAVLAKYLSIPTVFFLRNIPC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 SLEFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLASEF .:.:..:::::: ::.:: :...::::::.::::::: .. ...: . .:::.::::. CCDS25 DLDFKGTQCPNPSSYIPRLLTTNSDHMTFMQRVKNMLYPLALSYICHAFSAPYASLASEL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 LQREVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINAS .::::.: :.:: :::::::.::: ::::::::::::.::::: ...::::::::::::: CCDS25 FQREVSVVDILSHASVWLFRGDFVMDYPRPIMPNMVFIGGINCANRKPLSQEFEAYINAS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 GEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 GEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 NDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 NDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLE 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 MTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 MTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 AHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 AHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS33404.1 UGT1A5 gene_id:54579|Hs108|chr2 (534 aa) initn: 2633 init1: 2633 opt: 2635 Z-score: 3177.0 bits: 597.6 E(32554): 1.2e-170 Smith-Waterman score: 2635; 72.8% identity (88.6% similar) in 534 aa overlap (1-533:1-534) 10 20 30 40 50 pF1KE5 MAVESQGGRP-LVLGLLLCVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVV ::. : : :. :::: . ...::.:..:.:::::::: :...:. :::..:: CCDS33 MATGLQVPLPQLATGLLLLLSVQPWAESGKVLVVPTDGSHWLSMREALRDLHARGHQVVV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 LAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKKD :. ....::.. :.:: :: . . ... . ... .. ::.. .:.. . . ... CCDS33 LTLEVNMYIKEENFFTLTTYAISWTQDEFDRLLLGHTQSFFETEHLLMKFSRRMAIMNNM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 SAMLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHALPCSL : .. .: .::::. :. : .::::.::::: :. ..:.:::.:.::::. .::.: CCDS33 SLIIHRSCVELLHNEALIRHLHATSFDVVLTDPFHLCAAVLAKYLSIPAVFFLRNIPCDL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 EFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLASEFLQ .:..:::::: ::.:: :...:::::::::::::: .. ..:: .: .:::.::::..: CCDS33 DFKGTQCPNPSSYIPRLLTTNSDHMTFLQRVKNMLYPLALSYLCHAVSAPYASLASELFQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 REVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINASGE :::.: ::.: :::::::.::: ::::::::::::.::::: . .::::::::::::::: CCDS33 REVSVVDLVSHASVWLFRGDFVMDYPRPIMPNMVFIGGINCANGKPLSQEFEAYINASGE 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE5 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE5 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE5 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS33405.1 UGT1A4 gene_id:54657|Hs108|chr2 (534 aa) initn: 2605 init1: 2605 opt: 2605 Z-score: 3140.8 bits: 590.9 E(32554): 1.3e-168 Smith-Waterman score: 2605; 73.0% identity (88.5% similar) in 523 aa overlap (11-533:12-534) 10 20 30 40 50 pF1KE5 MAVESQGGRPLVLGLLLCVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVV :. :::: . ...::.:..:.::: :::: :...:. :::. :: CCDS33 MARGLQVPLPRLATGLLLLLSVQPWAESGKVLVVPTDGSPWLSMREALRELHARGHQAVV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 LAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKKD :.:.....:.. :.:: .: ::. ... . .. .. ::.. .:.: ... ... CCDS33 LTPEVNMHIKEEKFFTLTAYAVPWTQKEFDRVTLGYTQGFFETEHLLKRYSRSMAIMNNV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 SAMLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHALPCSL : : : .::::. :. : .::::.:::: :. ..:.:::.:.::: . .::.: CCDS33 SLALHRCCVELLHNEALIRHLNATSFDVVLTDPVNLCGAVLAKYLSIPAVFFWRYIPCDL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 EFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLASEFLQ .:..:::::: ::.:. :...:::::::::::::: .. ...: . .:::.::::..: CCDS33 DFKGTQCPNPSSYIPKLLTTNSDHMTFLQRVKNMLYPLALSYICHTFSAPYASLASELFQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 REVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINASGE :::.: ::.: :::::::.::: ::::::::::::.::::: . .::::::::::::::: CCDS33 REVSVVDLVSYASVWLFRGDFVMDYPRPIMPNMVFIGGINCANGKPLSQEFEAYINASGE 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE5 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE5 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE5 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 490 500 510 520 530 >>CCDS2507.1 UGT1A6 gene_id:54578|Hs108|chr2 (532 aa) initn: 2472 init1: 2472 opt: 2477 Z-score: 2986.5 bits: 562.3 E(32554): 5e-160 Smith-Waterman score: 2477; 70.3% identity (86.7% similar) in 519 aa overlap (15-533:16-532) 10 20 30 40 50 pF1KE5 MAVESQGGRPLVLGLLLCVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVV ..: . : ::. :.:..: :::::::: .. :..::::::: CCDS25 MACLLRSFQRISAGVFFLALWGMVVGD--KLLVVPQDGSHWLSMKDIVEVLSDRGHEIVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 LAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKKD ..:...: .... .:: : ::::...:..:. . :.:.: : . ::: :.. CCDS25 VVPEVNLLLKESKYYTRKIYPVPYDQEELKNRYQSFGNNHFAERSFLTAPQTEYRNNMIV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 SAMLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHALPCSL .. . .:. ::.... . . ::.::...::: :::. :.:.::.::.:......:::: CCDS25 IGLYFINCQSLLQDRDTLNFFKESKFDALFTDPALPCGVILAEYLGLPSVYLFRGFPCSL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 EFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLASEFLQ : .. :.: ::.:: .. :::::: ::: :.:. . . .: ..: : ::: :. CCDS25 EHTFSRSPDPVSYIPRCYTKFSDHMTFSQRVANFLVNLLEPYLFYCLFSKYEELASAVLK 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 REVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINASGE :.: . : ...::::.: ::: .::::.::::::.::::: ... :::::::::::::: CCDS25 RDVDIITLYQKVSVWLLRYDFVLEYPRPVMPNMVFIGGINCKKRKDLSQEFEAYINASGE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 HGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQND 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 LLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEMT 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 SEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAAH 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 DLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS2505.1 UGT1A9 gene_id:54600|Hs108|chr2 (530 aa) initn: 2393 init1: 2203 opt: 2392 Z-score: 2884.0 bits: 543.3 E(32554): 2.6e-154 Smith-Waterman score: 2392; 68.7% identity (84.4% similar) in 527 aa overlap (10-533:11-530) 10 20 30 40 50 pF1KE5 MAVESQGGRPLVLGLLL-CVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIV :: . ::: : : ..:::.:..:.:::::..: .....: ::::.: CCDS25 MACTGWTSPLPLCVCLLLTC--G--FAEAGKLLVVPMDGSHWFTMRSVVEKLILRGHEVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 VLAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFEND--SFLQRVIKTYKKI :. :..: . . :.::: . . ::. . : ...: .. . :. . .. .:. : CCDS25 VVMPEVSWQLGRSLNCTVKTYSTSYTLEDLDREFKAFAHAQWKAQVRSIYSLLMGSYNDI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 KKDSAMLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHALP ...:.: :...:.:. : :::::... ::: :. :::.:.:::.: : ... CCDS25 ---FDLFFSNCRSLFKDKKLVEYLKESSFDAVFLDPFDNCGLIVAKYFSLPSVVFARGIL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 CSLEFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLASE : :..::: :.::::: : . :: ::: .::.: .. . ...:: .. .::: CCDS25 CHYLEEGAQCPAPLSYVPRILLGFSDAMTFKERVRNHIMHLEEHLLCHRFFKNALEIASE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 FLQREVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINA .:: :: :: : .:.::.:.::: :::.:.::::.:.::::: . .:: .:::::::: CCDS25 ILQTPVTEYDLYSHTSIWLLRTDFVLDYPKPVMPNMIFIGGINCHQGKPLPMEFEAYINA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 SGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 SGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 QNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 QNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVL 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 EMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRP 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 AAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 AAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS33402.1 UGT1A8 gene_id:54576|Hs108|chr2 (530 aa) initn: 2384 init1: 2199 opt: 2376 Z-score: 2864.7 bits: 539.7 E(32554): 3e-153 Smith-Waterman score: 2376; 67.9% identity (84.1% similar) in 529 aa overlap (10-533:11-530) 10 20 30 40 50 pF1KE5 MAVESQGGRPLVLGLLL-CVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIV :: ..::: : : ..:::.:..:.:::::..: .....: ::::.: CCDS33 MARTGWTSPIPLCVSLLLTC--G--FAEAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 VLAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKK :. :..: . . :.::: . . ::. . :.. : . .. .: . .. . . CCDS33 VVMPEVSWQLGKSLNCTVKTYSTSYTLEDLDREFMD-----FADAQWKAQVRSLFSLFLS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 DSA----MLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHA .: ...: : :.....:. : :::::... ::: :. :::.:.:::.: : .. CCDS33 SSNGFFNLFFSHCRSLFNDRKLVEYLKESSFDAVFLDPFDACGLIVAKYFSLPSVVFARG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 LPCSLEFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLA . : :..::: :.::::: : . :: ::: .::.: .. . ....:. . .: CCDS33 IACHYLEEGAQCPAPLSYVPRILLGFSDAMTFKERVRNHIMHLEEHLFCQYFSKNALEIA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 SEFLQREVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYI ::.:: ::. :: : .:.::.:.::: :::.:.::::.:.::::: . .:: .:::::: CCDS33 SEILQTPVTAYDLYSHTSIWLLRTDFVLDYPKPVMPNMIFIGGINCHQGKPLPMEFEAYI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 NASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKW 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 LPQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LPQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 VLEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VLEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHL 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 RPAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RPAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS33403.1 UGT1A10 gene_id:54575|Hs108|chr2 (530 aa) initn: 2382 init1: 2190 opt: 2373 Z-score: 2861.1 bits: 539.1 E(32554): 4.8e-153 Smith-Waterman score: 2373; 68.0% identity (84.7% similar) in 528 aa overlap (10-533:11-530) 10 20 30 40 50 pF1KE5 MAVESQGGRPLVLGLLL-CVLGPVVSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIV :: . ::: : : ..:::.:..:.:::::..: .....: ::::.: CCDS33 MARAGWTSPVPLCVCLLLTC--G--FAEAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 VLAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKK :. :..: .. . :.::: . . :: .. :. ..: .. .. : ... ... CCDS33 VVMPEVSWQLERSLNCTVKTYSTSYTLEDQNREFMVFAHAQWKAQA--QSIFSLL--MSS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 DSAML---LSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHAL .:..: .: : :.....:. : :::::... ::: :. :::.:.:::.: : ... CCDS33 SSGFLDLFFSHCRSLFNDRKLVEYLKESSFDAVFLDPFDTCGLIVAKYFSLPSVVFTRGI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 PCSLEFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLAS : :..::: :.:::: : . :: ::: .:: : .. . ....:. .. .:: CCDS33 FCHHLEEGAQCPAPLSYVPNDLLGFSDAMTFKERVWNHIVHLEDHLFCQYLFRNALEIAS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 EFLQREVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYIN :.:: ::. :: : .:.::.:.::: :::.:.::::.:.::::: . .:: .::::::: CCDS33 EILQTPVTAYDLYSHTSIWLLRTDFVLDYPKPVMPNMIFIGGINCHQGKPLPMEFEAYIN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS2506.1 UGT1A7 gene_id:54577|Hs108|chr2 (530 aa) initn: 2360 init1: 2181 opt: 2357 Z-score: 2841.8 bits: 535.5 E(32554): 5.8e-152 Smith-Waterman score: 2357; 66.3% identity (83.1% similar) in 534 aa overlap (5-533:2-530) 10 20 30 40 50 pF1KE5 MAVESQGGRPLVLGLLLCVLGPV-VSHAGKILLIPVDGSHWLSMLGAIQQLQQRGHEIVV ...: .: : .:.: ..:::.:..:.:::::..: .....: ::::.:: CCDS25 MARAGWTGLLPLYVCLLLTCGFAKAGKLLVVPMDGSHWFTMQSVVEKLILRGHEVVV 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 LAPDASLYIRDGAFYTLKTYPVPFQREDVKESFVSLGHNVFENDSFLQRVIKTYKKIKKD . :..: . . :.::: . . :: . :. :: . . . .... . .. CCDS25 VMPEVSWQLGRSLNCTVKTYSTSYTLEDQDREFM-----VFADARWTAPLRSAFSLLTSS 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 SA----MLLSGCSHLLHNKELMASLAESSFDVMLTDPFLPCSPIVAQYLSLPTVFFLHAL : ...:.: :.....:. : :: ::... ::: :. :::.:.:::.: : ... CCDS25 SNGIFDLFFSNCRSLFNDRKLVEYLKESCFDAVFLDPFDACGLIVAKYFSLPSVVFARGI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 PCSLEFEATQCPNPFSYVPRPLSSHSDHMTFLQRVKNMLIAFSQNFLCDVVYSPYATLAS : :..::: :.::::: : . :: ::: .:: : .. . ....: .. .:: CCDS25 FCHYLEEGAQCPAPLSYVPRLLLGFSDAMTFKERVWNHIMHLEEHLFCPYFFKNVLEIAS 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 EFLQREVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYIN :.:: ::. :: : .:.::.:.::: .::.:.::::.:.::::: . .:. .::::::: CCDS25 EILQTPVTAYDLYSHTSIWLLRTDFVLEYPKPVMPNMIFIGGINCHQGKPVPMEFEAYIN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ASGEHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 PQNDLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 LEMTSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLR 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 PAAHDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 480 490 500 510 520 530 >>CCDS2508.1 UGT1A6 gene_id:54578|Hs108|chr2 (265 aa) initn: 1746 init1: 1746 opt: 1746 Z-score: 2109.5 bits: 399.0 E(32554): 3.5e-111 Smith-Waterman score: 1746; 97.7% identity (99.2% similar) in 265 aa overlap (269-533:1-265) 240 250 260 270 280 290 pF1KE5 QREVTVQDLLSSASVWLFRSDFVKDYPRPIMPNMVFVGGINCLHQNPLSQEFEAYINASG ::::::.::::: ... ::::::::::::: CCDS25 MPNMVFIGGINCKKRKDLSQEFEAYINASG 10 20 30 300 310 320 330 340 350 pF1KE5 EHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EHGIVVFSLGSMVSEIPEKKAMAIADALGKIPQTVLWRYTGTRPSNLANNTILVKWLPQN 40 50 60 70 80 90 360 370 380 390 400 410 pF1KE5 DLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 DLLGHPMTRAFITHAGSHGVYESICNGVPMVMMPLFGDQMDNAKRMETKGAGVTLNVLEM 100 110 120 130 140 150 420 430 440 450 460 470 pF1KE5 TSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 TSEDLENALKAVINDKSYKENIMRLSSLHKDRPVEPLDLAVFWVEFVMRHKGAPHLRPAA 160 170 180 190 200 210 480 490 500 510 520 530 pF1KE5 HDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 HDLTWYQYHSLDVIGFLLAVVLTVAFITFKCCAYGYRKCLGKKGRVKKAHKSKTH 220 230 240 250 260 533 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 04:11:47 2016 done: Tue Nov 8 04:11:48 2016 Total Scan time: 2.480 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]