FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5649, 494 aa 1>>>pF1KE5649 494 - 494 aa - 494 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3471+/-0.000858; mu= 17.9287+/- 0.052 mean_var=68.4319+/-13.604, 0's: 0 Z-trim(106.2): 77 B-trim: 2 in 1/48 Lambda= 0.155040 statistics sampled from 8768 (8846) to 8768 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.649), E-opt: 0.2 (0.272), width: 16 Scan time: 3.120 The best scores are: opt bits E(32554) CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 3286 744.2 7.6e-215 CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 3109 704.6 6.3e-203 CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 3102 703.0 1.9e-202 CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 1800 411.8 8.6e-115 CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 1775 406.2 4.1e-113 CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 1722 394.3 1.5e-109 CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 1677 384.3 1.6e-106 CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 1667 382.0 7.7e-106 CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 1659 380.3 2.7e-105 CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 1619 371.3 1.3e-102 CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 1618 371.1 1.6e-102 CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 1415 325.6 6.3e-89 CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 1324 305.3 9.8e-83 CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 1295 298.8 7.1e-81 CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 1099 255.0 1.4e-67 CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 1092 253.4 4e-67 CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 1051 244.3 2.4e-64 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 1023 238.0 1.9e-62 CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 821 192.8 6.4e-49 CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 815 191.5 1.7e-48 CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 729 172.2 1.1e-42 CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 664 157.7 2.8e-38 CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 646 153.7 4.5e-37 CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 614 146.5 6.2e-35 CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 533 128.4 1.9e-29 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 472 114.8 2.3e-25 CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 460 112.1 1.4e-24 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 456 111.2 2.7e-24 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 453 110.5 4.4e-24 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 447 109.2 1.1e-23 CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 446 108.9 1.3e-23 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 425 104.2 3.4e-22 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 425 104.3 3.5e-22 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 422 103.6 5.4e-22 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 399 98.4 2e-20 CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 372 92.4 1.2e-18 CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 370 91.9 1.7e-18 CCDS5677.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 420) 363 90.3 4.3e-18 CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 359 89.5 9.4e-18 CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 355 88.6 1.7e-17 CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 344 86.1 1e-16 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 333 83.6 4.3e-16 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 328 82.5 8.9e-16 CCDS74303.1 CYP4F8 gene_id:11283|Hs108|chr19 ( 520) 316 79.9 7.5e-15 CCDS46616.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 448) 304 77.2 4.3e-14 CCDS6393.1 CYP11B2 gene_id:1585|Hs108|chr8 ( 503) 304 77.2 4.7e-14 CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 298 75.9 1.2e-13 CCDS7426.1 CYP26A1 gene_id:1592|Hs108|chr10 ( 497) 295 75.2 1.9e-13 CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 290 74.1 4.3e-13 CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 288 73.6 5.8e-13 >>CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 (494 aa) initn: 3286 init1: 3286 opt: 3286 Z-score: 3970.7 bits: 744.2 E(32554): 7.6e-215 Smith-Waterman score: 3286; 100.0% identity (100.0% similar) in 494 aa overlap (1-494:1-494) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF 430 440 450 460 470 480 490 pF1KE5 ATIPRNYTMSFLPR :::::::::::::: CCDS12 ATIPRNYTMSFLPR 490 >>CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 (494 aa) initn: 3109 init1: 3109 opt: 3109 Z-score: 3756.7 bits: 704.6 E(32554): 6.3e-203 Smith-Waterman score: 3109; 93.5% identity (98.4% similar) in 494 aa overlap (1-494:1-494) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK :::::.:::.::.:::::::::::.::::.:::::::::::::::::::::::::::::: CCDS12 MLASGLLLVTLLACLTVMVLMSVWRQRKSRGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN :::::::::::::::::::::::::::.:::::::::::::::::::::.::::::.::: CCDS12 ISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKGYGVAFSN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN :::::::::::::::: :::::::::::::::::::::::::: :::::::::::::::: CCDS12 GERAKQLRRFSIATLRGFGVGKRGIEERIQEEAGFLIDALRGTHGANIDPTFFLSRTVSN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL :::::::::::::.::::::::::::: ::::.:::::::::::::::::::::::::. CCDS12 VISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEMFSSVMKHLPGPQQQAFKE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::. CCDS12 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .:::::::::::::::::::::::::::::::::::::::::::::::::: :::::::: CCDS12 AGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYTEAVIHEIQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK ::::..::.::.::.::::::::::::::::.:::::::::: :::::.::::::::..: CCDS12 RFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVLRDPRFFSNPRDFNPQHFLDKK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF ::::::::::::::::: :::::::::::::::::.:::::.:: ::::::::::::::: CCDS12 GQFKKSDAFVPFSIGKRYCFGEGLARMELFLFFTTIMQNFRFKSPQSPKDIDVSPKHVGF 430 440 450 460 470 480 490 pF1KE5 ATIPRNYTMSFLPR :::::::::::::: CCDS12 ATIPRNYTMSFLPR 490 >>CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 (494 aa) initn: 3102 init1: 3102 opt: 3102 Z-score: 3748.2 bits: 703.0 E(32554): 1.9e-202 Smith-Waterman score: 3102; 93.7% identity (98.8% similar) in 494 aa overlap (1-494:1-494) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK :::::.::::::.::::::::::::::::.::::::::::::::::::::::.. .:.:: CCDS12 MLASGLLLVALLACLTVMVLMSVWQQRKSRGKLPPGPTPLPFIGNYLQLNTEHICDSIMK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN .:: ::::::::::::::::::::::::::::::::::::::::::::::::::::.::: CCDS12 FSECYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVAFSN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN ::::::: ::.:::::::::::::::::::::.::::.:.:.: :::::::::::::::: CCDS12 GERAKQLLRFAIATLRDFGVGKRGIEERIQEESGFLIEAIRSTHGANIDPTFFLSRTVSN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL :::::::::::::.:::::::: :::::::::::::::::::::::::::::::::::.: CCDS12 VISSIVFGDRFDYEDKEFLSLLSMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFKL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI ::::::::::::::::::::::::.::::::::.:::::::::::::::::.:.:::::: CCDS12 LQGLEDFIAKKVEHNQRTLDPNSPQDFIDSFLIHMQEEEKNPNTEFYLKNLMMSTLNLFI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .:::::::::::::::::::::::::::::::::::::::::::::.::::::::::::: CCDS12 AGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRTKMPYMEAVIHEIQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK :::::::::::::::::::::::::::::::.:::::::::::::::::::::::::..: CCDS12 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVFPMLGSVLRDPSFFSNPQDFNPQHFLDDK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: : CCDS12 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVVF 430 440 450 460 470 480 490 pF1KE5 ATIPRNYTMSFLPR :::::::::::::: CCDS12 ATIPRNYTMSFLPR 490 >>CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 (491 aa) initn: 1797 init1: 1797 opt: 1800 Z-score: 2174.4 bits: 411.8 E(32554): 8.6e-115 Smith-Waterman score: 1800; 51.4% identity (83.0% similar) in 494 aa overlap (1-494:1-491) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK : : .:..::: : ..:. : .. ... .::::: :::..:: ::.. . . .:... CCDS12 MELSVLLFLALL---TGLLLLLVQRHPNTHDRLPPGPRPLPLLGNLLQMDRRGLLKSFLR 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN . :.:: :::.::::: ::.::: .:.::::::.:: :::::. : : :.::::.:.: CCDS12 FREKYGDVFTVHLGPRPVVMLCGVEAIREALVDKAEAFSGRGKIAMVDPFFRGYGVIFAN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN :.: : :::::..:.::::.:::..:::::::: ::. :: . :: .::::... ..: CCDS12 GNRWKVLRRFSVTTMRDFGMGKRSVEERIQEEAQCLIEELRKSKGALMDPTFLFQSITAN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL .: ::::: :: :.:.:::..: .. :.. :. :::.:.::. .:..:: ..:... CCDS12 IICSIVFGKRFHYQDQEFLKMLNLFYQTFSLISSVFGQLFELFSGFLKYFPGAHRQVYKN 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI :: .. .:...::....::::..:.:.::..:..:..:..: ..:: .:: ..::.::. CCDS12 LQEINAYIGHSVEKHRETLDPSAPKDLIDTYLLHMEKEKSNAHSEFSHQNLNLNTLSLFF 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .::::.::::::::::..:.:.: .:..::..::: .: :...::::::: ::::.::: CCDS12 AGTETTSTTLRYGFLLMLKYPHVAERVYREIEQVIGPHRPPELHDRAKMPYTEAVIYEIQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK ::.:..::.. . : . :.:: ...:: :::. .:...:.:: .: .:. :::.:::. . CCDS12 RFSDLLPMGVPHIVTQHTSFRGYIIPKDTEVFLILSTALHDPHYFEKPDAFNPDHFLDAN 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF : .::..::.:::.::: :.:::.:: ::::::::..::: . : .:.:::..:.. : CCDS12 GALKKTEAFIPFSLGKRICLGEGIARAELFLFFTTILQNFSMASPVAPEDIDLTPQECGV 420 430 440 450 460 470 490 pF1KE5 ATIPRNYTMSFLPR . :: .: . :::: CCDS12 GKIPPTYQIRFLPR 480 490 >>CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 (491 aa) initn: 1781 init1: 1757 opt: 1775 Z-score: 2144.1 bits: 406.2 E(32554): 4.1e-113 Smith-Waterman score: 1775; 53.2% identity (81.0% similar) in 489 aa overlap (6-494:9-491) 10 20 30 40 50 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNS .::. :::: ...: : ..:::::::: :: ..:: : : ...: .: CCDS12 MDSISTAILLLLLALVCL-LLTLSS-----RDKGKLPPGPRPLSILGNLLLLCSQDMLTS 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 LMKISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVV : :.:..:: ..:.:::::::::: :..::.::::::.:::::::. .: :: :.. CCDS12 LTKLSKEYGSMYTVHLGPRRVVVLSGYQAVKEALVDQGEEFSGRGDYPAFFNFTKGNGIA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 FSNGERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRT ::.:.: : ::.::: ::.::.:::.::::: ::..::. :: : : .:::: :::. CCDS12 FSSGDRWKVLRQFSIQILRNFGMGKRSIEERILEEGSFLLAELRKTEGEPFDPTFVLSRS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 VSNVISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQA :::.: :..::.:::: :...:...:.. ::. :. :.::..: :.. .:::.:. CCDS12 VSNIICSVLFGSRFDYDDERLLTIIRLINDNFQIMSSPWGELYDIFPSLLDWVPGPHQRI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 FQLLQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLN :: .. :.:.::..:. .: .::: ::::::. :: .: ::...: ..:.. .:.::: : CCDS12 FQNFKCLRDLIAHSVHDHQASLDPRSPRDFIQCFLTKMAEEKEDPLSHFHMDTLLMTTHN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 LFIGGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIH :..:::.::::::...:: :::.:.:.:.:.:::: :.:. : : ..::: ::: .:::: CCDS12 LLFGGTKTVSTTLHHAFLALMKYPKVQARVQEEIDLVVGRARLPALKDRAAMPYTDAVIH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 EIQRFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFL :.:::.:.:::.: .:: .:: :: :..::::.: .:..: ::: : .::.:::.::: CCDS12 EVQRFADIIPMNLPHRVTRDTAFRGFLIPKGTDVITLLNTVHYDPSQFLTPQEFNPEHFL 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 NEKGQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKH . . .:::: ::.::: :.: :.::.::::::::..:...:.: :. .:.:::..: CCDS12 DANQSFKKSPAFMPFSAGRRLCLGESLARMELFLYLTAILQSFSLQPLGAPEDIDLTPLS 420 430 440 450 460 470 480 490 pF1KE5 VGFATIPRNYTMSFLPR :....:: . . . :: CCDS12 SGLGNLPRPFQLCLRPR 480 490 >>CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 (490 aa) initn: 1687 init1: 1687 opt: 1722 Z-score: 2080.1 bits: 394.3 E(32554): 1.5e-109 Smith-Waterman score: 1722; 51.4% identity (81.5% similar) in 486 aa overlap (8-493:4-489) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK .:.:..::. ..:.:.:.: ...::::::::::: ::: ::.. ... .:: . CCDS74 MDPFVVLVLCLSCLLLLSIWRQSSGRGKLPPGPTPLPVIGNILQIDIKDVSKSLTN 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN .:. ::::::...: .:.::: :...:.:::.: .:::::::. . . .:.:.:::: CCDS74 LSKIYGPVFTLYFGLERMVVLHGYEVVKEALIDLGEEFSGRGHFPLAERANRGFGIVFSN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN :.: :..::::. :::.::.:::.::.:.:::: :.. :: : .. ::::.:. . : CCDS74 GKRWKEIRRFSLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTKASPCDPTFILGCAPCN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL :: ::.: ::::::..::.:.. . ....:: :. . : ... ..:: ... .. CCDS74 VICSIIFQKRFDYKDQQFLNLMEKLNENIRIVSTPWIQICNNFPTIIDYFPGTHNKLLKN 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI : .:. : .::...:...: :.:::::: :::.:..:..: ..:: ..:::.:. .:. CCDS74 LAFMESDILEKVKEHQESMDINNPRDFIDCFLIKMEKEKQNQQSEFTIENLVITAADLLG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .::::.::::::..:::.::::: :::.:::.::::.::.: ..::..::: .::.::.: CCDS74 AGTETTSTTLRYALLLLLKHPEVTAKVQEEIERVIGRNRSPCMQDRGHMPYTDAVVHEVQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK :. :.:: :: . : :.:::....:::: . : :::.: . : ::. :.:.:::.: CCDS74 RYIDLIPTSLPHAVTCDVKFRNYLIPKGTTILTSLTSVLHDNKEFPNPEMFDPRHFLDEG 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF :.::::. :.::: ::: : ::::::::::::.: ..::: ::: .:::.:..: :: CCDS74 GNFKKSNYFMPFSAGKRICVGEGLARMELFLFLTFILQNFNLKSLIDPKDLDTTPVVNGF 420 430 440 450 460 470 490 pF1KE5 ATIPRNYTMSFLPR :..: : . :.: CCDS74 ASVPPFYQLCFIPV 480 490 >>CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 (490 aa) initn: 1642 init1: 1642 opt: 1677 Z-score: 2025.7 bits: 384.3 E(32554): 1.6e-106 Smith-Waterman score: 1677; 49.5% identity (81.0% similar) in 485 aa overlap (9-493:5-489) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK :::..::. . :.:.:.: ...:.:: ::::::.::: :::....: .:: . CCDS74 MDPAVALVLCLSCLFLLSLWRQSSGRGRLPSGPTPLPIIGNILQLDVKDMSKSLTN 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN .:. ::::::...: . .::: :..::.:::.:..::::::: . . : :: :..::: CCDS74 FSKVYGPVFTVYFGLKPIVVLHGYEAVKEALIDHGEEFSGRGSFPVAEKVNKGLGILFSN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN :.: :..::: . :::.::.:::.::.:.:::: :.. :: :... ::::.:. . : CCDS74 GKRWKEIRRFCLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTNASPCDPTFILGCAPCN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL :: :..: :::::::..::.:.. . ... :. :. . : ... .::: ... . CCDS74 VICSVIFHDRFDYKDQRFLNLMEKFNENLRILSSPWIQVCNNFPALIDYLPGSHNKIAEN 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI . ..... ......:..:: :: ::::: :::.:..:..: ..:: ...:. :. ..: CCDS74 FAYIKSYVLERIKEHQESLDMNSARDFIDCFLIKMEQEKHNQQSEFTVESLIATVTDMFG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .::::.:::::::.:::.:.::: :::.:::. :.:.::.: ..::..::: .::.:::: CCDS74 AGTETTSTTLRYGLLLLLKYPEVTAKVQEEIECVVGRNRSPCMQDRSHMPYTDAVVHEIQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK :. :..: .: . : :.::.....:::: . : :::.. . : ::. :.: :::... CCDS74 RYIDLLPTNLPHAVTCDVKFKNYLIPKGTTIITSLTSVLHNDKEFPNPEMFDPGHFLDKS 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF :.::::: :.::: ::: :.::::::::::::.::..::: :::. .:::::..: .: CCDS74 GNFKKSDYFMPFSAGKRMCMGEGLARMELFLFLTTILQNFNLKSQVDPKDIDITPIANAF 420 430 440 450 460 470 490 pF1KE5 ATIPRNYTMSFLPR . .: : . :.: CCDS74 GRVPPLYQLCFIPV 480 490 >>CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 (490 aa) initn: 1672 init1: 1645 opt: 1667 Z-score: 2013.6 bits: 382.0 E(32554): 7.7e-106 Smith-Waterman score: 1667; 49.6% identity (80.2% similar) in 486 aa overlap (8-493:4-489) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK ::.:..::. ..:.:.:.: ...::::::::::: ::: ::.. ... .:: . CCDS74 MDSLVVLVLCLSCLLLLSLWRQSSGRGKLPPGPTPLPVIGNILQIGIKDISKSLTN 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN .:. ::::::...: . .::: :..::.:::.: .::::::: . . .:.:.:::: CCDS74 LSKVYGPVFTLYFGLKPIVVLHGYEAVKEALIDLGEEFSGRGIFPLAERANRGFGIVFSN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN :.. :..::::. :::.::.:::.::.:.:::: :.. :: : .. ::::.:. . : CCDS74 GKKWKEIRRFSLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTKASPCDPTFILGCAPCN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL :: ::.: ::::::..::.:.. . ... :. :. . :: .. ..:: ... .. CCDS74 VICSIIFHKRFDYKDQQFLNLMEKLNENIKILSSPWIQICNNFSPIIDYFPGTHNKLLKN 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI . ....: .::...:...: :.:.:::: ::..:..:..: .:: ...: :...:: CCDS74 VAFMKSYILEKVKEHQESMDMNNPQDFIDCFLMKMEKEKHNQPSEFTIESLENTAVDLFG 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .::::.::::::..:::.::::: :::.:::.::::.::.: ..::..::: .::.::.: CCDS74 AGTETTSTTLRYALLLLLKHPEVTAKVQEEIERVIGRNRSPCMQDRSHMPYTDAVVHEVQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK :. :..: :: . : : :::....:::: . : :::.: . : ::. :.:.:::.: CCDS74 RYIDLLPTSLPHAVTCDIKFRNYLIPKGTTILISLTSVLHDNKEFPNPEMFDPHHFLDEG 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF :.:::: :.::: ::: : ::.:: ::::::.:...::: ::: .::..:..: :: CCDS74 GNFKKSKYFMPFSAGKRICVGEALAGMELFLFLTSILQNFNLKSLVDPKNLDTTPVVNGF 420 430 440 450 460 470 490 pF1KE5 ATIPRNYTMSFLPR :..: : . :.: CCDS74 ASVPPFYQLCFIPV 480 490 >>CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 (490 aa) initn: 1612 init1: 1612 opt: 1659 Z-score: 2003.9 bits: 380.3 E(32554): 2.7e-105 Smith-Waterman score: 1659; 49.4% identity (81.3% similar) in 486 aa overlap (8-493:4-489) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK .:.:..::. :.:.:.:.: . ::::::::::.:::.::...... .:. . CCDS74 MEPFVVLVLCLSFMLLFSLWRQSCRRRKLPPGPTPLPIIGNMLQIDVKDICKSFTN 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN .:. ::::::...: .::. :..::.:::.:..:::::::.. . . :: :.. :: CCDS74 FSKVYGPVFTVYFGMNPIVVFHGYEAVKEALIDNGEEFSGRGNSPISQRITKGLGIISSN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN :.: :..::::..:::.::.:::.::.:.:::: :.. :: : .. ::::.:. . : CCDS74 GKRWKEIRRFSLTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKASPCDPTFILGCAPCN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL :: :.:: ::::::..::.:.. . :.. .. :. . : .. .:: ...... CCDS74 VICSVVFQKRFDYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLLIDCFPGTHNKVLKN 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI . ...: .::...: .:: :.:::::: :::.:..:. : ..:: ..::: :. .::. CCDS74 VALTRSYIREKVKEHQASLDVNNPRDFIDCFLIKMEQEKDNQKSEFNIENLVGTVADLFV 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .::::.:::::::.:::.::::: :::.::::.:::..:.: ..::..::: .::.:::: CCDS74 AGTETTSTTLRYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQDRSHMPYTDAVVHEIQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK :..:..: .. . : :::::....:::: .. .: :::.: . : ::. :.: :::... CCDS74 RYSDLVPTGVPHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEFPNPNIFDPGHFLDKN 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF :.::::: :.::: ::: : ::::::::::::.::..::: ::: .. :..... :. CCDS74 GNFKKSDYFMPFSAGKRICAGEGLARMELFLFLTTILQNFNLKSVDDLKNLNTTAVTKGI 420 430 440 450 460 470 490 pF1KE5 ATIPRNYTMSFLPR ...: .: . :.: CCDS74 VSLPPSYQICFIPV 480 490 >>CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 (493 aa) initn: 1617 init1: 1292 opt: 1619 Z-score: 1955.5 bits: 371.3 E(32554): 1.3e-102 Smith-Waterman score: 1619; 47.6% identity (78.7% similar) in 494 aa overlap (1-494:1-492) 10 20 30 40 50 60 pF1KE5 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK : : :. ::::: . ..:.:.:.: .:. .::::: :::.::: .::. ... .:. . CCDS76 MSALGVT-VALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTR 10 20 30 40 50 70 80 90 100 110 120 pF1KE5 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN ...:.:::::...: .:.::. :. ::.:::.: .::::::. .: . . :..:.: CCDS76 LAQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAFH-AHRDRGIIFNN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE5 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN : :..::::..:::..:.::.: : :::.:: ::..::: : : .::::... . : CCDS76 GPTWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCN 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE5 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL ::..:.: .:::.:..:: :. .. :.. :: :::. : : ...::: ...... CCDS76 VIADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKN 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE5 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI . ........:......:::: :::. : .:..:..:... . . . ....:. .::. CCDS76 VAEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFF 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE5 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ .::::.:::::::.:.:::.::.: :.::::::::: .: : ..:: .::::.::.:::: CCDS76 AGTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQ 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE5 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK :: ..: .: ... .:: :: ...:::: : : : ::: : . : .:. :.:.:::::. CCDS76 RFITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNEN 360 370 380 390 400 410 430 440 450 460 470 480 pF1KE5 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF :.:: :: : ::: ::: : :::::::::::.. ...:.: :: .:::::.:: :.:: CCDS76 GKFKYSDYFKPFSTGKRVCAGEGLARMELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGF 420 430 440 450 460 470 490 pF1KE5 ATIPRNYTMSFLPR . :: : . .:: CCDS76 GCIPPRYKLCVIPRS 480 490 494 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:32:47 2016 done: Tue Nov 8 05:32:48 2016 Total Scan time: 3.120 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]