FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2686, 508 aa 1>>>pF1KE2686 508 - 508 aa - 508 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0222+/-0.00109; mu= 13.8719+/- 0.065 mean_var=71.1813+/-14.220, 0's: 0 Z-trim(103.4): 78 B-trim: 0 in 0/50 Lambda= 0.152017 statistics sampled from 7324 (7402) to 7324 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.604), E-opt: 0.2 (0.227), width: 16 Scan time: 3.110 The best scores are: opt bits E(32554) CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 3377 750.3 1.2e-216 CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 910 209.3 8.6e-54 CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 852 196.5 5.7e-50 CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 849 195.9 9.3e-50 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 800 185.1 1.7e-46 CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 774 179.4 8.1e-45 CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 772 179.0 1.2e-44 CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 737 171.3 2.2e-42 CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 733 170.4 4.1e-42 CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 732 170.2 4.7e-42 CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 729 169.6 7.4e-42 CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 725 168.7 1.4e-41 CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 722 168.0 2e-41 CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 716 166.7 5.3e-41 CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 708 164.9 1.8e-40 CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 707 164.7 2.1e-40 CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 704 164.1 3.3e-40 CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 703 163.8 3.9e-40 CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 698 162.8 8.2e-40 CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 687 160.3 4.4e-39 CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 659 154.2 3.2e-37 CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 628 147.4 3.4e-35 CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 622 146.1 7.4e-35 CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 573 135.3 1.2e-31 CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 499 119.1 1e-26 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 482 115.4 1.5e-25 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 464 111.4 2.4e-24 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 464 111.4 2.5e-24 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 460 110.6 4.3e-24 CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 452 108.8 1.3e-23 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 429 103.8 4.8e-22 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 426 103.1 7.9e-22 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 421 102.0 1.6e-21 CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 418 101.3 2.5e-21 CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 396 96.5 7.7e-20 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 371 91.0 3.3e-18 CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 368 90.4 5.2e-18 CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 354 87.3 4.3e-17 CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 354 87.3 4.5e-17 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 348 86.0 8.2e-17 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 346 85.5 1.2e-16 CCDS59362.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 344 85.1 2e-16 CCDS12332.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 343 84.9 2.4e-16 CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 343 84.9 2.4e-16 CCDS74303.1 CYP4F8 gene_id:11283|Hs108|chr19 ( 520) 341 84.5 3.2e-16 CCDS5677.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 420) 322 80.3 4.8e-15 CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 320 79.9 7.5e-15 CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 320 79.9 7.7e-15 CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 ( 531) 320 79.9 8e-15 CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 319 79.6 9e-15 >>CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 (508 aa) initn: 3377 init1: 3377 opt: 3377 Z-score: 4003.3 bits: 750.3 E(32554): 1.2e-216 Smith-Waterman score: 3377; 100.0% identity (100.0% similar) in 508 aa overlap (1-508:1-508) 10 20 30 40 50 60 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQKKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQKKY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 GPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 WQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNVIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 WQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNVIS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 LICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLKIFPNKTLEKLKSHVKIRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLKIFPNKTLEKLKSHVKIRN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 DLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 DLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 GAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 GAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 LRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 AGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS75 AGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIP 430 440 450 460 470 480 490 500 pF1KE2 KVVFLIDSFKVKIKVRQAWREAQAEGST :::::::::::::::::::::::::::: CCDS75 KVVFLIDSFKVKIKVRQAWREAQAEGST 490 500 >>CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 (512 aa) initn: 825 init1: 555 opt: 910 Z-score: 1079.2 bits: 209.3 E(32554): 8.6e-54 Smith-Waterman score: 910; 33.1% identity (66.9% similar) in 487 aa overlap (4-468:13-483) 10 20 30 40 pF1KE2 MWELVALLLLTLAYLFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH :.: ... : .:: : . : : : : . . ::.: . : .. CCDS10 MLFPISMSATEFLLASVIFCL--VFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS :. . .....:: . ..:.:. .:... . ...:...: ::.:::.. :. . : CCDS10 PHL--ALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLIS 60 70 80 90 100 110 110 120 130 140 150 pF1KE2 NNRKGIAFA-DSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLC :. ....:. ::: : .:::: . .:.. .: .. ::. . .: :::: CCDS10 NG-QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQ 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 DMLATHNGQSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSL ...: :. . : :.::::: :::. : .. :: . : :... . ... . CCDS10 ELMAGP-GHFNPYRY-VVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNP 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLM---QAKM .:..: :. .:: .:. .:. . ....:..... . :.. : .. :.:. : :. CCDS10 ADFIPILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQ 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 NSDNGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEE ..:.:. :::..:.. . :.:::: .:.:....:.: .:. ::.:..:. :: CCDS10 LDENANV-------QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEE 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 IDQNVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTE .: .: :: : .:::..: .:: : :..: .:. :::... :.:. : . :: CCDS10 LDTVIGRSRRPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRC 350 360 370 380 390 400 400 410 420 430 440 pF1KE2 VIINLWALHHNEKEWHQPDQFMPERFLNPAGT--QLISPSVSYLPFGAGPRSCIGEILAR :..: : ..:..: : .:..:.:::::.: :. ...: .: . :: : :.:::: .:: CCDS10 VFVNQWQINHDQKLWVNPSEFLPERFLTPDGAIDKVLSEKV--IIFGMGKRKCIGETIAR 410 420 430 440 450 460 450 460 470 480 490 500 pF1KE2 QELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :.::..: :::: .. :: CCDS10 WEVFLFLAILLQRVEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS 470 480 490 500 510 >>CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 (495 aa) initn: 704 init1: 257 opt: 852 Z-score: 1010.7 bits: 196.5 E(32554): 5.7e-50 Smith-Waterman score: 860; 31.6% identity (63.7% similar) in 507 aa overlap (4-496:7-484) 10 20 30 40 50 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLV-GSLPFLPRHGHMHNNFFKL :. : ::. : :.: . . . : ::. : : .: . . .. : CCDS47 MLLLGLLLLLPLLAGARLLWNWWKLRSLHLP------PLAPGFLHLL--QPDLPIYLLGL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 QKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFAD .:.:::: ...: . .:... .. .:...:: ::.:::. : ..: : ....: CCDS47 TQKFGPIYRLHLGLQDVVVLNSKRTIEEAMVKKWADFAGRPEPLTYKLVSRNYPDLSLGD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 SGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVT . :. :..:. . ::. ...: .. : . .:. . .. : . : . . CCDS47 YSLLWKAHKKLTRS--ALLLGIRDSMEPVVEQLTQEFCERMRAQPGTPVAIEEEFSLLTC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 NVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDS-----LVDLVPWLKIFPNKTLEK ..: . :. . :. :.. : . : . :. : .::..:.:..::: :.. CCDS47 SIICYLTFGDKIKDD----NLMPAYYKCIQEVLKTWSHWSIQIVDVIPFLRFFPNPGLRR 180 190 200 210 220 240 250 260 270 280 pF1KE2 LKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGP--DQDSELLSD ::. .. :. ... :...::.. . . .:.: ..: : : : .. : : . CCDS47 LKQAIEKRDHIVEMQLRQHKESLVAGQWRDMMDYMLQ-------GVAQPSMEEGSGQLLE 230 240 250 260 270 290 300 310 320 330 340 pF1KE2 NHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVG----FSRTPTIS .:. . :.. .:.:::.....:...::::.:.....: ::.:...: ::.: . CCDS47 GHVHMAAVDLLIGGTETTANTLSWAVVFLLHHPEIQQRLQEELDHELGPGASSSRVP-YK 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE2 DRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKE :: :: ::.::: ::::::::.:. .::... :::. . . .:: .: :: . : .: CCDS47 DRARLPLLNATIAEVLRLRPVVPLALPHRTTRPSSISGYDIPEGTVIIPNLQGAHLDETV 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE2 WHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDL :..: .: :.:::.: . . : :: : : :.:: ::: :::.... ::: : : CCDS47 WERPHEFWPDRFLEP------GKNSRALAFGCGARVCLGEPLARLELFVVLTRLLQAFTL 400 410 420 430 440 450 470 480 490 500 pF1KE2 EVPDDGQLPSLEGIPK--VVFLIDSFKVKIKVRQAWREAQAEGST .:. ::::. .:. :.. .. :.:... : CCDS47 -LPSGDALPSLQPLPHCSVILKMQPFQVRLQPRGMGAHSPGQSQ 460 470 480 490 >>CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 (516 aa) initn: 759 init1: 402 opt: 849 Z-score: 1006.8 bits: 195.9 E(32554): 9.3e-50 Smith-Waterman score: 849; 30.3% identity (66.4% similar) in 482 aa overlap (7-468:14-484) 10 20 30 40 pF1KE2 MWELVALLLLTLAY--LFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH ::: . . .:: . : : : : : . ::.: . : .. CCDS32 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS :. . .....:: . ..:.:. ...... . ...:...: ::.:::.. : . . CCDS32 PHL--ALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLIT 70 80 90 100 110 110 120 130 140 150 pF1KE2 NNRKGIAFADSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLCD .... .::: : .:::: . ::.. .: .. ::. . .: :: : . CCDS32 DGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQE 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 MLATHNGQSIDISFPVFVAVTNVISLICFNTSY-KNGDPELNVIQNYNEGIIDNLSKDSL ..: :. .: : :.:.:::. .::. . ...: :....: .: .... :. . CCDS32 LMAGP-GH-FDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHE-FVETASSGNP 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSD .:. : :. .:: .:...:. . .:.: .... . : ..:. .. .:.. CCDS32 LDFFPILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFK------ 240 250 260 270 280 280 290 300 310 320 330 pF1KE2 NGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQ ... :: ...:. ...:.. ..:::::: .:.:....:.: .:. .:....:. .:.: CCDS32 HSKKGPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDT 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 NVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVII .: : : .::: .: ::: : :..: :. :::... :.... : . : :.. CCDS32 VIGRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFV 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE2 NLWALHHNEKEWHQPDQFMPERFLNPAGTQLISP-SVSYLPFGAGPRSCIGEILARQELF : : ..:. . :..:..: :::::. :: . .: : ... :: : : ::::.::. :.: CCDS32 NQWQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIF 410 420 430 440 450 460 460 470 480 490 500 pF1KE2 LIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :..: :::.... :: CCDS32 LFLAILLQQLEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN 470 480 490 500 510 >>CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 (544 aa) initn: 775 init1: 372 opt: 800 Z-score: 948.4 bits: 185.1 E(32554): 1.7e-46 Smith-Waterman score: 809; 29.9% identity (62.8% similar) in 522 aa overlap (6-496:36-544) 10 20 30 pF1KE2 MWELVALLLLTL-AYLFWP---KRRCPGAKYPKSL :::: : : : : .:: : : . CCDS34 PSQPPAEDPPWPARLLRAPLGLLRLDPSGGALLLCGLVALLGWSWLRRRRARGI--PPGP 10 20 30 40 50 60 40 50 60 pF1KE2 LSLPLVGSL------PFLPRHGHMHNN----------------FFKLQKKYGPIYSVRMG ::::.. ::: :.. . . . .: . :: :.: .: CCDS34 TPWPLVGNFGHVLLPPFLRRRSWLSSRTRAAGIDPSVIGPQVLLAHLARVYGSIFSFFIG 70 80 90 100 110 120 70 80 90 100 110 120 pF1KE2 TKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAHWQLHRRLAM .:... . ..:.:..... :: ::.. ..:.... ::..:: : :. .:... CCDS34 HYLVVVLSDFHSVREALVQQAEVFSDRPRVPLISIVTKE-KGVVFAHYGPVWRQQRKFSH 130 140 150 160 170 180 130 140 150 160 170 180 pF1KE2 ATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFV-AVTNVISLICFNTSY .:. : : .:: : .:.. . . : :.. : .. ::.:.: .::. . CCDS34 STLRHFGLGKLSLEPKIIEEFKYVKAEMQKH-GEDPFCPFSIISNAVSNIICSLCFGQRF 190 200 210 220 230 240 190 200 210 220 230 240 pF1KE2 KNGDPELNVIQNY-NEGIIDNL-SKDSLVDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKI . :.. . .. ..:. : :. ::.. ::: .: ...:.. : ...:.:: CCDS34 DYTNSEFKKMLGFMSRGLEICLNSQVLLVNICPWLYYLPFGPFKELRQIEKDITSFLKKI 250 260 270 280 290 300 250 260 270 280 290 300 pF1KE2 LENYKEKFRSDSITNMLDT--LMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIFGAGV .....:.. .. ...: : . . ..:.:.. :.. ... :::.: ::. CCDS34 IKDHQESLDRENPQDFIDMYLLHMEEERKNNSNSSFDEE-------YLFYIIGDLFIAGT 310 320 330 340 350 310 320 330 340 350 360 pF1KE2 ETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREVLRLR .:::. . : : .. ::.:..:..:::.. .: .:.:...:. .. :::: :: :: CCDS34 DTTTNSLLWCLLYMSLNPDVQEKVHEEIERVIGANRAPSLTDKAQMPYTEATIMEVQRLT 360 370 380 390 400 410 370 380 390 400 410 420 pF1KE2 PVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNPAGTQ :.:. ::: .. .. . ... ::: .. :::..:.. :..:..:.:.:::. : : CCDS34 VVVPLAIPHMTSENTVLQGYTIPKGTLILPNLWSVHRDPAIWEKPEDFYPNRFLDDQG-Q 420 430 440 450 460 470 430 440 450 460 470 480 pF1KE2 LISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVF ::. ...::: : : :.:: ::..::::... :.: : . .:.:.. : : : ... CCDS34 LIKKE-TFIPFGIGKRVCMGEQLAKMELFLMFVSLMQSFAFALPEDSKKPLLTGRFGLTL 480 490 500 510 520 530 490 500 pF1KE2 LIDSFKVKIKVRQAWREAQAEGST :.. :. : CCDS34 APHPFNITISRR 540 >>CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 (501 aa) initn: 678 init1: 359 opt: 774 Z-score: 918.1 bits: 179.4 E(32554): 8.1e-45 Smith-Waterman score: 774; 28.7% identity (65.6% similar) in 474 aa overlap (7-477:20-482) 10 20 30 40 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHG :::..:. :.: : . .: . .::..:.. : . CCDS78 MWKLWRAEEGAAALGGALFLLLFALGVRQLLKQRRPMG-FPPGPPGLPFIGNIYSLAASS 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 HMHNNFFKLQKK-YGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS .. . ... :.. :: :.:. .: .::... ....:: :..... :. :: . . . CCDS78 ELPHVYMRKQSQVYGEIFSLDLGGISTVVLNGYDVVKECLVHQSEIFADRPCLPLF-MKM 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 NNRKGIAFADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSID .. :. . : : :::::. .: : :....:. : .: . . : . :..:. .: CCDS78 TKMGGLLNSRYGRGWVDHRRLAVNSFRYFGYGQKSFESKILEETKFFNDAIETYKGRPFD 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 ISFPVFVAVTNVISLICFNTSYKNGDPEL-NVIQNYNEGIIDNLSKDS-LVDLVPWLKIF .. . ::.:. .:: :. . : .. ..:. ..:.. : . : . ::. :. CCDS78 FKQLITNAVSNITNLIIFGERFTYEDTDFQHMIELFSENVELAASASVFLYNAFPWIGIL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 PNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDS : ..: .. . :.:....:. . . . . ...:. . :. . : .. : CCDS78 PFGKHQQLFRNAAVVYDFLSRLIEKASVNRKPQLPQHFVDAYL------DEMDQGKNDPS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 ELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTI .: .... ..:... ::.::::.:..:.. :. :... .. .::: .: . :. CCDS78 STFSKENLIFSVGELIIAGTETTTNVLRWAILFMALYPNIQGQVQKEIDLIMGPNGKPSW 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 SDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEK .:. .. ::...::::. ..:. : : .. :. . ... ::: :: ::...: .:: CCDS78 DDKCKMPYTEAVLHEVLRFCNIVPLGIFHATSEDAVVRGYSIPKGTTVITNLYSVHFDEK 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 EWHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFD :..:. : :::::. .: .. . . .::. : : :.:: :::.:.::... ::::: CCDS78 YWRDPEVFHPERFLDSSG--YFAKKEALVPFSLGRRHCLGEHLARMEMFLFFTALLQRFH 420 430 440 450 460 470 470 480 490 500 pF1KE2 LEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :. : . .:.:. CCDS78 LHFPHE-LVPDLKPRLGMTLQPQPYLICAERR 480 490 500 >>CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 (543 aa) initn: 598 init1: 386 opt: 772 Z-score: 915.2 bits: 179.0 E(32554): 1.2e-44 Smith-Waterman score: 772; 28.2% identity (63.6% similar) in 500 aa overlap (19-498:42-525) 10 20 30 40 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGH .:: . : . .. ::.:. . . .: CCDS17 PLNPLSIQQTTLLLLLSVLATVHVGQRLLRQRRRQLRSAPPGPFAWPLIGNAAAVGQAAH 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE2 MHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNN . .: .: ..:: ....:.:. :... .. ...:...:. :. :: .:.. ..:.. CCDS17 L--SFARLARRYGDVFQIRLGSCPIVVLNGERAIHQALVQQGSAFADRPAFASFRVVSGG 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 RKGIAFADSGAHWQLHRRLAMATFALF----KDGDQKLEKIICQEISTLCDMLA--THNG :. .::. . ::...:: : . . : . : :: . .: : .:. . .: CCDS17 RS-MAFGHYSEHWKVQRRAAHSMMRNFFTRQPRSRQVLEGHVLSEARELVALLVRGSADG 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 QSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLK .: . :::.::.: .::. :.. :::. . ..:: . ... ::::..:::. CCDS17 AFLDPRPLTVVAVANVMSAVCFGCRYSHDDPEFRELLSHNEEFGRTVGAGSLVDVMPWLQ 190 200 210 220 230 240 230 240 250 260 270 pF1KE2 IFPNKTLEKLKSHVKIRNDLLNKILENYK---EKFRSDSIT-NMLDTLM---QAKMNSDN ::: . .. .. .. : ::... :..: . .:.:... . : .:. CCDS17 YFPNPVRTVFREFEQLNRNFSNFILDKFLRHCESLRPGAAPRDMMDAFILSAEKKAAGDS 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 GNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQN ..: : : .. .:: :::::. .: .....: : .. . :.:. .. :.:: CCDS17 HGGGARLDLE-----NVPATITDIFGASQDTLSTALQWLLLLFTRYPDVQTRVQAELDQV 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE2 VGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIIN :: .: : ..:. : . : . :..:. .:. ::: .....:. . . : : :..: CCDS17 VGRDRLPCMGDQPNLPYVLAFLYEAMRFSSFVPVTIPHATTANTSVLGYHIPKDTVVFVN 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE2 LWALHHNEKEWHQPDQFMPERFLNPAGTQLISPSVS--YLPFGAGPRSCIGEILARQELF :...:. .: .:..: : :::. : ::. ... . :..: : :::: :....:: CCDS17 QWSVNHDPLKWPNPENFDPARFLDKDG--LINKDLTSRVMIFSVGKRRCIGEELSKMQLF 430 440 450 460 470 480 460 470 480 490 500 pF1KE2 LIMAWLLQRFDLEV-PDD-GQLPSLEGI---PKVVFLIDSFKVKIKVRQAWREAQAEGST :... : .. :... :.. ... :. :: ::::.. .:.. CCDS17 LFISILAHQCDFRANPNEPAKMNFSYGLTIKPK------SFKVNVTLRESMELLDSAVQN 490 500 510 520 530 CCDS17 LQAKETCQ 540 >>CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 (502 aa) initn: 650 init1: 317 opt: 737 Z-score: 874.3 bits: 171.3 E(32554): 2.2e-42 Smith-Waterman score: 738; 28.9% identity (65.8% similar) in 485 aa overlap (1-473:12-479) 10 20 30 40 pF1KE2 MWELV---ALLLLTLAYLF---WPKRRCPGAKYPKSLLSLPLVGSLPFL .: .: .::: :.:.:. . ::: : .:: . ::..:.. .. CCDS61 MLAAMGSLAAALWAVVHPRTLLLGTVAFLLAADFLKRRRP-KNYPPGPWRLPFLGNFFLV 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 P-RHGHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATL ...:.. ..: :::: ..:...: ..:.. : ::.::. ..:..:: .. . CCDS61 DFEQSHLEVQLFV--KKYGNLFSLELGDISAVLITGLPLIKEALIHMDQNFGNRP-VTPM 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 DIASNNRKGIAFADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNG ...:. .. :: :. .::...... : : ..::. : .: . : . . .:: CCDS61 REHIFKKNGLIMS-SGQAWKEQRRFTLTALRNFGLGKKSLEERIQEEAQHLTEAIKEENG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 QSIDISFPVFVAVTNVISLICFNTSYKNGDPELN-VIQNYNEGIIDNLSKD-SLVDLVPW : .: : . ::.:.: : :. .. : .. ... .: . :: .: .. :: CCDS61 QPFDPHFKINNAVSNIICSITFGERFEYQDSWFQQLLKLLDEVTYLEASKTCQLYNVFPW 180 190 200 210 220 230 230 240 250 260 270 pF1KE2 LKIF---PNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGN . : :..:: . ...:. ........... . ...:. .. .:.. .:: CCDS61 IMKFLPGPHQTLFSNWKKLKL---FVSHMIDKHRKDWNPAETRDFIDAYLK-EMSKHTGN 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 AGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVG : : . .: : .:. :.: ::.:::.....:.: .. :....:. :::. .: CCDS61 --PT--SSFHEENLICSTL-DLFFAGTETTSTTLRWALLYMALYPEIQEKVQAEIDRVIG 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 FSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLW .. :. . :. . .:.:.:: :. . :. .:....::.... . . ::: .. :: CCDS61 QGQQPSTAARESMPYTNAVIHEVQRMGNIIPLNVPREVTVDTTLAGYHLPKGTMILTNLT 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE2 ALHHNEKEWHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMA :::.. :: :: : :..::. : .. ...::. : :.:.:: ::: :::.... CCDS61 ALHRDPTEWATPDTFNPDHFLE-NGQ--FKKREAFMPFSIGKRACLGEQLARTELFIFFT 410 420 430 440 450 460 460 470 480 490 500 pF1KE2 WLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :.:.: .. :.. .: CCDS61 SLMQKFTFRPPNNEKLSLKFRMGITISPVSHRLCAVPQV 470 480 490 500 >>CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 (494 aa) initn: 605 init1: 281 opt: 733 Z-score: 869.6 bits: 170.4 E(32554): 4.1e-42 Smith-Waterman score: 733; 29.5% identity (65.8% similar) in 468 aa overlap (4-468:11-465) 10 20 30 40 50 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNF :.: : . . . : .:. : : : . ::..:. : . .:.:.. CCDS12 MLASGLLLVTLLACLTVMVLMSVWRQRKSRG-KLPPGPTPLPFIGNYLQLNTE-QMYNSL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 FKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIA .:....:::......: . .:.. :. .::.:. ....:::: ..::.: .. :.: CCDS12 MKISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKGY-GVA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 FADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFV :... :: ::...::. : : . .:. : .: . : : : .: .:: .: . CCDS12 FSNGERAKQL-RRFSIATLRGFGVGKRGIEERIQEEAGFLIDALRGTHGANIDPTFFLSR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 AVTNVISLICFNTSYKNGDPELNVIQNYNEGIID--NLSKDSLVDLVP-WLKIFPNKTLE .:.:::: : :. . : :. . . : .. : .: .. .: .:. . CCDS12 TVSNVISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEMFSSVMKHLPGPQQQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 KLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDN .: ... .:.. : .:. .. . .: ...:... .:. .. : : ..:. : CCDS12 AFK-ELQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFL-IRMQEEEKN--P--NTEFYLKN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 HILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRL ..::. ..: ::.::....... . .:...:.:. :..::::. .: .: : . :: .. CCDS12 LVMTTL-NLFFAGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKM 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 LLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPD ::.:.:. :. . :: . :..: :... .: . :::::. : .. .. . . .: CCDS12 PYTEAVIHEIQRFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVLRDPRFFSNPR 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE2 QFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDD .: :..::. : .. : ...::. : : :.:: :::.::::... ..: : .. : CCDS12 DFNPQHFLDKKGQ--FKKSDAFVPFSIGKRYCFGEGLARMELFLFFTTIMQNFRFKSPQS 410 420 430 440 450 460 480 490 500 pF1KE2 GQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST CCDS12 PKDIDVSPKHVGFATIPRNYTMSFLPR 470 480 490 >>CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 (490 aa) initn: 552 init1: 321 opt: 732 Z-score: 868.5 bits: 170.2 E(32554): 4.7e-42 Smith-Waterman score: 732; 31.5% identity (63.9% similar) in 479 aa overlap (5-470:5-463) 10 20 30 40 50 pF1KE2 MWELVALLL-LTLAYLFWPKRRCPG-AKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQK :::.: :. .:. :. : .. :.. ::..:.. : . : ... ...: CCDS74 MDPAVALVLCLSCLFLLSLWRQSSGRGRLPSGPTPLPIIGNILQLDVKD-MSKSLTNFSK 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 KYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSG :::...: .: : :.. .. .::.:: .:..:::: .. . . . :. :: :.. : CCDS74 VYGPVFTVYFGLKPIVVLHGYEAVKEALIDHGEEFSGRGSFPVAEKV-NKGLGILFSN-G 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 AHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNV .:. ::. . :. : : ...: . .: : . : :.. : .: . : :: CCDS74 KRWKEIRRFCLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTNASPCDPTFILGCAPCNV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 ISLICFNTSYKNGDPE-LNVIQNYNEGIIDNLSKDSLVDLVPWLKI---FPNKTLEKLK- : . :. . : . ::.....:: :: : ::... :: .. : CCDS74 ICSVIFHDRFDYKDQRFLNLMEKFNE----NLRILS----SPWIQVCNNFPA-LIDYLPG 180 190 200 210 220 240 250 260 270 280 pF1KE2 SHVKIRNDLL---NKILENYKEKFRS---DSITNMLDTLMQAKMNSDNGNAGPDQDSELL :: :: ... . .:: ::. .: .: ...: .. ::.... : :.::. CCDS74 SHNKIAENFAYIKSYVLERIKEHQESLDMNSARDFIDCFL-IKMEQEKHN----QQSEFT 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE2 SDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDR .. ...:. :.::::.:::...... : .::. :.: :. :::. :: .:.: ..:: CCDS74 VES-LIATVTDMFGAGTETTSTTLRYGLLLLLKYPEVTAKVQEEIECVVGRNRSPCMQDR 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE2 NRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWH ... .:...:. : . : .:: .. : .. .. . ::: .: .: .. ::.::. CCDS74 SHMPYTDAVVHEIQRYIDLLPTNLPHAVTCDVKFKNYLIPKGTTIITSLTSVLHNDKEFP 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE2 QPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEV .:..: : .::. .:. .. : ..::.:: : :.:: :::.::::... .:: :.:. CCDS74 NPEMFDPGHFLDKSGN--FKKSDYFMPFSAGKRMCMGEGLARMELFLFLTTILQNFNLKS 410 420 430 440 450 460 470 480 490 500 pF1KE2 PDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST : CCDS74 QVDPKDIDITPIANAFGRVPPLYQLCFIPV 470 480 490 508 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu May 11 11:22:02 2017 done: Thu May 11 11:22:02 2017 Total Scan time: 3.110 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]