FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2686, 508 aa 1>>>pF1KE2686 508 - 508 aa - 508 aa Library: /omim/omim.rfq.tfa 61718354 residues in 86699 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7632+/-0.000419; mu= 15.5370+/- 0.026 mean_var=76.0181+/-15.345, 0's: 0 Z-trim(110.4): 188 B-trim: 0 in 0/52 Lambda= 0.147101 statistics sampled from 18675 (18866) to 18675 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.59), E-opt: 0.2 (0.218), width: 16 Scan time: 8.320 The best scores are: opt bits E(86699) NP_000093 (OMIM: 202110,609300) steroid 17-alpha-h ( 508) 3377 726.8 3.7e-209 NP_001306146 (OMIM: 108330) cytochrome P450 1A1 is ( 512) 910 203.2 1.5e-51 NP_000490 (OMIM: 108330) cytochrome P450 1A1 isofo ( 512) 910 203.2 1.5e-51 NP_000491 (OMIM: 201910,613815) steroid 21-hydroxy ( 495) 852 190.9 7.4e-48 NP_000752 (OMIM: 124060) cytochrome P450 1A2 [Homo ( 516) 849 190.3 1.2e-47 NP_898898 (OMIM: 610670,615030) cytochrome P450 2U ( 544) 800 179.9 1.7e-44 NP_078790 (OMIM: 600081,608713) vitamin D 25-hydro ( 501) 774 174.3 7.2e-43 NP_000095 (OMIM: 231300,600975,601771,604229,61731 ( 543) 772 173.9 1e-42 NP_000766 (OMIM: 601258) cytochrome P450 2J2 [Homo ( 502) 737 166.5 1.7e-40 NP_000757 (OMIM: 608055) cytochrome P450 2A13 [Hom ( 494) 733 165.6 3e-40 NP_000763 (OMIM: 601131) cytochrome P450 2C18 isof ( 490) 732 165.4 3.4e-40 NP_000753 (OMIM: 122700,122720,188890,211980) cyto ( 494) 729 164.8 5.4e-40 NP_000760 (OMIM: 124020,609535) cytochrome P450 2C ( 490) 725 163.9 9.6e-40 NP_001122062 (OMIM: 201910,613815) steroid 21-hydr ( 465) 722 163.3 1.4e-39 XP_016872679 (OMIM: 600081,608713) PREDICTED: vita ( 446) 719 162.7 2.1e-39 XP_005252846 (OMIM: 600081,608713) PREDICTED: vita ( 447) 716 162.0 3.3e-39 XP_005252845 (OMIM: 600081,608713) PREDICTED: vita ( 453) 716 162.0 3.4e-39 NP_000761 (OMIM: 601129) cytochrome P450 2C8 isofo ( 490) 716 162.0 3.6e-39 XP_005262774 (OMIM: 610670,615030) PREDICTED: cyto ( 562) 715 161.9 4.7e-39 NP_000097 (OMIM: 124030,608902) cytochrome P450 2D ( 497) 708 160.3 1.2e-38 NP_000755 (OMIM: 608054) cytochrome P450 2A7 isofo ( 494) 707 160.1 1.4e-38 XP_011528270 (OMIM: 124030,608902) PREDICTED: cyto ( 491) 706 159.9 1.6e-38 XP_011528268 (OMIM: 124030,608902) PREDICTED: cyto ( 502) 706 159.9 1.6e-38 XP_016871247 (OMIM: 122700,601130) PREDICTED: cyto ( 490) 704 159.5 2.1e-38 NP_000762 (OMIM: 122700,601130) cytochrome P450 2C ( 490) 704 159.5 2.1e-38 NP_000758 (OMIM: 123930,614546) cytochrome P450 2B ( 491) 703 159.3 2.4e-38 NP_000765 (OMIM: 124070) cytochrome P450 2F1 precu ( 491) 698 158.2 5.1e-38 XP_016881874 (OMIM: 124070) PREDICTED: cytochrome ( 566) 698 158.2 5.7e-38 NP_000764 (OMIM: 124040) cytochrome P450 2E1 precu ( 493) 687 155.9 2.6e-37 NP_085125 (OMIM: 611529) cytochrome P450 2S1 precu ( 504) 659 149.9 1.6e-35 XP_011518197 (OMIM: 600081,608713) PREDICTED: vita ( 386) 653 148.6 3.1e-35 XP_016872684 (OMIM: 600081,608713) PREDICTED: vita ( 386) 653 148.6 3.1e-35 XP_016872681 (OMIM: 600081,608713) PREDICTED: vita ( 386) 653 148.6 3.1e-35 XP_016872682 (OMIM: 600081,608713) PREDICTED: vita ( 386) 653 148.6 3.1e-35 XP_016872680 (OMIM: 600081,608713) PREDICTED: vita ( 386) 653 148.6 3.1e-35 XP_016872683 (OMIM: 600081,608713) PREDICTED: vita ( 386) 653 148.6 3.1e-35 XP_011518200 (OMIM: 600081,608713) PREDICTED: vita ( 386) 653 148.6 3.1e-35 NP_001306145 (OMIM: 108330) cytochrome P450 1A1 is ( 483) 628 143.4 1.5e-33 NP_001185782 (OMIM: 601129) cytochrome P450 2C8 is ( 420) 622 142.1 3.2e-33 NP_001185784 (OMIM: 601129) cytochrome P450 2C8 is ( 420) 622 142.1 3.2e-33 XP_006723113 (OMIM: 123930,614546) PREDICTED: cyto ( 457) 601 137.6 7.5e-32 XP_011524854 (OMIM: 124070) PREDICTED: cytochrome ( 498) 595 136.4 2e-31 XP_011524853 (OMIM: 124070) PREDICTED: cytochrome ( 498) 595 136.4 2e-31 XP_016881873 (OMIM: 124070) PREDICTED: cytochrome ( 573) 595 136.4 2.2e-31 XP_016877442 (OMIM: 108330) PREDICTED: cytochrome ( 484) 582 133.6 1.3e-30 NP_001185783 (OMIM: 601129) cytochrome P450 2C8 is ( 388) 573 131.6 4e-30 XP_011524856 (OMIM: 124070) PREDICTED: cytochrome ( 434) 531 122.7 2.1e-27 NP_085079 (OMIM: 608054) cytochrome P450 2A7 isofo ( 443) 530 122.5 2.5e-27 XP_011513743 (OMIM: 615967) PREDICTED: cytochrome ( 475) 520 120.4 1.2e-26 XP_005258626 (OMIM: 123930,614546) PREDICTED: cyto ( 422) 518 120.0 1.4e-26 >>NP_000093 (OMIM: 202110,609300) steroid 17-alpha-hydro (508 aa) initn: 3377 init1: 3377 opt: 3377 Z-score: 3876.1 bits: 726.8 E(86699): 3.7e-209 Smith-Waterman score: 3377; 100.0% identity (100.0% similar) in 508 aa overlap (1-508:1-508) 10 20 30 40 50 60 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQKKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQKKY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 GPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 GPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 WQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNVIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 WQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNVIS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 LICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLKIFPNKTLEKLKSHVKIRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 LICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLKIFPNKTLEKLKSHVKIRN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 DLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 DLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 GAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 GAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 LRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNP 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 AGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: NP_000 AGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIP 430 440 450 460 470 480 490 500 pF1KE2 KVVFLIDSFKVKIKVRQAWREAQAEGST :::::::::::::::::::::::::::: NP_000 KVVFLIDSFKVKIKVRQAWREAQAEGST 490 500 >>NP_001306146 (OMIM: 108330) cytochrome P450 1A1 isofor (512 aa) initn: 825 init1: 555 opt: 910 Z-score: 1046.6 bits: 203.2 E(86699): 1.5e-51 Smith-Waterman score: 910; 33.1% identity (66.9% similar) in 487 aa overlap (4-468:13-483) 10 20 30 40 pF1KE2 MWELVALLLLTLAYLFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH :.: ... : .:: : . : : : : . . ::.: . : .. NP_001 MLFPISMSATEFLLASVIFCL--VFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS :. . .....:: . ..:.:. .:... . ...:...: ::.:::.. :. . : NP_001 PHL--ALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLIS 60 70 80 90 100 110 110 120 130 140 150 pF1KE2 NNRKGIAFA-DSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLC :. ....:. ::: : .:::: . .:.. .: .. ::. . .: :::: NP_001 NG-QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQ 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 DMLATHNGQSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSL ...: :. . : :.::::: :::. : .. :: . : :... . ... . NP_001 ELMAGP-GHFNPYRY-VVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNP 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLM---QAKM .:..: :. .:: .:. .:. . ....:..... . :.. : .. :.:. : :. NP_001 ADFIPILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQ 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 NSDNGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEE ..:.:. :::..:.. . :.:::: .:.:....:.: .:. ::.:..:. :: NP_001 LDENANV-------QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEE 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 IDQNVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTE .: .: :: : .:::..: .:: : :..: .:. :::... :.:. : . :: NP_001 LDTVIGRSRRPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRC 350 360 370 380 390 400 400 410 420 430 440 pF1KE2 VIINLWALHHNEKEWHQPDQFMPERFLNPAGT--QLISPSVSYLPFGAGPRSCIGEILAR :..: : ..:..: : .:..:.:::::.: :. ...: .: . :: : :.:::: .:: NP_001 VFVNQWQINHDQKLWVNPSEFLPERFLTPDGAIDKVLSEKV--IIFGMGKRKCIGETIAR 410 420 430 440 450 460 450 460 470 480 490 500 pF1KE2 QELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :.::..: :::: .. :: NP_001 WEVFLFLAILLQRVEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS 470 480 490 500 510 >>NP_000490 (OMIM: 108330) cytochrome P450 1A1 isoform 1 (512 aa) initn: 825 init1: 555 opt: 910 Z-score: 1046.6 bits: 203.2 E(86699): 1.5e-51 Smith-Waterman score: 910; 33.1% identity (66.9% similar) in 487 aa overlap (4-468:13-483) 10 20 30 40 pF1KE2 MWELVALLLLTLAYLFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH :.: ... : .:: : . : : : : . . ::.: . : .. NP_000 MLFPISMSATEFLLASVIFCL--VFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS :. . .....:: . ..:.:. .:... . ...:...: ::.:::.. :. . : NP_000 PHL--ALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLIS 60 70 80 90 100 110 110 120 130 140 150 pF1KE2 NNRKGIAFA-DSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLC :. ....:. ::: : .:::: . .:.. .: .. ::. . .: :::: NP_000 NG-QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQ 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 DMLATHNGQSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSL ...: :. . : :.::::: :::. : .. :: . : :... . ... . NP_000 ELMAGP-GHFNPYRY-VVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNP 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLM---QAKM .:..: :. .:: .:. .:. . ....:..... . :.. : .. :.:. : :. NP_000 ADFIPILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQ 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 NSDNGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEE ..:.:. :::..:.. . :.:::: .:.:....:.: .:. ::.:..:. :: NP_000 LDENANV-------QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEE 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 IDQNVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTE .: .: :: : .:::..: .:: : :..: .:. :::... :.:. : . :: NP_000 LDTVIGRSRRPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRC 350 360 370 380 390 400 400 410 420 430 440 pF1KE2 VIINLWALHHNEKEWHQPDQFMPERFLNPAGT--QLISPSVSYLPFGAGPRSCIGEILAR :..: : ..:..: : .:..:.:::::.: :. ...: .: . :: : :.:::: .:: NP_000 VFVNQWQINHDQKLWVNPSEFLPERFLTPDGAIDKVLSEKV--IIFGMGKRKCIGETIAR 410 420 430 440 450 460 450 460 470 480 490 500 pF1KE2 QELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :.::..: :::: .. :: NP_000 WEVFLFLAILLQRVEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS 470 480 490 500 510 >>NP_000491 (OMIM: 201910,613815) steroid 21-hydroxylase (495 aa) initn: 704 init1: 257 opt: 852 Z-score: 980.3 bits: 190.9 E(86699): 7.4e-48 Smith-Waterman score: 860; 31.6% identity (63.7% similar) in 507 aa overlap (4-496:7-484) 10 20 30 40 50 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLV-GSLPFLPRHGHMHNNFFKL :. : ::. : :.: . . . : ::. : : .: . . .. : NP_000 MLLLGLLLLLPLLAGARLLWNWWKLRSLHLP------PLAPGFLHLL--QPDLPIYLLGL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 QKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFAD .:.:::: ...: . .:... .. .:...:: ::.:::. : ..: : ....: NP_000 TQKFGPIYRLHLGLQDVVVLNSKRTIEEAMVKKWADFAGRPEPLTYKLVSRNYPDLSLGD 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 SGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVT . :. :..:. . ::. ...: .. : . .:. . .. : . : . . NP_000 YSLLWKAHKKLTRS--ALLLGIRDSMEPVVEQLTQEFCERMRAQPGTPVAIEEEFSLLTC 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 NVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDS-----LVDLVPWLKIFPNKTLEK ..: . :. . :. :.. : . : . :. : .::..:.:..::: :.. NP_000 SIICYLTFGDKIKDD----NLMPAYYKCIQEVLKTWSHWSIQIVDVIPFLRFFPNPGLRR 180 190 200 210 220 240 250 260 270 280 pF1KE2 LKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGP--DQDSELLSD ::. .. :. ... :...::.. . . .:.: ..: : : : .. : : . NP_000 LKQAIEKRDHIVEMQLRQHKESLVAGQWRDMMDYMLQ-------GVAQPSMEEGSGQLLE 230 240 250 260 270 290 300 310 320 330 340 pF1KE2 NHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVG----FSRTPTIS .:. . :.. .:.:::.....:...::::.:.....: ::.:...: ::.: . NP_000 GHVHMAAVDLLIGGTETTANTLSWAVVFLLHHPEIQQRLQEELDHELGPGASSSRVP-YK 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE2 DRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKE :: :: ::.::: ::::::::.:. .::... :::. . . .:: .: :: . : .: NP_000 DRARLPLLNATIAEVLRLRPVVPLALPHRTTRPSSISGYDIPEGTVIIPNLQGAHLDETV 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE2 WHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDL :..: .: :.:::.: . . : :: : : :.:: ::: :::.... ::: : : NP_000 WERPHEFWPDRFLEP------GKNSRALAFGCGARVCLGEPLARLELFVVLTRLLQAFTL 400 410 420 430 440 450 470 480 490 500 pF1KE2 EVPDDGQLPSLEGIPK--VVFLIDSFKVKIKVRQAWREAQAEGST .:. ::::. .:. :.. .. :.:... : NP_000 -LPSGDALPSLQPLPHCSVILKMQPFQVRLQPRGMGAHSPGQSQ 460 470 480 490 >>NP_000752 (OMIM: 124060) cytochrome P450 1A2 [Homo sap (516 aa) initn: 759 init1: 402 opt: 849 Z-score: 976.5 bits: 190.3 E(86699): 1.2e-47 Smith-Waterman score: 849; 30.3% identity (66.4% similar) in 482 aa overlap (7-468:14-484) 10 20 30 40 pF1KE2 MWELVALLLLTLAY--LFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH ::: . . .:: . : : : : : . ::.: . : .. NP_000 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS :. . .....:: . ..:.:. ...... . ...:...: ::.:::.. : . . NP_000 PHL--ALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLIT 70 80 90 100 110 110 120 130 140 150 pF1KE2 NNRKGIAFADSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLCD .... .::: : .:::: . ::.. .: .. ::. . .: :: : . NP_000 DGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQE 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 MLATHNGQSIDISFPVFVAVTNVISLICFNTSY-KNGDPELNVIQNYNEGIIDNLSKDSL ..: :. .: : :.:.:::. .::. . ...: :....: .: .... :. . NP_000 LMAGP-GH-FDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHE-FVETASSGNP 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE2 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSD .:. : :. .:: .:...:. . .:.: .... . : ..:. .. .:.. NP_000 LDFFPILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFK------ 240 250 260 270 280 280 290 300 310 320 330 pF1KE2 NGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQ ... :: ...:. ...:.. ..:::::: .:.:....:.: .:. .:....:. .:.: NP_000 HSKKGPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDT 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 NVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVII .: : : .::: .: ::: : :..: :. :::... :.... : . : :.. NP_000 VIGRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFV 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE2 NLWALHHNEKEWHQPDQFMPERFLNPAGTQLISP-SVSYLPFGAGPRSCIGEILARQELF : : ..:. . :..:..: :::::. :: . .: : ... :: : : ::::.::. :.: NP_000 NQWQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIF 410 420 430 440 450 460 460 470 480 490 500 pF1KE2 LIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :..: :::.... :: NP_000 LFLAILLQQLEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN 470 480 490 500 510 >>NP_898898 (OMIM: 610670,615030) cytochrome P450 2U1 [H (544 aa) initn: 775 init1: 372 opt: 800 Z-score: 920.0 bits: 179.9 E(86699): 1.7e-44 Smith-Waterman score: 809; 29.9% identity (62.8% similar) in 522 aa overlap (6-496:36-544) 10 20 30 pF1KE2 MWELVALLLLTL-AYLFWP---KRRCPGAKYPKSL :::: : : : : .:: : : . NP_898 PSQPPAEDPPWPARLLRAPLGLLRLDPSGGALLLCGLVALLGWSWLRRRRARGI--PPGP 10 20 30 40 50 60 40 50 60 pF1KE2 LSLPLVGSL------PFLPRHGHMHNN----------------FFKLQKKYGPIYSVRMG ::::.. ::: :.. . . . .: . :: :.: .: NP_898 TPWPLVGNFGHVLLPPFLRRRSWLSSRTRAAGIDPSVIGPQVLLAHLARVYGSIFSFFIG 70 80 90 100 110 120 70 80 90 100 110 120 pF1KE2 TKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAHWQLHRRLAM .:... . ..:.:..... :: ::.. ..:.... ::..:: : :. .:... NP_898 HYLVVVLSDFHSVREALVQQAEVFSDRPRVPLISIVTKE-KGVVFAHYGPVWRQQRKFSH 130 140 150 160 170 180 130 140 150 160 170 180 pF1KE2 ATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFV-AVTNVISLICFNTSY .:. : : .:: : .:.. . . : :.. : .. ::.:.: .::. . NP_898 STLRHFGLGKLSLEPKIIEEFKYVKAEMQKH-GEDPFCPFSIISNAVSNIICSLCFGQRF 190 200 210 220 230 240 190 200 210 220 230 240 pF1KE2 KNGDPELNVIQNY-NEGIIDNL-SKDSLVDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKI . :.. . .. ..:. : :. ::.. ::: .: ...:.. : ...:.:: NP_898 DYTNSEFKKMLGFMSRGLEICLNSQVLLVNICPWLYYLPFGPFKELRQIEKDITSFLKKI 250 260 270 280 290 300 250 260 270 280 290 300 pF1KE2 LENYKEKFRSDSITNMLDT--LMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIFGAGV .....:.. .. ...: : . . ..:.:.. :.. ... :::.: ::. NP_898 IKDHQESLDRENPQDFIDMYLLHMEEERKNNSNSSFDEE-------YLFYIIGDLFIAGT 310 320 330 340 350 310 320 330 340 350 360 pF1KE2 ETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREVLRLR .:::. . : : .. ::.:..:..:::.. .: .:.:...:. .. :::: :: :: NP_898 DTTTNSLLWCLLYMSLNPDVQEKVHEEIERVIGANRAPSLTDKAQMPYTEATIMEVQRLT 360 370 380 390 400 410 370 380 390 400 410 420 pF1KE2 PVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNPAGTQ :.:. ::: .. .. . ... ::: .. :::..:.. :..:..:.:.:::. : : NP_898 VVVPLAIPHMTSENTVLQGYTIPKGTLILPNLWSVHRDPAIWEKPEDFYPNRFLDDQG-Q 420 430 440 450 460 470 430 440 450 460 470 480 pF1KE2 LISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVF ::. ...::: : : :.:: ::..::::... :.: : . .:.:.. : : : ... NP_898 LIKKE-TFIPFGIGKRVCMGEQLAKMELFLMFVSLMQSFAFALPEDSKKPLLTGRFGLTL 480 490 500 510 520 530 490 500 pF1KE2 LIDSFKVKIKVRQAWREAQAEGST :.. :. : NP_898 APHPFNITISRR 540 >>NP_078790 (OMIM: 600081,608713) vitamin D 25-hydroxyla (501 aa) initn: 678 init1: 359 opt: 774 Z-score: 890.7 bits: 174.3 E(86699): 7.2e-43 Smith-Waterman score: 774; 28.7% identity (65.6% similar) in 474 aa overlap (7-477:20-482) 10 20 30 40 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHG :::..:. :.: : . .: . .::..:.. : . NP_078 MWKLWRAEEGAAALGGALFLLLFALGVRQLLKQRRPMG-FPPGPPGLPFIGNIYSLAASS 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 HMHNNFFKLQKK-YGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS .. . ... :.. :: :.:. .: .::... ....:: :..... :. :: . . . NP_078 ELPHVYMRKQSQVYGEIFSLDLGGISTVVLNGYDVVKECLVHQSEIFADRPCLPLF-MKM 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 NNRKGIAFADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSID .. :. . : : :::::. .: : :....:. : .: . . : . :..:. .: NP_078 TKMGGLLNSRYGRGWVDHRRLAVNSFRYFGYGQKSFESKILEETKFFNDAIETYKGRPFD 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 ISFPVFVAVTNVISLICFNTSYKNGDPEL-NVIQNYNEGIIDNLSKDS-LVDLVPWLKIF .. . ::.:. .:: :. . : .. ..:. ..:.. : . : . ::. :. NP_078 FKQLITNAVSNITNLIIFGERFTYEDTDFQHMIELFSENVELAASASVFLYNAFPWIGIL 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 PNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDS : ..: .. . :.:....:. . . . . ...:. . :. . : .. : NP_078 PFGKHQQLFRNAAVVYDFLSRLIEKASVNRKPQLPQHFVDAYL------DEMDQGKNDPS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 ELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTI .: .... ..:... ::.::::.:..:.. :. :... .. .::: .: . :. NP_078 STFSKENLIFSVGELIIAGTETTTNVLRWAILFMALYPNIQGQVQKEIDLIMGPNGKPSW 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE2 SDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEK .:. .. ::...::::. ..:. : : .. :. . ... ::: :: ::...: .:: NP_078 DDKCKMPYTEAVLHEVLRFCNIVPLGIFHATSEDAVVRGYSIPKGTTVITNLYSVHFDEK 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE2 EWHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFD :..:. : :::::. .: .. . . .::. : : :.:: :::.:.::... ::::: NP_078 YWRDPEVFHPERFLDSSG--YFAKKEALVPFSLGRRHCLGEHLARMEMFLFFTALLQRFH 420 430 440 450 460 470 470 480 490 500 pF1KE2 LEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :. : . .:.:. NP_078 LHFPHE-LVPDLKPRLGMTLQPQPYLICAERR 480 490 500 >>NP_000095 (OMIM: 231300,600975,601771,604229,617315) c (543 aa) initn: 598 init1: 386 opt: 772 Z-score: 887.9 bits: 173.9 E(86699): 1e-42 Smith-Waterman score: 772; 28.2% identity (63.6% similar) in 500 aa overlap (19-498:42-525) 10 20 30 40 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGH .:: . : . .. ::.:. . . .: NP_000 PLNPLSIQQTTLLLLLSVLATVHVGQRLLRQRRRQLRSAPPGPFAWPLIGNAAAVGQAAH 20 30 40 50 60 70 50 60 70 80 90 100 pF1KE2 MHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNN . .: .: ..:: ....:.:. :... .. ...:...:. :. :: .:.. ..:.. NP_000 L--SFARLARRYGDVFQIRLGSCPIVVLNGERAIHQALVQQGSAFADRPAFASFRVVSGG 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 RKGIAFADSGAHWQLHRRLAMATFALF----KDGDQKLEKIICQEISTLCDMLA--THNG :. .::. . ::...:: : . . : . : :: . .: : .:. . .: NP_000 RS-MAFGHYSEHWKVQRRAAHSMMRNFFTRQPRSRQVLEGHVLSEARELVALLVRGSADG 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE2 QSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLK .: . :::.::.: .::. :.. :::. . ..:: . ... ::::..:::. NP_000 AFLDPRPLTVVAVANVMSAVCFGCRYSHDDPEFRELLSHNEEFGRTVGAGSLVDVMPWLQ 190 200 210 220 230 240 230 240 250 260 270 pF1KE2 IFPNKTLEKLKSHVKIRNDLLNKILENYK---EKFRSDSIT-NMLDTLM---QAKMNSDN ::: . .. .. .. : ::... :..: . .:.:... . : .:. NP_000 YFPNPVRTVFREFEQLNRNFSNFILDKFLRHCESLRPGAAPRDMMDAFILSAEKKAAGDS 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE2 GNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQN ..: : : .. .:: :::::. .: .....: : .. . :.:. .. :.:: NP_000 HGGGARLDLE-----NVPATITDIFGASQDTLSTALQWLLLLFTRYPDVQTRVQAELDQV 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE2 VGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIIN :: .: : ..:. : . : . :..:. .:. ::: .....:. . . : : :..: NP_000 VGRDRLPCMGDQPNLPYVLAFLYEAMRFSSFVPVTIPHATTANTSVLGYHIPKDTVVFVN 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE2 LWALHHNEKEWHQPDQFMPERFLNPAGTQLISPSVS--YLPFGAGPRSCIGEILARQELF :...:. .: .:..: : :::. : ::. ... . :..: : :::: :....:: NP_000 QWSVNHDPLKWPNPENFDPARFLDKDG--LINKDLTSRVMIFSVGKRRCIGEELSKMQLF 430 440 450 460 470 480 460 470 480 490 500 pF1KE2 LIMAWLLQRFDLEV-PDD-GQLPSLEGI---PKVVFLIDSFKVKIKVRQAWREAQAEGST :... : .. :... :.. ... :. :: ::::.. .:.. NP_000 LFISILAHQCDFRANPNEPAKMNFSYGLTIKPK------SFKVNVTLRESMELLDSAVQN 490 500 510 520 530 NP_000 LQAKETCQ 540 >>NP_000766 (OMIM: 601258) cytochrome P450 2J2 [Homo sap (502 aa) initn: 650 init1: 317 opt: 737 Z-score: 848.3 bits: 166.5 E(86699): 1.7e-40 Smith-Waterman score: 738; 28.9% identity (65.8% similar) in 485 aa overlap (1-473:12-479) 10 20 30 40 pF1KE2 MWELV---ALLLLTLAYLF---WPKRRCPGAKYPKSLLSLPLVGSLPFL .: .: .::: :.:.:. . ::: : .:: . ::..:.. .. NP_000 MLAAMGSLAAALWAVVHPRTLLLGTVAFLLAADFLKRRRP-KNYPPGPWRLPFLGNFFLV 10 20 30 40 50 50 60 70 80 90 100 pF1KE2 P-RHGHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATL ...:.. ..: :::: ..:...: ..:.. : ::.::. ..:..:: .. . NP_000 DFEQSHLEVQLFV--KKYGNLFSLELGDISAVLITGLPLIKEALIHMDQNFGNRP-VTPM 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 DIASNNRKGIAFADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNG ...:. .. :: :. .::...... : : ..::. : .: . : . . .:: NP_000 REHIFKKNGLIMS-SGQAWKEQRRFTLTALRNFGLGKKSLEERIQEEAQHLTEAIKEENG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 QSIDISFPVFVAVTNVISLICFNTSYKNGDPELN-VIQNYNEGIIDNLSKD-SLVDLVPW : .: : . ::.:.: : :. .. : .. ... .: . :: .: .. :: NP_000 QPFDPHFKINNAVSNIICSITFGERFEYQDSWFQQLLKLLDEVTYLEASKTCQLYNVFPW 180 190 200 210 220 230 230 240 250 260 270 pF1KE2 LKIF---PNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGN . : :..:: . ...:. ........... . ...:. .. .:.. .:: NP_000 IMKFLPGPHQTLFSNWKKLKL---FVSHMIDKHRKDWNPAETRDFIDAYLK-EMSKHTGN 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE2 AGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVG : : . .: : .:. :.: ::.:::.....:.: .. :....:. :::. .: NP_000 --PT--SSFHEENLICSTL-DLFFAGTETTSTTLRWALLYMALYPEIQEKVQAEIDRVIG 300 310 320 330 340 340 350 360 370 380 390 pF1KE2 FSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLW .. :. . :. . .:.:.:: :. . :. .:....::.... . . ::: .. :: NP_000 QGQQPSTAARESMPYTNAVIHEVQRMGNIIPLNVPREVTVDTTLAGYHLPKGTMILTNLT 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE2 ALHHNEKEWHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMA :::.. :: :: : :..::. : .. ...::. : :.:.:: ::: :::.... NP_000 ALHRDPTEWATPDTFNPDHFLE-NGQ--FKKREAFMPFSIGKRACLGEQLARTELFIFFT 410 420 430 440 450 460 460 470 480 490 500 pF1KE2 WLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST :.:.: .. :.. .: NP_000 SLMQKFTFRPPNNEKLSLKFRMGITISPVSHRLCAVPQV 470 480 490 500 >>NP_000757 (OMIM: 608055) cytochrome P450 2A13 [Homo sa (494 aa) initn: 605 init1: 281 opt: 733 Z-score: 843.8 bits: 165.6 E(86699): 3e-40 Smith-Waterman score: 733; 29.5% identity (65.8% similar) in 468 aa overlap (4-468:11-465) 10 20 30 40 50 pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNF :.: : . . . : .:. : : : . ::..:. : . .:.:.. NP_000 MLASGLLLVTLLACLTVMVLMSVWRQRKSRG-KLPPGPTPLPFIGNYLQLNTE-QMYNSL 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 FKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIA .:....:::......: . .:.. :. .::.:. ....:::: ..::.: .. :.: NP_000 MKISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKGY-GVA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 FADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFV :... :: ::...::. : : . .:. : .: . : : : .: .:: .: . NP_000 FSNGERAKQL-RRFSIATLRGFGVGKRGIEERIQEEAGFLIDALRGTHGANIDPTFFLSR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 AVTNVISLICFNTSYKNGDPELNVIQNYNEGIID--NLSKDSLVDLVP-WLKIFPNKTLE .:.:::: : :. . : :. . . : .. : .: .. .: .:. . NP_000 TVSNVISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEMFSSVMKHLPGPQQQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 KLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDN .: ... .:.. : .:. .. . .: ...:... .:. .. : : ..:. : NP_000 AFK-ELQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFL-IRMQEEEKN--P--NTEFYLKN 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE2 HILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRL ..::. ..: ::.::....... . .:...:.:. :..::::. .: .: : . :: .. NP_000 LVMTTL-NLFFAGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKM 300 310 320 330 340 360 370 380 390 400 410 pF1KE2 LLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPD ::.:.:. :. . :: . :..: :... .: . :::::. : .. .. . . .: NP_000 PYTEAVIHEIQRFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVLRDPRFFSNPR 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE2 QFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDD .: :..::. : .. : ...::. : : :.:: :::.::::... ..: : .. : NP_000 DFNPQHFLDKKGQ--FKKSDAFVPFSIGKRYCFGEGLARMELFLFFTTIMQNFRFKSPQS 410 420 430 440 450 460 480 490 500 pF1KE2 GQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST NP_000 PKDIDVSPKHVGFATIPRNYTMSFLPR 470 480 490 508 residues in 1 query sequences 61718354 residues in 86699 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu May 11 11:22:03 2017 done: Thu May 11 11:22:04 2017 Total Scan time: 8.320 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]