FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4491, 512 aa 1>>>pF1KE4491 512 - 512 aa - 512 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0418+/-0.000951; mu= 14.4071+/- 0.057 mean_var=76.1376+/-15.333, 0's: 0 Z-trim(105.9): 78 B-trim: 97 in 1/50 Lambda= 0.146986 statistics sampled from 8612 (8690) to 8612 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.637), E-opt: 0.2 (0.267), width: 16 Scan time: 3.160 The best scores are: opt bits E(32554) CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 3459 743.2 1.6e-214 CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 2604 561.9 5.8e-160 CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 2549 550.2 2e-156 CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 1277 280.5 3.3e-75 CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 910 202.7 8.3e-52 CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 850 189.9 5.5e-48 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 820 183.6 4.9e-46 CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 690 156.0 9e-38 CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 677 153.2 6.2e-37 CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 664 150.5 4.1e-36 CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 660 149.6 7.4e-36 CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 656 148.8 1.3e-35 CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 655 148.6 1.5e-35 CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 654 148.4 1.8e-35 CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 654 148.4 1.8e-35 CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 652 147.9 2.4e-35 CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 647 146.9 4.3e-35 CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 647 146.9 5e-35 CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 646 146.7 5.3e-35 CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 644 146.2 6.3e-35 CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 641 145.6 1.2e-34 CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 612 139.5 8.7e-33 CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 609 138.8 1.3e-32 CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 604 137.8 2.8e-32 CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 540 124.2 3.2e-28 CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 518 119.5 8.5e-27 CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 498 115.3 1.4e-25 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 366 87.3 4.4e-17 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 366 87.3 4.6e-17 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 355 85.0 2.2e-16 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 344 82.6 1.1e-15 CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 340 81.8 2.1e-15 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 335 80.7 4.4e-15 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 332 80.1 5.2e-15 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 332 80.1 6.5e-15 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 329 79.5 1e-14 CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 318 77.1 5.2e-14 CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 317 76.9 6.1e-14 CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 307 74.8 2.6e-13 CCDS543.1 CYP4A11 gene_id:1579|Hs108|chr1 ( 519) 306 74.6 3.1e-13 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 303 73.9 3.5e-13 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 303 73.9 4.7e-13 CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 ( 531) 303 73.9 4.9e-13 CCDS74303.1 CYP4F8 gene_id:11283|Hs108|chr19 ( 520) 301 73.5 6.4e-13 CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 294 72.0 1.8e-12 CCDS59362.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 285 70.1 6.7e-12 CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 279 68.9 1.6e-11 CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 278 68.6 1.8e-11 CCDS12332.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 277 68.4 2.2e-11 CCDS5677.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 420) 274 67.8 2.8e-11 >>CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 (512 aa) initn: 3459 init1: 3459 opt: 3459 Z-score: 3964.7 bits: 743.2 E(32554): 1.6e-214 Smith-Waterman score: 3459; 100.0% identity (100.0% similar) in 512 aa overlap (1-512:1-512) 10 20 30 40 50 60 pF1KE4 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKNPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKNPH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 LALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNGQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNGQS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 MSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELMAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELMAG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 PGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNPADFIPIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNPADFIPIL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 RYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENANV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENANV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPRLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPRLS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 DRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINHDQKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINHDQKL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 WVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQRVEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 WVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQRVEF 430 440 450 460 470 480 490 500 510 pF1KE4 SVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS :::::::::::::::::::::::::::::::: CCDS10 SVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS 490 500 510 >>CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 (483 aa) initn: 3231 init1: 2604 opt: 2604 Z-score: 2985.3 bits: 561.9 E(32554): 5.8e-160 Smith-Waterman score: 3177; 94.1% identity (94.3% similar) in 512 aa overlap (1-512:1-483) 10 20 30 40 50 60 pF1KE4 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKNPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKNPH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 LALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNGQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNGQS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 MSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELMAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELMAG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 PGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNPADFIPIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 PGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNPADFIPIL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 RYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENANV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 RYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENANV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPRLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPRLS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 DRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINHDQKL :::::::::::::::::::::::::::: .:: CCDS81 DRSHLPYMEAFILETFRHSSFVPFTIPH-----------------------------RKL 370 380 390 430 440 450 460 470 480 pF1KE4 WVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQRVEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 WVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQRVEF 400 410 420 430 440 450 490 500 510 pF1KE4 SVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS :::::::::::::::::::::::::::::::: CCDS81 SVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS 460 470 480 >>CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 (516 aa) initn: 2549 init1: 1426 opt: 2549 Z-score: 2921.8 bits: 550.2 E(32554): 2e-156 Smith-Waterman score: 2549; 73.0% identity (90.6% similar) in 508 aa overlap (5-511:7-512) 10 20 30 40 50 pF1KE4 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN . .::::.::::.::::::::... ::.::::::.:: ::::::.::.:::::: CCDS32 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 PHLALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNG ::::::::::.::::::::::::::.::: ::::::::::::::::::::::: :::..: CCDS32 PHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLITDG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELM ::..:: :::::::::::::::.:..::::::::::.::::::::::::..::: ::::: CCDS32 QSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQELM 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 AGPGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNPADFIP ::::::.:: :::::.::: :.:::... .. .:.::::. ...: :...:::: ::.: CCDS32 AGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASSGNPLDFFP 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 ILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENA ::::::::.:. :: .:..: :.:: :.:::. :.:. .:::: .:..: :. . . CCDS32 ILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFKH--SKKGPRAS 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 NVQLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPR . . .:::.:.: :.:::::::::::::::::::: .:..:::::.:::::::: :::: CCDS32 GNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVIGRERRPR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 LSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINHDQ :::: .:::.:::::::::::::.::::::::::::.:.:::::: ::::::::.::: CCDS32 LSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQWQVNHDP 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 KLWVNPSEFLPERFLTPDG-AIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQR .:: .:::: :::::: :: ::.: ::::...::::::.::::..:.::.:::::::::. CCDS32 ELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLFLAILLQQ 420 430 440 450 460 470 480 490 500 510 pF1KE4 VEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS .::::: :::::.::::::::::: ::: : .:: CCDS32 LEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN 480 490 500 510 >>CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 (543 aa) initn: 1175 init1: 626 opt: 1277 Z-score: 1463.7 bits: 280.5 E(32554): 3.3e-75 Smith-Waterman score: 1277; 40.1% identity (70.8% similar) in 504 aa overlap (2-499:13-512) 10 20 30 40 pF1KE4 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLI : :.:.. : .:: .. : : : . . . ::::..:::: CCDS17 MGTSLSPNDPWPLNPLSIQQTTLLLLLSVLATVHVGQRLLRQRRRQLRSAPPGPFAWPLI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE4 GHMLTLGKNPHLALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDL :. ..:. ::...:....::::.:::.:: :.:::.: .:.::::.::. : :: . CCDS17 GNAAAVGQAAHLSFARLARRYGDVFQIRLGSCPIVVLNGERAIHQALVQQGSAFADRPAF 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE4 YTFTLISNGQSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEV .: ..:.:.::.:. : : ..:: :.. ...: .. .: : :: :: .::. CCDS17 ASFRVVSGGRSMAFGHYS-EHWKVQRRAAHSMMRNF-FTRQPRSRQ--VLEGHVLSEARE 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 LISTLQELMAGPGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVG :.. : . : . ..: .::.:.::. :.::: ::.:. :. :.. :..::..:: CCDS17 LVALLVRGSADGAFLDPRPLTVVAVANVMSAVCFGCRYSHDDPEFRELLSHNEEFGRTVG 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE4 SGNPADFIPILRYLPNPSLNAFKD---LNEKFYSFMQKMVKEHYKTFEKGHI-RDITDSL .:. .: .: :.:.::: ..:.. ::..: .:. .: .... : ::. :.. CCDS17 AGSLVDVMPWLQYFPNPVRTVFREFEQLNRNFSNFILDKFLRHCESLRPGAAPRDMMDAF 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE4 IEHCQEKQLDEN--ANVQLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKI : ..: .. ....:. :.. . :.:::. ::..::..: :. .. : :: .. CCDS17 ILSAEKKAAGDSHGGGARLDLENVPATITDIFGASQDTLSTALQWLLLLFTRYPDVQTRV 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE4 QEELDTVIGRSRRPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPK : ::: :.::.: : ..:. .:::. ::. :..: ::::: ::::.:: .::. :..::: CCDS17 QAELDQVVGRDRLPCMGDQPNLPYVLAFLYEAMRFSSFVPVTIPHATTANTSVLGYHIPK 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE4 GRCVFVNQWQINHDQKLWVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIA ::::::..::: : :: .: : ::: :: :.: :. .:.::..:::.:::: .. CCDS17 DTVVFVNQWSVNHDPLKWPNPENFDPARFLDKDGLINKDLTSRVMIFSVGKRRCIGEELS 420 430 440 450 460 470 470 480 490 500 510 pF1KE4 RWEVFLFLAILLQRVEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS . ..:::..:: .. .: . . . :. ::::.: CCDS17 KMQLFLFISILAHQCDFRANPNEPAKMNFSYGLTIKPKSFKVNVTLRESMELLDSAVQNL 480 490 500 510 520 530 CCDS17 QAKETCQ 540 >>CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 (508 aa) initn: 825 init1: 555 opt: 910 Z-score: 1043.5 bits: 202.7 E(32554): 8.3e-52 Smith-Waterman score: 910; 33.1% identity (66.9% similar) in 487 aa overlap (13-483:4-468) 10 20 30 40 50 pF1KE4 MLFPISMSATEFLLASVIFCL--VFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN :.: ... : .:: : . : : : : . . ::.: . : .. CCDS75 MWELVALLLLTLAYLFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH 10 20 30 40 60 70 80 90 100 110 pF1KE4 PHL--ALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLIS :. . .....:: . ..:.:. .:... . ...:...: ::.:::.. :. . : CCDS75 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 NG-QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQ :. ....:. ::: : .:::: . .:.. .: .. ::. . .: :::: CCDS75 NNRKGIAFA-DSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLC 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 ELMAGP-GHFNPYRY-VVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNP ...: :. . : :.::::: :::. : .. :: . : :... . ... . CCDS75 DMLATHNGQSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSL 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 ADFIPILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQ .:..: :. .:: .:. .:. . ....:..... . :.. : .. :.:. : :. CCDS75 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLM---QAKM 220 230 240 250 260 270 300 310 320 330 340 pF1KE4 LDENANVQ-------LSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEE ..:.:. :::..:.. . :.:::: .:.:....:.: .:. ::.:..:. :: CCDS75 NSDNGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEE 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE4 LDTVIGRSRRPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRC .: .: :: : .:::..: .:: : :..: .:. :::... :.:. : . :: CCDS75 IDQNVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTE 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE4 VFVNQWQINHDQKLWVNPSEFLPERFLTPDGAIDKVLSEKV--IIFGMGKRKCIGETIAR :..: : ..:..: : .:..:.:::::.: :. ...: .: . :: : :.:::: .:: CCDS75 VIINLWALHHNEKEWHQPDQFMPERFLNPAGT--QLISPSVSYLPFGAGPRSCIGEILAR 400 410 420 430 440 470 480 490 500 510 pF1KE4 WEVFLFLAILLQRVEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS :.::..: :::: .. :: CCDS75 QELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST 450 460 470 480 490 500 >>CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 (497 aa) initn: 699 init1: 410 opt: 850 Z-score: 974.9 bits: 189.9 E(32554): 5.5e-48 Smith-Waterman score: 863; 31.7% identity (67.4% similar) in 454 aa overlap (38-485:32-471) 10 20 30 40 50 60 pF1KE4 SATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLG-KNPHLALSRM . :::: : .:..: . .: .... CCDS46 GLEALVPLAVIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 SQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNGQSMS--FS ...:::...... ::::::.:: ..:.::: .:.: :: . ... : . : CCDS46 RRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQGVFL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 PDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELMAGPGHF ::.: .::.. . :....... ::. :..:: : ... . . : : CCDS46 ARYGPAWREQRRFSVSTLRNLGLGKKS-------LEQWVTEEAACLCAAFANHSGRP--F 130 140 150 160 170 190 200 210 220 230 240 pF1KE4 NPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNL-NNNFGEVVGSGNPA-DFIPILRY : . .:.::: .. :::.... ..: :..: .... : : . . .:.: . CCDS46 RPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLH 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE4 LPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHI-RDITDSLIEHCQEKQLDENANVQ .: . .... ... : . ..... :: :.. .. ::.:.... . .. . : . . CCDS46 IPALAGKVLR-FQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAK--GNPESS 240 250 260 270 280 310 320 330 340 350 360 pF1KE4 LSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPRLSD ..::.. .: :::.::. :..:...:.:. ....: :::..:.:.: :::. :::...: CCDS46 FNDENLRIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGD 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE4 RSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINHDQKLW ..:.:: : : :. : ...::. . : :.:: ..:: :::: ...: .. .:. .: CCDS46 QAHMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVW 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE4 VNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQRVEFS .: .: ::.:: .: . : : . :. :.: :.:: .:: :.:::.. :::. :: CCDS46 EKPFRFHPEHFLDAQGHFVK--PEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFS 410 420 430 440 450 460 490 500 510 pF1KE4 VPLGVKVDMTPIYGLTMKHACCEHFQMQLRS :: : CCDS46 VPTGQPRPSHHGVFAFLVSPSPYELCAVPR 470 480 490 >>CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 (544 aa) initn: 850 init1: 424 opt: 820 Z-score: 939.9 bits: 183.6 E(32554): 4.9e-46 Smith-Waterman score: 965; 31.0% identity (65.9% similar) in 525 aa overlap (2-498:27-532) 10 20 30 pF1KE4 MLFPISMSATEFLLASVIFCLVFWV-IRASRPQVP :. .. :. .:: ... :. : .: : CCDS34 MSSPGPSQPPAEDPPWPARLLRAPLGLLRLDPSGGALLLCGLV-ALLGWSWLRRRRA--- 10 20 30 40 50 40 50 60 70 pF1KE4 KGLKNPPGPWGWPLIG---HML----------------TLGKNP-----HLALSRMSQQY .:. :::: :::.: :.: . : .: .. :..... : CCDS34 RGI--PPGPTPWPLVGNFGHVLLPPFLRRRSWLSSRTRAAGIDPSVIGPQVLLAHLARVY 60 70 80 90 100 110 80 90 100 110 120 130 pF1KE4 GDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNGQSMSFSPDSGPV :..... :: ::::: . ..:.:::.:.. :. :: . ...... ... :. ::: CCDS34 GSIFSFFIGHYLVVVLSDFHSVREALVQQAEVFSDRPRVPLISIVTKEKGVVFA-HYGPV 120 130 140 150 160 170 140 150 160 170 180 190 pF1KE4 WAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELMAGPGHFNPYRYV : .:..... :. :.... :: .. .: . . . .:. : : :. . CCDS34 WRQQRKFSHSTLRHFGLGK-------LSLEPKIIEEFKYVKAEMQK--HGEDPFCPFSII 180 190 200 210 220 200 210 220 230 240 pF1KE4 VVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNP--ADFIPILRYLPNPSL .:.:.::..:::.:.:....:. ..... . :. ... ... : : ::: . CCDS34 SNAVSNIICSLCFGQRFDYTNSEFKKMLGFMSRGLEICLNSQVLLVNICPWLYYLPFGPF 230 240 250 260 270 280 250 260 270 280 290 300 pF1KE4 NAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENANVQLSDEKII . ...... . ::..:..:.: ..... . .:. : . : .:.. . :.: ....: .. CCDS34 KELRQIEKDITSFLKKIIKDHQESLDRENPQDFIDMYLLHMEEERKN-NSNSSFDEEYLF 290 300 310 320 330 340 310 320 330 340 350 360 pF1KE4 NIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPRLSDRSHLPYM :. ::: :: ::.:... : :.:. .:: ::.:..::.. ::: .: : :.:....:: CCDS34 YIIGDLFIAGTDTTTNSLLWCLLYMSLNPDVQEKVHEEIERVIGANRAPSLTDKAQMPYT 350 360 370 380 390 400 370 380 390 400 410 420 pF1KE4 EAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINHDQKLWVNPSEFL :: :.:. : . ::..::: :...: :.:. :::: .. : :....: .: .: .: CCDS34 EATIMEVQRLTVVVPLAIPHMTSENTVLQGYTIPKGTLILPNLWSVHRDPAIWEKPEDFY 410 420 430 440 450 460 430 440 450 460 470 480 pF1KE4 PERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQRVEFSVPLGVKV :.::: .: . : .: : ::.::: :.:: .:. :.::... :.: :..: : CCDS34 PNRFLDDQGQLIK--KETFIPFGIGKRVCMGEQLAKMELFLMFVSLMQSFAFALPEDSKK 470 480 490 500 510 520 490 500 510 pF1KE4 DM-TPIYGLTMKHACCEHFQMQLRS . : .:::. CCDS34 PLLTGRFGLTLAPHPFNITISRR 530 540 >>CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 (494 aa) initn: 769 init1: 336 opt: 690 Z-score: 791.6 bits: 156.0 E(32554): 9e-38 Smith-Waterman score: 913; 32.5% identity (68.9% similar) in 492 aa overlap (7-492:1-475) 10 20 30 40 50 pF1KE4 MLFPISMSATEFLLASVIFCLVFWVIRAS-RPQVPKGLKNPPGPWGWPLIGHMLTLGKNP : :. .::.... ::. :. . : . .: : :::: :.::..: :. . CCDS12 MLASGLLLVTLLACLTVMVLMSVWRQRKSRG-KLPPGPTPLPFIGNYLQLNTEQ 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 HL-ALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNG .: ..:..:: :. :..: :::: : :....::: :...:.:: . :: . .: CCDS12 MYNSLMKISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELM ...:: .: ::.. :..:.... .::....:: ::..:. CCDS12 YGVAFS--NGERAKQLRRFSIATLRGFGVGKRG-------IEERIQEEAGFLIDALRGTH 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 AGPGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLN-NNFG-EVVGSGNPAD- .. ...: .. .:.::: .: :: :.:.. .:.:::. . ..: ....:. . CCDS12 GA--NIDPTFFLSRTVSNVISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEM 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 FIPILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLD : ....::.:. .:::.: . . .:. : :... .:.. . ::. ::.. . ::. . CCDS12 FSSVMKHLPGPQQQAFKEL-QGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEE--E 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 ENANVQLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSR .: :... .... .:.:: :: .::.:.. .... :. .:.:. :..::.: :::..: CCDS12 KNPNTEFYLKNLVMTTLNLFFAGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNR 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 RPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQIN .:.. ::...:: :: : : : ....:. . : ...::... :..::: :: .. CCDS12 QPKFEDRAKMPYTEAVIHEIQRFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVL 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE4 HDQKLWVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILL .: ... :: .: :..:: : . : :. . :..::: :.:: .:: :.:::.. .. CCDS12 RDPRFFSNPRDFNPQHFLDKKGQFKK--SDAFVPFSIGKRYCFGEGLARMELFLFFTTIM 400 410 420 430 440 450 480 490 500 510 pF1KE4 QRVEFSVPLGVK-VDMTPIYGLTMKHACCEHFQMQLRS : .:. : . : .:..: CCDS12 QNFRFKSPQSPKDIDVSPKHVGFATIPRNYTMSFLPR 460 470 480 490 >>CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 (502 aa) initn: 649 init1: 355 opt: 677 Z-score: 776.6 bits: 153.2 E(32554): 6.2e-37 Smith-Waterman score: 884; 29.7% identity (67.3% similar) in 502 aa overlap (12-503:21-497) 10 20 30 40 50 pF1KE4 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGH .::..: : :. .. ::. . ::::: :..:. CCDS61 MLAAMGSLAAALWAVVHPRTLLLGTVAFLLAADFLKRRRPK-----NYPPGPWRLPFLGN 10 20 30 40 50 60 70 80 90 100 pF1KE4 MLTLG-KNPHLALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRP--D .. . .. :: .. . ..::.......:. .:...:: :..::... ..: .:: CCDS61 FFLVDFEQSHLEVQLFVKKYGNLFSLELGDISAVLITGLPLIKEALIHMDQNFGNRPVTP 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE4 LYTFTLISNGQSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAE . . .:: :: :: .: .::.. ..:..:.... :::....::. CCDS61 MREHIFKKNGLIMS----SGQAWKEQRRFTLTALRNFGLGKKS-------LEERIQEEAQ 120 130 140 150 160 170 180 190 200 210 220 pF1KE4 VLISTLQELMAGPGHFNPYRYVVVSVTNVICAICFGRRYDHNH---QELLSLVNLNNNFG : ...: . : :.:. . .:.:.::.: ::.:.... :.::.:.. . .. CCDS61 HLTEAIKEENGQP--FDPHFKINNAVSNIICSITFGERFEYQDSWFQQLLKLLD-EVTYL 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE4 EVVGSGNPADFIP-ILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDS :. . . . .: :...::.: . :.. .:. :...:. .: : .. .. ::. :. CCDS61 EASKTCQLYNVFPWIMKFLPGPHQTLFSNW-KKLKLFVSHMIDKHRKDWNPAETRDFIDA 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 LIEHCQEKQLDENANVQLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQ .. . .. : . .. .:..: .:::: :: .:..:.. :.:.:... :..:.:.: CCDS61 YLK--EMSKHTGNPTSSFHEENLICSTLDLFFAGTETTSTTLRWALLYMALYPEIQEKVQ 290 300 310 320 330 350 360 370 380 390 400 pF1KE4 EELDTVIGRSRRPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKG :.: :::....: . : .:: .: : :. : ....:...:. .: ::.: :...::: CCDS61 AEIDRVIGQGQQPSTAARESMPYTNAVIHEVQRMGNIIPLNVPREVTVDTTLAGYHLPKG 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE4 RCVFVNQWQINHDQKLWVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIAR ...: ...: :..:. : :..:: .: . : : . :..::: :.:: .:: CCDS61 TMILTNLTALHRDPTEWATPDTFNPDHFLE-NGQFKK--REAFMPFSIGKRACLGEQLAR 400 410 420 430 440 450 470 480 490 500 510 pF1KE4 WEVFLFLAILLQRVEFSVPLGVKVDMTPIYGLTMK---HACCEHFQMQLRS :.:.:.. :.:. : : . :... .:.:.. : : CCDS61 TELFIFFTSLMQKFTFRPPNNEKLSLKFRMGITISPVSHRLCAVPQV 460 470 480 490 500 >>CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 (494 aa) initn: 755 init1: 329 opt: 664 Z-score: 761.8 bits: 150.5 E(32554): 4.1e-36 Smith-Waterman score: 890; 31.6% identity (68.6% similar) in 491 aa overlap (7-492:1-475) 10 20 30 40 50 60 pF1KE4 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKNPH : :. .::.... ::. :. . : . : :::: :.::..: :. . CCDS12 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQM 10 20 30 40 50 70 80 90 100 110 pF1KE4 L-ALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNGQ .: ..:..:: :. :..: :::: : :..:.::: :...:.:: . :: . .: CCDS12 YNSLMKISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 SMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELMA .. :: .: ::.. :..:.... .::....:: ::..:. . CCDS12 GVVFS--NGERAKQLRRFSIATLRDFGVGKRG-------IEERIQEEAGFLIDALRG--T 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 GPGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGS--GNPAD-F : ....: .. .:.::: .: :: :.:.. .:.:::. . .. . ... :. . : CCDS12 GGANIDPTFFLSRTVSNVISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMF 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 IPILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDE ....::.:. .::. : . . .:. : :... .:.. . ::. ::.. . ::. .. CCDS12 SSVMKHLPGPQQQAFQLL-QGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEE--EK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 NANVQLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRR : :... .... .:.:: .: .::.:.. .... :. .:.:. :..::.: :::..:. CCDS12 NPNTEFYLKNLVMTTLNLFIGGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQ 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 PRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINH :.. ::...::::: : : : .. .:... . . .::... :..::: :. .. . CCDS12 PKFEDRAKMPYMEAVIHEIQRFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLR 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE4 DQKLWVNPSEFLPERFLTPDGAIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQ : ... ::..: :..::. : . : :. . :..:::.:.:: .:: :.:::.. ..: CCDS12 DPSFFSNPQDFNPQHFLNEKGQFKK--SDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQ 410 420 430 440 450 480 490 500 510 pF1KE4 RVEFSVPLGVK-VDMTPIYGLTMKHACCEHFQMQLRS ... . : .:..: CCDS12 NFRLKSSQSPKDIDVSPKHVGFATIPRNYTMSFLPR 460 470 480 490 512 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:47:12 2016 done: Sun Nov 6 00:47:13 2016 Total Scan time: 3.160 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]