FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1959, 516 aa 1>>>pF1KE1959 516 - 516 aa - 516 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6864+/-0.000875; mu= 16.1241+/- 0.052 mean_var=73.3649+/-14.522, 0's: 0 Z-trim(106.8): 75 B-trim: 3 in 1/48 Lambda= 0.149737 statistics sampled from 9121 (9197) to 9121 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.283), width: 16 Scan time: 3.320 The best scores are: opt bits E(32554) CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 3473 759.8 0 CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 2549 560.2 2e-159 CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 1890 417.8 1.4e-116 CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 1224 273.9 3.1e-73 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 882 200.1 5.4e-51 CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 849 192.9 7.2e-49 CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 831 189.0 1e-47 CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 773 176.5 6.2e-44 CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 704 161.6 1.9e-39 CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 694 159.4 8.5e-39 CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 671 154.5 2.6e-37 CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 646 149.1 1.1e-35 CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 618 143.0 6.7e-34 CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 613 141.9 1.6e-33 CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 612 141.7 1.8e-33 CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 612 141.7 1.8e-33 CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 610 141.3 2.4e-33 CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 594 137.8 2.7e-32 CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 591 137.2 4.2e-32 CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 582 135.2 1.6e-31 CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 575 133.7 4.6e-31 CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 554 129.2 1.1e-29 CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 550 128.3 1.7e-29 CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 548 127.8 2.1e-29 CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 482 113.6 5.1e-25 CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 481 113.4 5.7e-25 CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 453 107.3 3.5e-23 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 388 93.3 6.8e-19 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 388 93.3 7.1e-19 CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 370 89.5 1e-17 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 369 89.2 1.2e-17 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 343 83.6 5.7e-16 CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 342 83.4 6.9e-16 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 336 82.1 1.7e-15 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 328 80.3 4.2e-15 CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 329 80.6 4.7e-15 CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 328 80.4 5.4e-15 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 325 79.7 8.5e-15 CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 322 79.1 1.4e-14 CCDS55175.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 466) 319 78.4 1.9e-14 CCDS5855.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 534) 319 78.4 2.2e-14 CCDS55174.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 580) 319 78.5 2.3e-14 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 315 77.5 3.1e-14 CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 ( 531) 314 77.4 4.6e-14 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 313 77.1 5.1e-14 CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 310 76.5 8.1e-14 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 309 76.3 9.5e-14 CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 303 75.0 2.3e-13 CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 299 74.1 4.1e-13 CCDS74303.1 CYP4F8 gene_id:11283|Hs108|chr19 ( 520) 294 73.0 9e-13 >>CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 (516 aa) initn: 3473 init1: 3473 opt: 3473 Z-score: 4054.3 bits: 759.8 E(32554): 0 Smith-Waterman score: 3473; 100.0% identity (100.0% similar) in 516 aa overlap (1-516:1-516) 10 20 30 40 50 60 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 PHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLITDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLITDG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 QSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQELM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQELM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 AGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASSGNPLDFFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 AGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASSGNPLDFFP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 ILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFKHSKKGPRASGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFKHSKKGPRASGN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 LIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVIGRERRPRLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVIGRERRPRLS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 DRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQWQVNHDPEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQWQVNHDPEL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 WEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLFLAILLQQLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 WEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLFLAILLQQLE 430 440 450 460 470 480 490 500 510 pF1KE1 FSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN :::::::::::::::::::::::::::::::::::: CCDS32 FSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN 490 500 510 >>CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 (512 aa) initn: 2549 init1: 1426 opt: 2549 Z-score: 2975.6 bits: 560.2 E(32554): 2e-159 Smith-Waterman score: 2549; 73.2% identity (90.7% similar) in 508 aa overlap (7-512:5-511) 10 20 30 40 50 60 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN . .::::.::::.::::::::... ::.::::::.:: ::::::.::.:::::: CCDS10 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 PHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLITDG ::::::::::.::::::::::::::.::: ::::::::::::::::::::::: :::..: CCDS10 PHLALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 QSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQELM ::..:: :::::::::::::::.:..::::::::::.::::::::::::..::: ::::: CCDS10 QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELM 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASSGNPLDFFP ::::::.:: :::::.::: :.:::... .. .:.::::. ...: :...:::: ::.: CCDS10 AGPGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNPADFIP 180 190 200 210 220 230 250 260 270 280 290 pF1KE1 ILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFKHSK-KGPRASG ::::::::.:. :: .:..: :.:: :.:::. :.:. .:::: .:..: . : .. CCDS10 ILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 NL-IPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVIGRERRPR :. . .:::.:.: :.:::::::::::::::::::: .:..:::::.:::::::: :::: CCDS10 NVQLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 LSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQWQVNHDP :::: .:::.:::::::::::::.::::::::::::.:.:::::: ::::::::.::: CCDS10 LSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRCVFVNQWQINHDQ 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 ELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLFLAILLQQ .:: .:::: :::::: :: ::.: ::::...::::::.::::..:.::.:::::::::. CCDS10 KLWVNPSEFLPERFLTPDG-AIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQR 420 430 440 450 460 470 480 490 500 510 pF1KE1 LEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN .::::: :::::.::::::::::: ::: : .:: CCDS10 VEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS 480 490 500 510 >>CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 (483 aa) initn: 2359 init1: 1426 opt: 1890 Z-score: 2206.6 bits: 417.8 E(32554): 1.4e-116 Smith-Waterman score: 2304; 68.5% identity (85.4% similar) in 508 aa overlap (7-512:5-482) 10 20 30 40 50 60 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN . .::::.::::.::::::::... ::.::::::.:: ::::::.::.:::::: CCDS81 MLFPISMSATEFLLASVIFCLVFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 PHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLITDG ::::::::::.::::::::::::::.::: ::::::::::::::::::::::: :::..: CCDS81 PHLALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLISNG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 QSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQELM ::..:: :::::::::::::::.:..::::::::::.::::::::::::..::: ::::: CCDS81 QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQELM 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASSGNPLDFFP ::::::.:: :::::.::: :.:::... .. .:.::::. ...: :...:::: ::.: CCDS81 AGPGHFNPYRYVVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNPADFIP 180 190 200 210 220 230 250 260 270 280 290 pF1KE1 ILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFKHSK-KGPRASG ::::::::.:. :: .:..: :.:: :.:::. :.:. .:::: .:..: . : .. CCDS81 ILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQLDENA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 NL-IPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVIGRERRPR :. . .:::.:.: :.:::::::::::::::::::: .:..:::::.:::::::: :::: CCDS81 NVQLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEELDTVIGRSRRPR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 LSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQWQVNHDP :::: .:::.:::::::::::::.:::::: CCDS81 LSDRSHLPYMEAFILETFRHSSFVPFTIPHR----------------------------- 360 370 380 420 430 440 450 460 470 pF1KE1 ELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLFLAILLQQ .:: .:::: :::::: :: ::.: ::::...::::::.::::..:.::.:::::::::. CCDS81 KLWVNPSEFLPERFLTPDG-AIDKVLSEKVIIFGMGKRKCIGETIARWEVFLFLAILLQR 390 400 410 420 430 440 480 490 500 510 pF1KE1 LEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN .::::: :::::.::::::::::: ::: : .:: CCDS81 VEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS 450 460 470 480 >>CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 (543 aa) initn: 1168 init1: 497 opt: 1224 Z-score: 1428.2 bits: 273.9 E(32554): 3.1e-73 Smith-Waterman score: 1224; 38.6% identity (69.9% similar) in 518 aa overlap (8-515:15-526) 10 20 30 40 50 pF1KE1 MALSQSVPFSA--TELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLL :.: : ::: ... : . :: : . ..:: :..:::. CCDS17 MGTSLSPNDPWPLNPLSIQQTTLLLLLSVLATVHVGQRLLRQRRRQLRSAPPGPFAWPLI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 GHVLTLGKNPHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDL :.. ..:. ::...:...:::::.:::.:: :..::. .:.::::.::. : :: . CCDS17 GNAAAVGQAAHLSFARLARRYGDVFQIRLGSCPIVVLNGERAIHQALVQQGSAFADRPAF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 YTSTLITDGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKA . ... :.:..:. : : ..:: :.. . .: .. .: : . :: :: .::. CCDS17 ASFRVVSGGRSMAFGHYS-EHWKVQRRAAHSMMRNF-FTRQPRSRQ--VLEGHVLSEARE 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 LISRLQELMAGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETAS :.. : . : . .:: .::.::::..:.::: .. ... :. :.....:: .:.. CCDS17 LVALLVRGSADGAFLDPRPLTVVAVANVMSAVCFGCRYSHDDPEFRELLSHNEEFGRTVG 180 190 200 210 220 230 240 250 260 270 280 pF1KE1 SGNPLDFFPILRYLPNPALQRFKAF---NQRFLWFLQKTVQEHYQDFDKNSV-RDITGAL .:. .: .: :.:.:::. :. : :. : :. .: ... ... ::. :. CCDS17 AGSLVDVMPWLQYFPNPVRTVFREFEQLNRNFSNFILDKFLRHCESLRPGAAPRDMMDAF 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 FKHSKK----GPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKI . ..: ...: . :.. ..:::::. ::..::..: :. .. :..: .. CCDS17 ILSAEKKAAGDSHGGGARLDLENVPATITDIFGASQDTLSTALQWLLLLFTRYPDVQTRV 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 QKELDTVIGRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPK : ::: :.::.: : ..:.:.:::. ::. :..: :::.: ::::.:: .:.. :..::: CCDS17 QAELDQVVGRDRLPCMGDQPNLPYVLAFLYEAMRFSSFVPVTIPHATTANTSVLGYHIPK 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE1 KCCVFVNQWQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVL ::::::.::::: : .: .: : ::: :: ::: :. ..:.:..:::::::: : CCDS17 DTVVFVNQWSVNHDPLKWPNPENFDPARFLDKDGL-INKDLTSRVMIFSVGKRRCIGEEL 420 430 440 450 460 470 470 480 490 500 510 pF1KE1 AKWEIFLFLAILLQQLEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN .: ..:::..:: .: .: . :. . .. ::::.: . .:.. :: :. CCDS17 SKMQLFLFISILAHQCDFRANPNEPAKMNFSYGLTIK-PKSFKVNVTLRESMELLDSAVQ 480 490 500 510 520 530 CCDS17 NLQAKETCQ 540 >>CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 (544 aa) initn: 767 init1: 407 opt: 882 Z-score: 1028.9 bits: 200.1 E(32554): 5.4e-51 Smith-Waterman score: 908; 31.2% identity (64.5% similar) in 513 aa overlap (15-499:37-532) 10 20 30 40 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPE :: .. :. : . :: : .:. :: CCDS34 SQPPAEDPPWPARLLRAPLGLLRLDPSGGALLLCGLVALLGW--SWLRRRRARGI--PPG 10 20 30 40 50 60 50 60 70 80 pF1KE1 PWGWPLLG---HVL----------------TLGKNP-----HLALSRMSQRYGDVLQIRI : :::.: ::: . : .: .. :..... ::..... : CCDS34 PTPWPLVGNFGHVLLPPFLRRRSWLSSRTRAAGIDPSVIGPQVLLAHLARVYGSIFSFFI 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE1 GSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLITDGQSLTFSTDSGPVWAARRRLA : :.::: . ..:.:::.:.. :. :: . ...: ....:. :::: .:... CCDS34 GHYLVVVLSDFHSVREALVQQAEVFSDRPRVPLISIVTKEKGVVFA-HYGPVWRQQRKFS 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE1 QNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQELMAGPGHFDPYNQVVVSVANVI ...: :... . :: .. .: : . ...:. : : :.. . .:.:.: CCDS34 HSTLRHFGLG-------KLSLEPKIIEEFKYVKAEMQK--HGEDPFCPFSIISNAVSNII 190 200 210 220 230 210 220 230 240 250 pF1KE1 GAMCFGQHFPESSDEMLSLVKNTHEFVETASSGNPL--DFFPILRYLPNPALQRFKAFNQ ..::::.: ...:. ... . .: ... : .. : : ::: ..... ... CCDS34 CSLCFGQRFDYTNSEFKKMLGFMSRGLEICLNSQVLLVNICPWLYYLPFGPFKELRQIEK 240 250 260 270 280 290 260 270 280 290 300 310 pF1KE1 RFLWFLQKTVQEHYQDFDKNSVRDITGALFKHSKKGPRASGNL-IPQEKIVNLVNDIFGA . ::.: ...: ...:... .:. . : .. . ..: . .: . ...:.: : CCDS34 DITSFLKKIIKDHQESLDRENPQDFIDMYLLHMEEERKNNSNSSFDEEYLFYIIGDLFIA 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE1 GFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVIGRERRPRLSDRPQLPYLEAFILETFR : ::.:... : :.:. .:..:.:...:.. ::: .: : :.:. :.:: :: :.:. : CCDS34 GTDTTTNSLLWCLLYMSLNPDVQEKVHEEIERVIGANRAPSLTDKAQMPYTEATIMEVQR 360 370 380 390 400 410 380 390 400 410 420 430 pF1KE1 HSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQWQVNHDPELWEDPSEFRPERFLTADG . .:..::: :...:.:.:. ::: .. : :.:..:: .:: : .: :.::: .: CCDS34 LTVVVPLAIPHMTSENTVLQGYTIPKGTLILPNLWSVHRDPAIWEKPEDFYPNRFLDDQG 420 430 440 450 460 470 440 450 460 470 480 490 pF1KE1 TAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLFLAILLQQLEFSVPPGVKVDL-TPIYG :.: : .. ::.::: :.:: ::: :.::... :.:.. :..: : : : .: CCDS34 QLIKK---ETFIPFGIGKRVCMGEQLAKMELFLMFVSLMQSFAFALPEDSKKPLLTGRFG 480 490 500 510 520 500 510 pF1KE1 LTMKHARCEHVQARLRFSIN ::. CCDS34 LTLAPHPFNITISRR 530 540 >>CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 (508 aa) initn: 759 init1: 402 opt: 849 Z-score: 990.9 bits: 192.9 E(32554): 7.2e-49 Smith-Waterman score: 849; 30.3% identity (66.4% similar) in 482 aa overlap (14-484:7-468) 10 20 30 40 50 60 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN ::: . . .:: . : : : : : . ::.: . : .. CCDS75 MWELVALLLLTLAY--LFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH 10 20 30 40 70 80 90 100 110 pF1KE1 PHL--ALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLIT :. . .....:: . ..:.:. ...... . ...:...: ::.:::.. : . . CCDS75 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE1 DGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQE .... .::: : .:::: . ::.. .: .. ::. . .: :: : . CCDS75 NNRKGIAFADSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLCD 110 120 130 140 150 180 190 200 210 220 230 pF1KE1 LMAGP-GH-FDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHE-FVETASSGNP ..: :. .: : :.:.:::. .::. . ...: :....: .: .... :. . CCDS75 MLATHNGQSIDISFPVFVAVTNVISLICFNTSY-KNGDPELNVIQNYNEGIIDNLSKDSL 160 170 180 190 200 210 240 250 260 270 280 pF1KE1 LDFFPILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFK------ .:. : :. .:: .:...:. . .:.: .... . : ..:. .. .:.. CCDS75 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSD 220 230 240 250 260 270 290 300 310 320 330 340 pF1KE1 HSKKGPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDT ... :: ...:. ...:.. ..:::::: .:.:....:.: .:. .:....:. .:.: CCDS75 NGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQ 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE1 VIGRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFV .: : : .::: .: ::: : :..: :. :::... :.... : . : :.. CCDS75 NVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVII 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE1 NQWQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIF : : ..:. . :..:..: :::::. :: . .: : ... :: : : ::::.::. :.: CCDS75 NLWALHHNEKEWHQPDQFMPERFLNPAGTQLISP-SVSYLPFGAGPRSCIGEILARQELF 400 410 420 430 440 450 470 480 490 500 510 pF1KE1 LFLAILLQQLEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN :..: :::.... :: CCDS75 LIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST 460 470 480 490 500 >>CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 (497 aa) initn: 604 init1: 358 opt: 831 Z-score: 970.0 bits: 189.0 E(32554): 1e-47 Smith-Waterman score: 831; 32.0% identity (65.9% similar) in 484 aa overlap (13-486:4-471) 10 20 30 40 50 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPK-GLKSPPEPWGWPLLGHVLTLG- : :. :.. .: .: : : . . . :: : : ::..: . CCDS46 MGLEALVPLAVIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDF 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 KNPHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLIT .: .... .:.:::...... :::.::. : ..:.::: .:.: :: . . .. CCDS46 QNTPYCFDQLRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 DG--QSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRL : .. .: . ::.: .::.. ..: ...... ::. :..:: : . . CCDS46 FGPRSQGVFLARYGPAWREQRRFSVSTLRNLGLGKKS-------LEQWVTEEAACLCAAF 120 130 140 150 160 180 190 200 210 220 230 pF1KE1 QELMAGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASS--GN . . : : : . . .:.:::... :..: .. ..: :. ..: .. :. . CCDS46 ANHSGRP--FRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLRE 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE1 PLDFFPILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSV-RDITGALF---KH :. :.: ..: : . .. :.. :: :.. . :: . .: . ::.: :.. .. CCDS46 VLNAVPVLLHIPALAGKVLR-FQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEK 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 SKKGPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTV .: .:..: : .:.. .: :.:.::. :..:...:.:. .. .:..::..:.:.: : CCDS46 AKGNPESSFN---DENLRIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDV 290 300 310 320 330 360 370 380 390 400 410 pF1KE1 IGRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVN ::. :::...:. ..:: : : :. : ....:. . : :.:: ..:: ::: ...: CCDS46 IGQVRRPEMGDQAHMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITN 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE1 QWQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFL .: .: .:: : .:.::.:: :.: . :: : .. :. :.: :.:: ::. :.:: CCDS46 LSSVLKDEAVWEKPFRFHPEHFLDAQGHFV-KP--EAFLPFSAGRRACLGEPLARMELFL 400 410 420 430 440 450 480 490 500 510 pF1KE1 FLAILLQQLEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN :.. :::.. :::: : CCDS46 FFTSLLQHFSFSVPTGQPRPSHHGVFAFLVSPSPYELCAVPR 460 470 480 490 >>CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 (501 aa) initn: 557 init1: 367 opt: 773 Z-score: 902.2 bits: 176.5 E(32554): 6.2e-44 Smith-Waterman score: 773; 28.3% identity (63.6% similar) in 494 aa overlap (16-500:14-490) 10 20 30 40 50 pF1KE1 MALSQSVPFSATELLLASAIFCLVFW--VLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLG :..:.: :.: : . :. : : :. :: : : :..:.. .:. CCDS78 MWKLWRAEEGAAALGGALFLLLFALGVRQLLKQRRPMGF--PPGPPGLPFIGNIYSLA 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 KN---PHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTST . ::. . ..:: ::..... .:. ..::. :.... ::.:.. : :: : CCDS78 ASSELPHVYMRKQSQVYGEIFSLDLGGISTVVLNGYDVVKECLVHQSEIFADRPCLPLFM 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 LITDGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISR .: .: ... : :. .:::: :.. :. .. .: .. .:.: . . CCDS78 KMTKMGGL-LNSRYGRGWVDHRRLAVNSFRYFGYGQKS-------FESKILEETKFFNDA 120 130 140 150 160 180 190 200 210 220 230 pF1KE1 LQELMAGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASSGNP .. . : :: . .. .:.:. . . ::..: . .. ... : :: :.:.. CCDS78 IETYKGRP--FDFKQLITNAVSNITNLIIFGERFTYEDTDFQHMIELFSENVELAASASV 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE1 LDF--FPILRYLP-NPALQRFKAFNQRFLW-FLQKTVQEHYQDFDKNSVRDITGALFKHS . . :: . :: . : :. : .. ::.. ... . . . .. : . . CCDS78 FLYNAFPWIGILPFGKHQQLFR--NAAVVYDFLSRLIEKASVNRKPQLPQHFVDAYLDEM 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 KKGPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVI .: .. . .:... :.... :: .:.:... :...... :.:: ..:::.: .. CCDS78 DQGKNDPSSTFSKENLIFSVGELIIAGTETTTNVLRWAILFMALYPNIQGQVQKEIDLIM 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE1 GRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQ : . .: .:. ..:: :: . :..: ...:. : :.:..:... :. ::: :..: CCDS78 GPNGKPSWDDKCKMPYTEAVLHEVLRFCNIVPLGIFHATSEDAVVRGYSIPKGTTVITNL 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE1 WQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLF ..:. : . :.:: :.::::: ..: .: : .. :..:.:.:.:: ::. :.::: CCDS78 YSVHFDEKYWRDPEVFHPERFLDSSGYFAKK---EALVPFSLGRRHCLGEHLARMEMFLF 410 420 430 440 450 460 480 490 500 510 pF1KE1 LAILLQQLEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN .. :::.... : . :: : :.:.. CCDS78 FTALLQRFHLHFPHELVPDLKPRLGMTLQPQPYLICAERR 470 480 490 500 >>CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 (504 aa) initn: 591 init1: 334 opt: 704 Z-score: 821.6 bits: 161.6 E(32554): 1.9e-39 Smith-Waterman score: 731; 31.4% identity (61.7% similar) in 493 aa overlap (14-497:9-481) 10 20 30 40 50 60 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN :::: :.. :. .:.: : : : . :: : ::::..: : . CCDS12 MEATGTWALLLALALLLLLTLALSGTRAR---G-HLPPGPTPLPLLGNLLQLRPG 10 20 30 40 50 70 80 90 100 110 pF1KE1 P-HLALSRMSQRYGDVLQIRIGS-TPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLIT . .: :.:..:: :. : .: ::.:: ...:.:: :...:.:: . CCDS12 ALYSGLMRLSKKYGPVFTIYLGPWRPVVVLVGQEAVREALGGQAEEFSGRGTVAMLEGTF 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 DGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQE ::... :: .: : :.... :: ..... . :: .. ::. :. .: CCDS12 DGHGVFFS--NGERWRQLRKFTMLALRDLGMGKREG-------EELIQAEARCLVETFQG 120 130 140 150 160 180 190 200 210 220 230 pF1KE1 LMAGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHEFVETASS--GNPL . : ::: .. ...::. .. :: .: . :. ..:. . . .:: :. CCDS12 TEGRP--FDPSLLLAQATSNVVCSLLFGLRFSYEDKEFQAVVRAAGGTLLGVSSQGGQTY 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE1 DFFP-ILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNS-VRDITGALFKHSKKG ..: .:: ::.: : .. . . : . ::.: ..: .. .::.. :.. . . CCDS12 EMFSWFLRPLPGPHKQLLHHVST-LAAFTVRQVQQHQGNLDASGPARDLVDAFLLKMAQE 230 240 250 260 270 300 310 320 330 340 350 pF1KE1 PRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDTVIGRE . :. . ..... : .. :: ::.:.....:. :. :..:. ...::. .: CCDS12 EQNPGTEFTNKNMLMTVIYLLFAGTMTVSTTVGYTLLLLMKYPHVQKWVREELNRELGAG 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE1 RRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFVNQWQV . : :.:: .::: .: . :. : ...:. ::.. : : . :. .:. :: .. CCDS12 QAPSLGDRTRLPYTDAVLHEAQRLLALVPMGIPRTLMRTTRFRGYTLPQGTEVFPLLGSI 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE1 NHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIFLFLAI :::.... : :: :.::: ::: . : : .. :..::: :.:: ::: :.:::.. CCDS12 LHDPNIFKHPEEFNPDRFLDADGR-FRK--HEAFLPFSLGKRVCLGEGLAKAELFLFFTT 400 410 420 430 440 450 480 490 500 510 pF1KE1 LLQ--QLEFSVPPGVKVDLTP-IYGLTMKHARCEHVQARLRFSIN .:: .:: :: . ..: : . :: CCDS12 ILQAFSLESPCPPDT-LSLKPTVSGLFNIPPAFQLQVRPTDLHSTTQTR 460 470 480 490 500 >>CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 (502 aa) initn: 710 init1: 350 opt: 694 Z-score: 810.0 bits: 159.4 E(32554): 8.5e-39 Smith-Waterman score: 842; 29.7% identity (65.3% similar) in 498 aa overlap (14-504:21-497) 10 20 30 40 50 pF1KE1 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGH :::... : :. :: ::. . :: :: :.::. CCDS61 MLAAMGSLAAALWAVVHPRTLLLGTVAFLLAADFLKRRRPK-----NYPPGPWRLPFLGN 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 VLTLG-KNPHLALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLY . . .. :: .. . ..::.......:. ..... : :..::... ..: .:: CCDS61 FFLVDFEQSHLEVQLFVKKYGNLFSLELGDISAVLITGLPLIKEALIHMDQNFGNRPVTP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 TSTLITDGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKAL : ..: .: :: .: .::.. .:: .:.... :::....::. : CCDS61 MREHIFKKNGLIMS--SGQAWKEQRRFTLTALRNFGLGKKS-------LEERIQEEAQHL 120 130 140 150 160 180 190 200 210 220 230 pF1KE1 ISRLQELMAGPGHFDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHE--FVETA ..: . : :::. .. .:.:.: .. ::..: ... . .:.: : ..:.. CCDS61 TEAIKEENGQP--FDPHFKINNAVSNIICSITFGERFEYQDSWFQQLLKLLDEVTYLEAS 170 180 190 200 210 220 240 250 260 270 280 pF1KE1 SSGNPLDFFP-ILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFK .. . . :: :...::.: :. . ... :... ...: .:.. .::. : .: CCDS61 KTCQLYNVFPWIMKFLPGPHQTLFSNW-KKLKLFVSHMIDKHRKDWNPAETRDFIDAYLK 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE1 HSKKGPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDT . .: . . .:... . :.: :: .:..:.. :.:.:.. ::::.:.: :.: CCDS61 EMSKHTGNPTSSFHEENLICSTLDLFFAGTETTSTTLRWALLYMALYPEIQEKVQAEIDR 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE1 VIGRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFV :::. ..: . : ..:: .: : :. : ....:...:. .: :::: :...:: ... CCDS61 VIGQGQQPSTAARESMPYTNAVIHEVQRMGNIIPLNVPREVTVDTTLAGYHLPKGTMILT 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE1 NQWQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIF : ...:: : :. : :..:: .: .. : .: :..::: :.:: ::. :.: CCDS61 NLTALHRDPTEWATPDTFNPDHFLE-NGQFKKR---EAFMPFSIGKRACLGEQLARTELF 410 420 430 440 450 470 480 490 500 510 pF1KE1 LFLAILLQQLEFSVPPGVKVDLTPIYGLTMK---HARCEHVQARLRFSIN .:.. :.:.. : : . :..: .:.:.. : : CCDS61 IFFTSLMQKFTFRPPNNEKLSLKFRMGITISPVSHRLCAVPQV 460 470 480 490 500 516 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:01:54 2016 done: Mon Nov 7 19:01:55 2016 Total Scan time: 3.320 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]