FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2686, 508 aa
1>>>pF1KE2686 508 - 508 aa - 508 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0222+/-0.00109; mu= 13.8719+/- 0.065
mean_var=71.1813+/-14.220, 0's: 0 Z-trim(103.4): 78 B-trim: 0 in 0/50
Lambda= 0.152017
statistics sampled from 7324 (7402) to 7324 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.604), E-opt: 0.2 (0.227), width: 16
Scan time: 3.110
The best scores are: opt bits E(32554)
CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 3377 750.3 1.2e-216
CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 910 209.3 8.6e-54
CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 852 196.5 5.7e-50
CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 849 195.9 9.3e-50
CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 800 185.1 1.7e-46
CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 774 179.4 8.1e-45
CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 772 179.0 1.2e-44
CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 737 171.3 2.2e-42
CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 733 170.4 4.1e-42
CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 732 170.2 4.7e-42
CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 729 169.6 7.4e-42
CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 725 168.7 1.4e-41
CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 722 168.0 2e-41
CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 716 166.7 5.3e-41
CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 708 164.9 1.8e-40
CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 707 164.7 2.1e-40
CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 704 164.1 3.3e-40
CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 703 163.8 3.9e-40
CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 698 162.8 8.2e-40
CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 687 160.3 4.4e-39
CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 659 154.2 3.2e-37
CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 628 147.4 3.4e-35
CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 622 146.1 7.4e-35
CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 573 135.3 1.2e-31
CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 499 119.1 1e-26
CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 482 115.4 1.5e-25
CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 464 111.4 2.4e-24
CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 464 111.4 2.5e-24
CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 460 110.6 4.3e-24
CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 452 108.8 1.3e-23
CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 429 103.8 4.8e-22
CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 426 103.1 7.9e-22
CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 421 102.0 1.6e-21
CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 418 101.3 2.5e-21
CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 396 96.5 7.7e-20
CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 371 91.0 3.3e-18
CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 368 90.4 5.2e-18
CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 354 87.3 4.3e-17
CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 354 87.3 4.5e-17
CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 348 86.0 8.2e-17
CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 346 85.5 1.2e-16
CCDS59362.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 344 85.1 2e-16
CCDS12332.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 343 84.9 2.4e-16
CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 343 84.9 2.4e-16
CCDS74303.1 CYP4F8 gene_id:11283|Hs108|chr19 ( 520) 341 84.5 3.2e-16
CCDS5677.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 420) 322 80.3 4.8e-15
CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 320 79.9 7.5e-15
CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 320 79.9 7.7e-15
CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 ( 531) 320 79.9 8e-15
CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 319 79.6 9e-15
>>CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 (508 aa)
initn: 3377 init1: 3377 opt: 3377 Z-score: 4003.3 bits: 750.3 E(32554): 1.2e-216
Smith-Waterman score: 3377; 100.0% identity (100.0% similar) in 508 aa overlap (1-508:1-508)
10 20 30 40 50 60
pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQKKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQKKY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 GPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 GPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 WQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNVIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 WQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNVIS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 LICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLKIFPNKTLEKLKSHVKIRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 LICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLKIFPNKTLEKLKSHVKIRN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 DLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 DLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 GAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 GAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 LRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 LRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 AGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS75 AGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIP
430 440 450 460 470 480
490 500
pF1KE2 KVVFLIDSFKVKIKVRQAWREAQAEGST
::::::::::::::::::::::::::::
CCDS75 KVVFLIDSFKVKIKVRQAWREAQAEGST
490 500
>>CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 (512 aa)
initn: 825 init1: 555 opt: 910 Z-score: 1079.2 bits: 209.3 E(32554): 8.6e-54
Smith-Waterman score: 910; 33.1% identity (66.9% similar) in 487 aa overlap (4-468:13-483)
10 20 30 40
pF1KE2 MWELVALLLLTLAYLFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH
:.: ... : .:: : . : : : : . . ::.: . : ..
CCDS10 MLFPISMSATEFLLASVIFCL--VFWVIRASRPQVPKGLKNPPGPWGWPLIGHMLTLGKN
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS
:. . .....:: . ..:.:. .:... . ...:...: ::.:::.. :. . :
CCDS10 PHL--ALSRMSQQYGDVLQIRIGSTPVVVLSGLDTIRQALVRQGDDFKGRPDLYTFTLIS
60 70 80 90 100 110
110 120 130 140 150
pF1KE2 NNRKGIAFA-DSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLC
:. ....:. ::: : .:::: . .:.. .: .. ::. . .: ::::
CCDS10 NG-QSMSFSPDSGPVWAARRRLAQNGLKSFSIASDPASSTSCYLEEHVSKEAEVLISTLQ
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE2 DMLATHNGQSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSL
...: :. . : :.::::: :::. : .. :: . : :... . ... .
CCDS10 ELMAGP-GHFNPYRY-VVVSVTNVICAICFGRRYDHNHQELLSLVNLNNNFGEVVGSGNP
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE2 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLM---QAKM
.:..: :. .:: .:. .:. . ....:..... . :.. : .. :.:. : :.
CCDS10 ADFIPILRYLPNPSLNAFKDLNEKFYSFMQKMVKEHYKTFEKGHIRDITDSLIEHCQEKQ
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE2 NSDNGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEE
..:.:. :::..:.. . :.:::: .:.:....:.: .:. ::.:..:. ::
CCDS10 LDENANV-------QLSDEKIINIVLDLFGAGFDTVTTAISWSLMYLVMNPRVQRKIQEE
300 310 320 330 340
340 350 360 370 380 390
pF1KE2 IDQNVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTE
.: .: :: : .:::..: .:: : :..: .:. :::... :.:. : . ::
CCDS10 LDTVIGRSRRPRLSDRSHLPYMEAFILETFRHSSFVPFTIPHSTTRDTSLKGFYIPKGRC
350 360 370 380 390 400
400 410 420 430 440
pF1KE2 VIINLWALHHNEKEWHQPDQFMPERFLNPAGT--QLISPSVSYLPFGAGPRSCIGEILAR
:..: : ..:..: : .:..:.:::::.: :. ...: .: . :: : :.:::: .::
CCDS10 VFVNQWQINHDQKLWVNPSEFLPERFLTPDGAIDKVLSEKV--IIFGMGKRKCIGETIAR
410 420 430 440 450 460
450 460 470 480 490 500
pF1KE2 QELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST
:.::..: :::: .. ::
CCDS10 WEVFLFLAILLQRVEFSVPLGVKVDMTPIYGLTMKHACCEHFQMQLRS
470 480 490 500 510
>>CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 (495 aa)
initn: 704 init1: 257 opt: 852 Z-score: 1010.7 bits: 196.5 E(32554): 5.7e-50
Smith-Waterman score: 860; 31.6% identity (63.7% similar) in 507 aa overlap (4-496:7-484)
10 20 30 40 50
pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLV-GSLPFLPRHGHMHNNFFKL
:. : ::. : :.: . . . : ::. : : .: . . .. :
CCDS47 MLLLGLLLLLPLLAGARLLWNWWKLRSLHLP------PLAPGFLHLL--QPDLPIYLLGL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 QKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFAD
.:.:::: ...: . .:... .. .:...:: ::.:::. : ..: : ....:
CCDS47 TQKFGPIYRLHLGLQDVVVLNSKRTIEEAMVKKWADFAGRPEPLTYKLVSRNYPDLSLGD
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 SGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVT
. :. :..:. . ::. ...: .. : . .:. . .. : . : . .
CCDS47 YSLLWKAHKKLTRS--ALLLGIRDSMEPVVEQLTQEFCERMRAQPGTPVAIEEEFSLLTC
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 NVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDS-----LVDLVPWLKIFPNKTLEK
..: . :. . :. :.. : . : . :. : .::..:.:..::: :..
CCDS47 SIICYLTFGDKIKDD----NLMPAYYKCIQEVLKTWSHWSIQIVDVIPFLRFFPNPGLRR
180 190 200 210 220
240 250 260 270 280
pF1KE2 LKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGP--DQDSELLSD
::. .. :. ... :...::.. . . .:.: ..: : : : .. : : .
CCDS47 LKQAIEKRDHIVEMQLRQHKESLVAGQWRDMMDYMLQ-------GVAQPSMEEGSGQLLE
230 240 250 260 270
290 300 310 320 330 340
pF1KE2 NHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVG----FSRTPTIS
.:. . :.. .:.:::.....:...::::.:.....: ::.:...: ::.: .
CCDS47 GHVHMAAVDLLIGGTETTANTLSWAVVFLLHHPEIQQRLQEELDHELGPGASSSRVP-YK
280 290 300 310 320 330
350 360 370 380 390 400
pF1KE2 DRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKE
:: :: ::.::: ::::::::.:. .::... :::. . . .:: .: :: . : .:
CCDS47 DRARLPLLNATIAEVLRLRPVVPLALPHRTTRPSSISGYDIPEGTVIIPNLQGAHLDETV
340 350 360 370 380 390
410 420 430 440 450 460
pF1KE2 WHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDL
:..: .: :.:::.: . . : :: : : :.:: ::: :::.... ::: : :
CCDS47 WERPHEFWPDRFLEP------GKNSRALAFGCGARVCLGEPLARLELFVVLTRLLQAFTL
400 410 420 430 440 450
470 480 490 500
pF1KE2 EVPDDGQLPSLEGIPK--VVFLIDSFKVKIKVRQAWREAQAEGST
.:. ::::. .:. :.. .. :.:... :
CCDS47 -LPSGDALPSLQPLPHCSVILKMQPFQVRLQPRGMGAHSPGQSQ
460 470 480 490
>>CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 (516 aa)
initn: 759 init1: 402 opt: 849 Z-score: 1006.8 bits: 195.9 E(32554): 9.3e-50
Smith-Waterman score: 849; 30.3% identity (66.4% similar) in 482 aa overlap (7-468:14-484)
10 20 30 40
pF1KE2 MWELVALLLLTLAY--LFWPKR----RCP-GAKYPKSLLSLPLVGSLPFLPRH
::: . . .:: . : : : : : . ::.: . : ..
CCDS32 MALSQSVPFSATELLLASAIFCLVFWVLKGLRPRVPKGLKSPPEPWGWPLLGHVLTLGKN
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE2 GHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS
:. . .....:: . ..:.:. ...... . ...:...: ::.:::.. : . .
CCDS32 PHL--ALSRMSQRYGDVLQIRIGSTPVLVLSRLDTIRQALVRQGDDFKGRPDLYTSTLIT
70 80 90 100 110
110 120 130 140 150
pF1KE2 NNRKGIAFADSGAHWQLHRRLA---MATFALFKDGDQK----LEKIICQE----ISTLCD
.... .::: : .:::: . ::.. .: .. ::. . .: :: : .
CCDS32 DGQSLTFSTDSGPVWAARRRLAQNALNTFSIASDPASSSSCYLEEHVSKEAKALISRLQE
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE2 MLATHNGQSIDISFPVFVAVTNVISLICFNTSY-KNGDPELNVIQNYNEGIIDNLSKDSL
..: :. .: : :.:.:::. .::. . ...: :....: .: .... :. .
CCDS32 LMAGP-GH-FDPYNQVVVSVANVIGAMCFGQHFPESSDEMLSLVKNTHE-FVETASSGNP
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE2 VDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSD
.:. : :. .:: .:...:. . .:.: .... . : ..:. .. .:..
CCDS32 LDFFPILRYLPNPALQRFKAFNQRFLWFLQKTVQEHYQDFDKNSVRDITGALFK------
240 250 260 270 280
280 290 300 310 320 330
pF1KE2 NGNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQ
... :: ...:. ...:.. ..:::::: .:.:....:.: .:. .:....:. .:.:
CCDS32 HSKKGPRASGNLIPQEKIVNLVNDIFGAGFDTVTTAISWSLMYLVTKPEIQRKIQKELDT
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE2 NVGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVII
.: : : .::: .: ::: : :..: :. :::... :.... : . : :..
CCDS32 VIGRERRPRLSDRPQLPYLEAFILETFRHSSFLPFTIPHSTTRDTTLNGFYIPKKCCVFV
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE2 NLWALHHNEKEWHQPDQFMPERFLNPAGTQLISP-SVSYLPFGAGPRSCIGEILARQELF
: : ..:. . :..:..: :::::. :: . .: : ... :: : : ::::.::. :.:
CCDS32 NQWQVNHDPELWEDPSEFRPERFLTADGTAINKPLSEKMMLFGMGKRRCIGEVLAKWEIF
410 420 430 440 450 460
460 470 480 490 500
pF1KE2 LIMAWLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST
:..: :::.... ::
CCDS32 LFLAILLQQLEFSVPPGVKVDLTPIYGLTMKHARCEHVQARLRFSIN
470 480 490 500 510
>>CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 (544 aa)
initn: 775 init1: 372 opt: 800 Z-score: 948.4 bits: 185.1 E(32554): 1.7e-46
Smith-Waterman score: 809; 29.9% identity (62.8% similar) in 522 aa overlap (6-496:36-544)
10 20 30
pF1KE2 MWELVALLLLTL-AYLFWP---KRRCPGAKYPKSL
:::: : : : : .:: : : .
CCDS34 PSQPPAEDPPWPARLLRAPLGLLRLDPSGGALLLCGLVALLGWSWLRRRRARGI--PPGP
10 20 30 40 50 60
40 50 60
pF1KE2 LSLPLVGSL------PFLPRHGHMHNN----------------FFKLQKKYGPIYSVRMG
::::.. ::: :.. . . . .: . :: :.: .:
CCDS34 TPWPLVGNFGHVLLPPFLRRRSWLSSRTRAAGIDPSVIGPQVLLAHLARVYGSIFSFFIG
70 80 90 100 110 120
70 80 90 100 110 120
pF1KE2 TKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSGAHWQLHRRLAM
.:... . ..:.:..... :: ::.. ..:.... ::..:: : :. .:...
CCDS34 HYLVVVLSDFHSVREALVQQAEVFSDRPRVPLISIVTKE-KGVVFAHYGPVWRQQRKFSH
130 140 150 160 170 180
130 140 150 160 170 180
pF1KE2 ATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFV-AVTNVISLICFNTSY
.:. : : .:: : .:.. . . : :.. : .. ::.:.: .::. .
CCDS34 STLRHFGLGKLSLEPKIIEEFKYVKAEMQKH-GEDPFCPFSIISNAVSNIICSLCFGQRF
190 200 210 220 230 240
190 200 210 220 230 240
pF1KE2 KNGDPELNVIQNY-NEGIIDNL-SKDSLVDLVPWLKIFPNKTLEKLKSHVKIRNDLLNKI
. :.. . .. ..:. : :. ::.. ::: .: ...:.. : ...:.::
CCDS34 DYTNSEFKKMLGFMSRGLEICLNSQVLLVNICPWLYYLPFGPFKELRQIEKDITSFLKKI
250 260 270 280 290 300
250 260 270 280 290 300
pF1KE2 LENYKEKFRSDSITNMLDT--LMQAKMNSDNGNAGPDQDSELLSDNHILTTIGDIFGAGV
.....:.. .. ...: : . . ..:.:.. :.. ... :::.: ::.
CCDS34 IKDHQESLDRENPQDFIDMYLLHMEEERKNNSNSSFDEE-------YLFYIIGDLFIAGT
310 320 330 340 350
310 320 330 340 350 360
pF1KE2 ETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRLLLLEATIREVLRLR
.:::. . : : .. ::.:..:..:::.. .: .:.:...:. .. :::: :: ::
CCDS34 DTTTNSLLWCLLYMSLNPDVQEKVHEEIERVIGANRAPSLTDKAQMPYTEATIMEVQRLT
360 370 380 390 400 410
370 380 390 400 410 420
pF1KE2 PVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPDQFMPERFLNPAGTQ
:.:. ::: .. .. . ... ::: .. :::..:.. :..:..:.:.:::. : :
CCDS34 VVVPLAIPHMTSENTVLQGYTIPKGTLILPNLWSVHRDPAIWEKPEDFYPNRFLDDQG-Q
420 430 440 450 460 470
430 440 450 460 470 480
pF1KE2 LISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDDGQLPSLEGIPKVVF
::. ...::: : : :.:: ::..::::... :.: : . .:.:.. : : : ...
CCDS34 LIKKE-TFIPFGIGKRVCMGEQLAKMELFLMFVSLMQSFAFALPEDSKKPLLTGRFGLTL
480 490 500 510 520 530
490 500
pF1KE2 LIDSFKVKIKVRQAWREAQAEGST
:.. :. :
CCDS34 APHPFNITISRR
540
>>CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 (501 aa)
initn: 678 init1: 359 opt: 774 Z-score: 918.1 bits: 179.4 E(32554): 8.1e-45
Smith-Waterman score: 774; 28.7% identity (65.6% similar) in 474 aa overlap (7-477:20-482)
10 20 30 40
pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHG
:::..:. :.: : . .: . .::..:.. : .
CCDS78 MWKLWRAEEGAAALGGALFLLLFALGVRQLLKQRRPMG-FPPGPPGLPFIGNIYSLAASS
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 HMHNNFFKLQKK-YGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIAS
.. . ... :.. :: :.:. .: .::... ....:: :..... :. :: . . .
CCDS78 ELPHVYMRKQSQVYGEIFSLDLGGISTVVLNGYDVVKECLVHQSEIFADRPCLPLF-MKM
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 NNRKGIAFADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSID
.. :. . : : :::::. .: : :....:. : .: . . : . :..:. .:
CCDS78 TKMGGLLNSRYGRGWVDHRRLAVNSFRYFGYGQKSFESKILEETKFFNDAIETYKGRPFD
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 ISFPVFVAVTNVISLICFNTSYKNGDPEL-NVIQNYNEGIIDNLSKDS-LVDLVPWLKIF
.. . ::.:. .:: :. . : .. ..:. ..:.. : . : . ::. :.
CCDS78 FKQLITNAVSNITNLIIFGERFTYEDTDFQHMIELFSENVELAASASVFLYNAFPWIGIL
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE2 PNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDS
: ..: .. . :.:....:. . . . . ...:. . :. . : .. :
CCDS78 PFGKHQQLFRNAAVVYDFLSRLIEKASVNRKPQLPQHFVDAYL------DEMDQGKNDPS
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE2 ELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTI
.: .... ..:... ::.::::.:..:.. :. :... .. .::: .: . :.
CCDS78 STFSKENLIFSVGELIIAGTETTTNVLRWAILFMALYPNIQGQVQKEIDLIMGPNGKPSW
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE2 SDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEK
.:. .. ::...::::. ..:. : : .. :. . ... ::: :: ::...: .::
CCDS78 DDKCKMPYTEAVLHEVLRFCNIVPLGIFHATSEDAVVRGYSIPKGTTVITNLYSVHFDEK
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE2 EWHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFD
:..:. : :::::. .: .. . . .::. : : :.:: :::.:.::... :::::
CCDS78 YWRDPEVFHPERFLDSSG--YFAKKEALVPFSLGRRHCLGEHLARMEMFLFFTALLQRFH
420 430 440 450 460 470
470 480 490 500
pF1KE2 LEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST
:. : . .:.:.
CCDS78 LHFPHE-LVPDLKPRLGMTLQPQPYLICAERR
480 490 500
>>CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 (543 aa)
initn: 598 init1: 386 opt: 772 Z-score: 915.2 bits: 179.0 E(32554): 1.2e-44
Smith-Waterman score: 772; 28.2% identity (63.6% similar) in 500 aa overlap (19-498:42-525)
10 20 30 40
pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGH
.:: . : . .. ::.:. . . .:
CCDS17 PLNPLSIQQTTLLLLLSVLATVHVGQRLLRQRRRQLRSAPPGPFAWPLIGNAAAVGQAAH
20 30 40 50 60 70
50 60 70 80 90 100
pF1KE2 MHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNN
. .: .: ..:: ....:.:. :... .. ...:...:. :. :: .:.. ..:..
CCDS17 L--SFARLARRYGDVFQIRLGSCPIVVLNGERAIHQALVQQGSAFADRPAFASFRVVSGG
80 90 100 110 120
110 120 130 140 150 160
pF1KE2 RKGIAFADSGAHWQLHRRLAMATFALF----KDGDQKLEKIICQEISTLCDMLA--THNG
:. .::. . ::...:: : . . : . : :: . .: : .:. . .:
CCDS17 RS-MAFGHYSEHWKVQRRAAHSMMRNFFTRQPRSRQVLEGHVLSEARELVALLVRGSADG
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE2 QSIDISFPVFVAVTNVISLICFNTSYKNGDPELNVIQNYNEGIIDNLSKDSLVDLVPWLK
.: . :::.::.: .::. :.. :::. . ..:: . ... ::::..:::.
CCDS17 AFLDPRPLTVVAVANVMSAVCFGCRYSHDDPEFRELLSHNEEFGRTVGAGSLVDVMPWLQ
190 200 210 220 230 240
230 240 250 260 270
pF1KE2 IFPNKTLEKLKSHVKIRNDLLNKILENYK---EKFRSDSIT-NMLDTLM---QAKMNSDN
::: . .. .. .. : ::... :..: . .:.:... . : .:.
CCDS17 YFPNPVRTVFREFEQLNRNFSNFILDKFLRHCESLRPGAAPRDMMDAFILSAEKKAAGDS
250 260 270 280 290 300
280 290 300 310 320 330
pF1KE2 GNAGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQN
..: : : .. .:: :::::. .: .....: : .. . :.:. .. :.::
CCDS17 HGGGARLDLE-----NVPATITDIFGASQDTLSTALQWLLLLFTRYPDVQTRVQAELDQV
310 320 330 340 350 360
340 350 360 370 380 390
pF1KE2 VGFSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIIN
:: .: : ..:. : . : . :..:. .:. ::: .....:. . . : : :..:
CCDS17 VGRDRLPCMGDQPNLPYVLAFLYEAMRFSSFVPVTIPHATTANTSVLGYHIPKDTVVFVN
370 380 390 400 410 420
400 410 420 430 440 450
pF1KE2 LWALHHNEKEWHQPDQFMPERFLNPAGTQLISPSVS--YLPFGAGPRSCIGEILARQELF
:...:. .: .:..: : :::. : ::. ... . :..: : :::: :....::
CCDS17 QWSVNHDPLKWPNPENFDPARFLDKDG--LINKDLTSRVMIFSVGKRRCIGEELSKMQLF
430 440 450 460 470 480
460 470 480 490 500
pF1KE2 LIMAWLLQRFDLEV-PDD-GQLPSLEGI---PKVVFLIDSFKVKIKVRQAWREAQAEGST
:... : .. :... :.. ... :. :: ::::.. .:..
CCDS17 LFISILAHQCDFRANPNEPAKMNFSYGLTIKPK------SFKVNVTLRESMELLDSAVQN
490 500 510 520 530
CCDS17 LQAKETCQ
540
>>CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 (502 aa)
initn: 650 init1: 317 opt: 737 Z-score: 874.3 bits: 171.3 E(32554): 2.2e-42
Smith-Waterman score: 738; 28.9% identity (65.8% similar) in 485 aa overlap (1-473:12-479)
10 20 30 40
pF1KE2 MWELV---ALLLLTLAYLF---WPKRRCPGAKYPKSLLSLPLVGSLPFL
.: .: .::: :.:.:. . ::: : .:: . ::..:.. ..
CCDS61 MLAAMGSLAAALWAVVHPRTLLLGTVAFLLAADFLKRRRP-KNYPPGPWRLPFLGNFFLV
10 20 30 40 50
50 60 70 80 90 100
pF1KE2 P-RHGHMHNNFFKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATL
...:.. ..: :::: ..:...: ..:.. : ::.::. ..:..:: .. .
CCDS61 DFEQSHLEVQLFV--KKYGNLFSLELGDISAVLITGLPLIKEALIHMDQNFGNRP-VTPM
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 DIASNNRKGIAFADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNG
...:. .. :: :. .::...... : : ..::. : .: . : . . .::
CCDS61 REHIFKKNGLIMS-SGQAWKEQRRFTLTALRNFGLGKKSLEERIQEEAQHLTEAIKEENG
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 QSIDISFPVFVAVTNVISLICFNTSYKNGDPELN-VIQNYNEGIIDNLSKD-SLVDLVPW
: .: : . ::.:.: : :. .. : .. ... .: . :: .: .. ::
CCDS61 QPFDPHFKINNAVSNIICSITFGERFEYQDSWFQQLLKLLDEVTYLEASKTCQLYNVFPW
180 190 200 210 220 230
230 240 250 260 270
pF1KE2 LKIF---PNKTLEKLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGN
. : :..:: . ...:. ........... . ...:. .. .:.. .::
CCDS61 IMKFLPGPHQTLFSNWKKLKL---FVSHMIDKHRKDWNPAETRDFIDAYLK-EMSKHTGN
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE2 AGPDQDSELLSDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVG
: : . .: : .:. :.: ::.:::.....:.: .. :....:. :::. .:
CCDS61 --PT--SSFHEENLICSTL-DLFFAGTETTSTTLRWALLYMALYPEIQEKVQAEIDRVIG
300 310 320 330 340
340 350 360 370 380 390
pF1KE2 FSRTPTISDRNRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLW
.. :. . :. . .:.:.:: :. . :. .:....::.... . . ::: .. ::
CCDS61 QGQQPSTAARESMPYTNAVIHEVQRMGNIIPLNVPREVTVDTTLAGYHLPKGTMILTNLT
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE2 ALHHNEKEWHQPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMA
:::.. :: :: : :..::. : .. ...::. : :.:.:: ::: :::....
CCDS61 ALHRDPTEWATPDTFNPDHFLE-NGQ--FKKREAFMPFSIGKRACLGEQLARTELFIFFT
410 420 430 440 450 460
460 470 480 490 500
pF1KE2 WLLQRFDLEVPDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST
:.:.: .. :.. .:
CCDS61 SLMQKFTFRPPNNEKLSLKFRMGITISPVSHRLCAVPQV
470 480 490 500
>>CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 (494 aa)
initn: 605 init1: 281 opt: 733 Z-score: 869.6 bits: 170.4 E(32554): 4.1e-42
Smith-Waterman score: 733; 29.5% identity (65.8% similar) in 468 aa overlap (4-468:11-465)
10 20 30 40 50
pF1KE2 MWELVALLLLTLAYLFWPKRRCPGAKYPKSLLSLPLVGSLPFLPRHGHMHNNF
:.: : . . . : .:. : : : . ::..:. : . .:.:..
CCDS12 MLASGLLLVTLLACLTVMVLMSVWRQRKSRG-KLPPGPTPLPFIGNYLQLNTE-QMYNSL
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 FKLQKKYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIA
.:....:::......: . .:.. :. .::.:. ....:::: ..::.: .. :.:
CCDS12 MKISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKGY-GVA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 FADSGAHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFV
:... :: ::...::. : : . .:. : .: . : : : .: .:: .: .
CCDS12 FSNGERAKQL-RRFSIATLRGFGVGKRGIEERIQEEAGFLIDALRGTHGANIDPTFFLSR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 AVTNVISLICFNTSYKNGDPELNVIQNYNEGIID--NLSKDSLVDLVP-WLKIFPNKTLE
.:.:::: : :. . : :. . . : .. : .: .. .: .:. .
CCDS12 TVSNVISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEMFSSVMKHLPGPQQQ
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE2 KLKSHVKIRNDLLNKILENYKEKFRSDSITNMLDTLMQAKMNSDNGNAGPDQDSELLSDN
.: ... .:.. : .:. .. . .: ...:... .:. .. : : ..:. :
CCDS12 AFK-ELQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFL-IRMQEEEKN--P--NTEFYLKN
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE2 HILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDRNRL
..::. ..: ::.::....... . .:...:.:. :..::::. .: .: : . :: ..
CCDS12 LVMTTL-NLFFAGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKM
300 310 320 330 340
360 370 380 390 400 410
pF1KE2 LLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWHQPD
::.:.:. :. . :: . :..: :... .: . :::::. : .. .. . . .:
CCDS12 PYTEAVIHEIQRFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVLRDPRFFSNPR
350 360 370 380 390 400
420 430 440 450 460 470
pF1KE2 QFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEVPDD
.: :..::. : .. : ...::. : : :.:: :::.::::... ..: : .. :
CCDS12 DFNPQHFLDKKGQ--FKKSDAFVPFSIGKRYCFGEGLARMELFLFFTTIMQNFRFKSPQS
410 420 430 440 450 460
480 490 500
pF1KE2 GQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST
CCDS12 PKDIDVSPKHVGFATIPRNYTMSFLPR
470 480 490
>>CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 (490 aa)
initn: 552 init1: 321 opt: 732 Z-score: 868.5 bits: 170.2 E(32554): 4.7e-42
Smith-Waterman score: 732; 31.5% identity (63.9% similar) in 479 aa overlap (5-470:5-463)
10 20 30 40 50
pF1KE2 MWELVALLL-LTLAYLFWPKRRCPG-AKYPKSLLSLPLVGSLPFLPRHGHMHNNFFKLQK
:::.: :. .:. :. : .. :.. ::..:.. : . : ... ...:
CCDS74 MDPAVALVLCLSCLFLLSLWRQSSGRGRLPSGPTPLPIIGNILQLDVKD-MSKSLTNFSK
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 KYGPIYSVRMGTKTTVIVGHHQLAKEVLIKKGKDFSGRPQMATLDIASNNRKGIAFADSG
:::...: .: : :.. .. .::.:: .:..:::: .. . . . :. :: :.. :
CCDS74 VYGPVFTVYFGLKPIVVLHGYEAVKEALIDHGEEFSGRGSFPVAEKV-NKGLGILFSN-G
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 AHWQLHRRLAMATFALFKDGDQKLEKIICQEISTLCDMLATHNGQSIDISFPVFVAVTNV
.:. ::. . :. : : ...: . .: : . : :.. : .: . : ::
CCDS74 KRWKEIRRFCLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTNASPCDPTFILGCAPCNV
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 ISLICFNTSYKNGDPE-LNVIQNYNEGIIDNLSKDSLVDLVPWLKI---FPNKTLEKLK-
: . :. . : . ::.....:: :: : ::... :: .. :
CCDS74 ICSVIFHDRFDYKDQRFLNLMEKFNE----NLRILS----SPWIQVCNNFPA-LIDYLPG
180 190 200 210 220
240 250 260 270 280
pF1KE2 SHVKIRNDLL---NKILENYKEKFRS---DSITNMLDTLMQAKMNSDNGNAGPDQDSELL
:: :: ... . .:: ::. .: .: ...: .. ::.... : :.::.
CCDS74 SHNKIAENFAYIKSYVLERIKEHQESLDMNSARDFIDCFL-IKMEQEKHN----QQSEFT
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE2 SDNHILTTIGDIFGAGVETTTSVVKWTLAFLLHNPQVKKKLYEEIDQNVGFSRTPTISDR
.. ...:. :.::::.:::...... : .::. :.: :. :::. :: .:.: ..::
CCDS74 VES-LIATVTDMFGAGTETTSTTLRYGLLLLLKYPEVTAKVQEEIECVVGRNRSPCMQDR
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE2 NRLLLLEATIREVLRLRPVAPMLIPHKANVDSSIGEFAVDKGTEVIINLWALHHNEKEWH
... .:...:. : . : .:: .. : .. .. . ::: .: .: .. ::.::.
CCDS74 SHMPYTDAVVHEIQRYIDLLPTNLPHAVTCDVKFKNYLIPKGTTIITSLTSVLHNDKEFP
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE2 QPDQFMPERFLNPAGTQLISPSVSYLPFGAGPRSCIGEILARQELFLIMAWLLQRFDLEV
.:..: : .::. .:. .. : ..::.:: : :.:: :::.::::... .:: :.:.
CCDS74 NPEMFDPGHFLDKSGN--FKKSDYFMPFSAGKRMCMGEGLARMELFLFLTTILQNFNLKS
410 420 430 440 450 460
470 480 490 500
pF1KE2 PDDGQLPSLEGIPKVVFLIDSFKVKIKVRQAWREAQAEGST
:
CCDS74 QVDPKDIDITPIANAFGRVPPLYQLCFIPV
470 480 490
508 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu May 11 11:22:02 2017 done: Thu May 11 11:22:02 2017
Total Scan time: 3.110 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]