FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1549, 509 aa 1>>>pF1KE1549 509 - 509 aa - 509 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4478+/-0.00095; mu= 17.2683+/- 0.057 mean_var=68.3125+/-14.057, 0's: 0 Z-trim(105.7): 80 B-trim: 211 in 1/49 Lambda= 0.155176 statistics sampled from 8511 (8591) to 8511 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.638), E-opt: 0.2 (0.264), width: 16 Scan time: 3.160 The best scores are: opt bits E(32554) CCDS5623.1 CYP51A1 gene_id:1595|Hs108|chr7 ( 509) 3392 768.6 0 CCDS55123.1 CYP51A1 gene_id:1595|Hs108|chr7 ( 404) 2717 617.5 8.8e-177 CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 ( 469) 433 106.2 8.4e-23 CCDS1919.1 CYP26B1 gene_id:56603|Hs108|chr2 ( 512) 386 95.7 1.3e-19 CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 ( 531) 385 95.5 1.6e-19 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 352 88.1 2.7e-17 CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 345 86.5 7.7e-17 CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 344 86.3 8.8e-17 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 343 86.1 1e-16 CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 341 85.6 1.5e-16 CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 340 85.4 1.6e-16 CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 340 85.4 1.7e-16 CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 340 85.4 1.7e-16 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 337 84.7 2.6e-16 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 337 84.7 2.8e-16 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 330 83.1 6.3e-16 CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 331 83.4 6.9e-16 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 330 83.1 7.8e-16 CCDS7427.1 CYP26A1 gene_id:1592|Hs108|chr10 ( 428) 329 82.9 7.9e-16 CCDS7426.1 CYP26A1 gene_id:1592|Hs108|chr10 ( 497) 329 82.9 9e-16 CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 328 82.7 1.1e-15 CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 327 82.5 1.2e-15 CCDS74303.1 CYP4F8 gene_id:11283|Hs108|chr19 ( 520) 324 81.8 2e-15 CCDS12332.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 319 80.7 4.4e-15 CCDS59362.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 319 80.7 4.4e-15 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 318 80.5 5e-15 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 315 79.8 8e-15 CCDS62934.1 CYP26B1 gene_id:56603|Hs108|chr2 ( 437) 311 78.9 1.3e-14 CCDS30707.1 CYP4A22 gene_id:284541|Hs108|chr1 ( 519) 307 78.0 2.8e-14 CCDS543.1 CYP4A11 gene_id:1579|Hs108|chr1 ( 519) 306 77.8 3.3e-14 CCDS10139.1 CYP19A1 gene_id:1588|Hs108|chr15 ( 503) 304 77.3 4.4e-14 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 303 77.1 5.2e-14 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 299 76.2 1e-13 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 276 71.0 2.6e-12 CCDS55175.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 466) 274 70.6 4.3e-12 CCDS5855.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 534) 274 70.6 4.9e-12 CCDS55174.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 580) 274 70.6 5.2e-12 CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 272 70.2 6.4e-12 CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 261 67.7 3.6e-11 CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 258 67.0 5.5e-11 CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 255 66.3 8.3e-11 CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 255 66.4 8.7e-11 >>CCDS5623.1 CYP51A1 gene_id:1595|Hs108|chr7 (509 aa) initn: 3392 init1: 3392 opt: 3392 Z-score: 4102.4 bits: 768.6 E(32554): 0 Smith-Waterman score: 3392; 99.8% identity (100.0% similar) in 509 aa overlap (1-509:1-509) 10 20 30 40 50 60 pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 PAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 ALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 IEKETKEYFESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 IEKETKEYFESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 SHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 SHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 PLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 DQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDS ::::::::::::::::::::::.::::::::::::::::::::::::::::::::::::: CCDS56 DQLKDLNLLDRCIKETLRLRPPIMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDS 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 WVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 WVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDL 430 440 450 460 470 480 490 500 pF1KE1 IDGYFPTVNYTTMIHTPENPVIRYKRRSK ::::::::::::::::::::::::::::: CCDS56 IDGYFPTVNYTTMIHTPENPVIRYKRRSK 490 500 >>CCDS55123.1 CYP51A1 gene_id:1595|Hs108|chr7 (404 aa) initn: 2717 init1: 2717 opt: 2717 Z-score: 3287.2 bits: 617.5 E(32554): 8.8e-177 Smith-Waterman score: 2717; 99.8% identity (100.0% similar) in 404 aa overlap (106-509:1-404) 80 90 100 110 120 130 pF1KE1 FLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNEDLNAED :::::::::::::::::::::::::::::: CCDS55 MVGKTFTYLLGSDAAALLFNSKNEDLNAED 10 20 30 140 150 160 170 180 190 pF1KE1 VYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETKEYFESWGES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETKEYFESWGES 40 50 60 70 80 90 200 210 220 230 240 250 pF1KE1 GEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGWLPLPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGWLPLPS 100 110 120 130 140 150 260 270 280 290 300 310 pF1KE1 FRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 FRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLL 160 170 180 190 200 210 320 330 340 350 360 370 pF1KE1 LAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKE 220 230 240 250 260 270 380 390 400 410 420 430 pF1KE1 TLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQD :::::::.:::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 TLRLRPPIMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQD 280 290 300 310 320 330 440 450 460 470 480 490 pF1KE1 NPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIH 340 350 360 370 380 390 500 pF1KE1 TPENPVIRYKRRSK :::::::::::::: CCDS55 TPENPVIRYKRRSK 400 >>CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 (469 aa) initn: 194 init1: 170 opt: 433 Z-score: 522.8 bits: 106.2 E(32554): 8.4e-23 Smith-Waterman score: 433; 23.6% identity (55.7% similar) in 483 aa overlap (45-507:7-468) 20 30 40 50 60 70 pF1KE1 AGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQLPAGVKSPPYIFSPI ... .. : :. ... :: : . : CCDS49 MELISPTVIIILGCLALFLLLQRKNLRRPPCIKGWI 10 20 30 80 90 100 110 120 130 pF1KE1 PFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNED--LN :..: .. :::.:.::.:.: ::::.:. .:. .:.. .. ....::. : : CCDS49 PWIGVGFEFGKAPLEFIEKARIKYGPIFTVFAMGNRMTFVTEEEGINVFLKSKKVDFELA 40 50 60 70 80 90 140 150 160 170 180 pF1KE1 AEDVYSRLTTPVFGKGVAYDVPNPVFLEQKK----MLKSGLNIAHFKQHVSIIEKETKEY .... : .. .:. ::: .. :::. .. ....: .. . .: .: CCDS49 VQNIVYRTAS----------IPKNVFLALHEKLYIMLKGKMGTVNLHQFTGQLTEELHEQ 100 110 120 130 140 190 200 210 220 230 240 pF1KE1 FESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLNEKVA---QLYADLDGGFSHAAW .:. : : .. . . .:. .. . : .: . : ..:. : . : : ... CCDS49 LENLGTHGTMDLNNLVRHLLYPVTVNMLFNKSLFSTNKKKIKEFHQYFQVYDEDFEYGSQ 150 160 170 180 190 200 250 260 270 280 290 300 pF1KE1 LLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGRPLTDD : : .: ..... . ..: : : . . :. . :::.:: . :. CCDS49 L-----PECLLRNWSKSKKWFLELFEKNIPDIKACKSAKDNSM-TLLQATLDIVETETSK 210 220 230 240 250 260 310 320 330 340 350 pF1KE1 EVA---GMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTV---CGENLPPLT : . :.: :: :. .. .. : .. ..: . ..: :.. .. CCDS49 ENSPNYGLL--LLWASLSNAVPVAFWTLAYVLSHPDIHKAIMEGISSVFGKAGKDKIKVS 270 280 290 300 310 360 370 380 390 400 410 pF1KE1 YDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKD :.:..: :. :. ::.::. : .: .... : . .: :: : . .:: .: CCDS49 EDDLENLLLIKWCVLETIRLKAPGVITRKVVK-PVEILNYIIPSGDLLMLSPFWLHRNPK 320 330 340 350 360 370 420 430 440 450 460 470 pF1KE1 SWVERLDFNPDRYLQDNPASGEKF--AYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYE . : :.:.:. . : ..: .. ::.:. .: .. :: .... .: :. CCDS49 YFPEPELFKPERWKKAN-LEKHSFLDCFMAFGSGKFQCPARWFALLEVQMCIILILYKYD 380 390 400 410 420 430 480 490 500 pF1KE1 FDLIDGYFPTVNYTTMIHTPENP---VIRYKRRSK .:.: .: .: .. .:. :.::.: CCDS49 CSLLDP-LPKQSYLHLVGVPQPEGQCRIEYKQRI 440 450 460 >>CCDS1919.1 CYP26B1 gene_id:56603|Hs108|chr2 (512 aa) initn: 183 init1: 91 opt: 386 Z-score: 465.4 bits: 95.7 E(32554): 1.3e-19 Smith-Waterman score: 388; 22.0% identity (55.2% similar) in 495 aa overlap (29-504:5-490) 10 20 30 40 50 pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSML--LIACAFTLSLV-------YLIR : .:.: : : :: ...:. . .: CCDS19 MLFEGLDLVSALATLAACLVSVTLLLAVSQQLWQLR 10 20 30 60 70 80 90 100 110 pF1KE1 LAAGHLVQLPAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTF :: . . . . . : : :: . :.. : . :::: ::. ..:. . CCDS19 WAATRDKSCKLPIPKGSMGFPLIGETGHWLLQGSG---FQSSRREKYGNVFKTHLLGRPL 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE1 TYLLGSDAAALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNI . :.. . .. .... ...: . : : ..: ... . . . ...:.... .. CCDS19 IRVTGAENVRKILMGEHHLVSTE--WPRSTRMLLGPNTVSNSIGDIHRNKRKVFSKIFSH 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE1 AHFKQHVSIIEKETKEYFESWGESGEK-NVFEALSELIILTASHCLHGKEIRSQLNEKVA ..... :. .. ...:. : ::.. ..: . : . : : : .: .. CCDS19 EALESYLPKIQLVIQDTLRAWSSHPEAINVYQEAQKLTFRMAIRVLLGFSIP---EEDLG 160 170 180 190 200 240 250 260 270 280 pF1KE1 QLYADLDGGFSHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKID--DIL .:. .. : .. :: ::. ..:: .:.. .. . :::... : . : : : CCDS19 HLF-EVYQQFVDNVFSLPVDLPFSGYRRGIQARQILQKGLEKAIREKLQCTQGKDYLDAL 210 220 230 240 250 260 290 300 310 320 330 340 pF1KE1 QTLLDATYKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQK . :.... . :. .: .:. . :..:. :....:. . . : . :. .: : . CCDS19 DLLIESSKEHGKEMTMQELKDGTLELIFAAYATTASASTSLIMQLLKHPTVLEKLRDELR 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE1 T---VCGENLP---PLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIP . . . . : : : :. : :: :::..:: :. .: . . :. :: CCDS19 AHGILHSGGCPCEGTLRLDTLSGLRYLDCVIKEVMRLFTPISGGYRTVLQTFELDGFQIP 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE1 PGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGE-KFAYVPFGAGRHRCIGENFA : .: : .. . . :.:::. : . . .: :.:::.: . :.:...: CCDS19 KGWSVMYSIRDTHDTAPVFKDVNVFDPDRFSQARSEDKDGRFHYLPFGGGVRTCLGKHLA 390 400 410 420 430 440 470 480 490 500 pF1KE1 YVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIHTPENPVIRYKRRSK . .:.. . .:.: :: .. . ..: .. ... CCDS19 KLFLKVLAVELASTSRFELATRTFPRITLVPVLHPVDGLSVKFFGLDSNQNEILPETEAM 450 460 470 480 490 500 CCDS19 LSATV 510 >>CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 (531 aa) initn: 320 init1: 155 opt: 385 Z-score: 463.9 bits: 95.5 E(32554): 1.6e-19 Smith-Waterman score: 414; 25.1% identity (58.2% similar) in 371 aa overlap (134-475:129-496) 110 120 130 140 150 160 pF1KE1 FTMVGKTFTYLLGSDAAALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKK .:.. . : .: :. . . . .... CCDS12 WMGPVLPLLVLVHPDYIKPLLGASAAIAPKDDLFYGFLKPWLGDGLLLSKGDK-WSRHRR 100 110 120 130 140 150 170 180 190 200 210 pF1KE1 MLKSGLNIAHFKQHVSIIEKETKEYFESW-----GESGEKNVFEALSELIILTASHCL-- .: .... .: ...:... . . .: : . ..:: .: . . . ..:. CCDS12 LLTPAFHFDILKPYMKIFNQSADIMHAKWRHLAEGSAVSLDMFEHISLMTLDSLQKCVFS 160 170 180 190 200 210 220 230 240 250 260 270 pF1KE1 HGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGWLPLPSFRRRD-RAHREIKDIFY---- .... . .... .. . .:.. . . : .: . .: : : :. :. . CCDS12 YNSNCQEKMSDYISAII-ELSALSVRRQYRLHHYLDFIYYRSADGRRFRQACDMVHHFTT 220 230 240 250 260 270 280 290 300 310 pF1KE1 KAIQKRRQS-------------QEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLLLAG ..::.::.. : : :....:: : .::. :.:... . ... : CCDS12 EVIQERRRALRQQGAEAWLKAKQGKTLDFIDVLLLARDEDGKELSDEDIRAEADTFMFEG 280 290 300 310 320 330 320 330 340 350 360 370 pF1KE1 QHTSSTTSAWMGFFLARDKTLQKKCYLE-QKTVCGENLPPLTYDQLKDLNLLDRCIKETL . :.:. .:: : ::. :.:: : :... :..: : .:.: .: . ::::.: CCDS12 HDTTSSGISWMLFNLAKYPEYQEKCREEIQEVMKGRELEELEWDDLTQLPFTTMCIKESL 340 350 360 370 380 390 380 390 400 410 420 430 pF1KE1 RLRPPVMIMMRMARTPQTVA-GYTIPPGHQVC-VSPTVNQRLKDSWVERLDFNPDRYLQD : ::: .. :. . : :: : .: :: ... : . .:: :. : CCDS12 RQYPPVTLVSRQCTEDIKLPDGRIIPKG-IICLVSIYGTHHNPTVWPDSKVYNPYRFDPD 400 410 420 430 440 450 440 450 460 470 480 490 pF1KE1 NPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWS-TMLRLYEFDLIDGYFPTVNYTTMI :: . .:::::.:: . :::..::....... . :.::. CCDS12 NPQQRSPLAYVPFSAGPRNCIGQSFAMAELRVVVALTLLRFRLSVDRTRKVRRKPELILR 460 470 480 490 500 510 500 pF1KE1 HTPENPVIRYKRRSK CCDS12 TENGLWLKVEPLPPRA 520 530 >>CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 (525 aa) initn: 318 init1: 279 opt: 352 Z-score: 424.1 bits: 88.1 E(32554): 2.7e-17 Smith-Waterman score: 388; 23.2% identity (53.1% similar) in 525 aa overlap (17-508:3-521) 10 20 30 40 50 60 pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL : :: . .:. . : : .: : .: : : :.:. .. CCDS34 MAGLWLGLVWQKLLLWGAASALSLAGA-SLVLSLLQRVAS--YARK 10 20 30 40 70 80 90 100 110 pF1KE1 PAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYE-----KYGPVFSFTMVGKTFTYLL .. : . :..:::. . . ::... : .. :.... . .. : CCDS34 WQQMRPIPTVARAYPLVGHALLMKPDGREFFQQIIEYTEEYRHMPLLKLWVGPVPMVALY 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE1 GSDAAALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFK ... . ....: ..... ..: .. : .: :. .. : . ..::: .... .. CCDS34 NAENVEVILTS-SKQIDKSSMY-KFLEPWLGLGLLTSTGNK-WRSRRKMLTPTFHFTILE 110 120 130 140 150 160 180 190 200 210 220 pF1KE1 QHVSIIEKETK---EYFESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLN---EKV . ..:...... . .:. .. : : .. . . ::.: .: : : : CCDS34 DFLDIMNEQANILVKKLEKHINQEAFNCFFYITLCALDIICETAMGKNIGAQSNDDSEYV 170 180 190 200 210 220 230 240 250 260 270 pF1KE1 AQLYADLDGGFSHAA--WL-LPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQ------- .: . : . :: : : . . . . .: : ... .: CCDS34 RAVYRMSEMIFRRIKMPWLWLDLWYLMFKEGWEHKKSLQILHTFTNSVIAERANEMNANE 230 240 250 260 270 280 280 290 300 310 320 pF1KE1 -----------SQEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAW :..: .:. ::..: .: :. ... . ... :. :.... : CCDS34 DCRGDGRGSAPSKNKRRAFLDLLLSVTDDEGNRLSHEDIREEVDTFMFEGHDTTAAAINW 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE1 MGFFLARDKTLQKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMR ..:. . .::: : : :.. : : ..:: : :. ::::::: : : .. : CCDS34 SLYLLGSNPEVQKKVDHELDDVFGKSDRPATVEDLKKLRYLECVIKETLRLFPSVPLFAR 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE1 MARTPQTVAGYTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPF . :::: . : .. . : . .: . . .:.:.:.. .: . . .::::: CCDS34 SVSEDCEVAGYRVLKGTEAVIIPYALHRDPRYFPNPEEFQPERFFPENAQGRHPYAYVPF 410 420 430 440 450 460 450 460 470 480 490 500 pF1KE1 GAGRHRCIGENFAYVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIHTPENPV-IRYKRR .:: . :::..:: .. ::: : .:: . .. . .: : : . :. ::: CCDS34 SAGPRNCIGQKFAVMEEKTILSCILRHFWIESNQKREELGLEGQLILRPSNGIWIKLKRR 470 480 490 500 510 520 pF1KE1 SK . CCDS34 NADER >>CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 (509 aa) initn: 223 init1: 101 opt: 345 Z-score: 415.8 bits: 86.5 E(32554): 7.7e-17 Smith-Waterman score: 464; 24.6% identity (53.7% similar) in 492 aa overlap (42-499:14-497) 20 30 40 50 60 70 pF1KE1 LLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQLPAGVKSPPYIF : :..:. . :. . ..: . . CCDS54 MEFSWLETRWARPFYLAFVFCLALGLLQAIKLYLRRQRLLRDL 10 20 30 40 80 90 100 110 120 pF1KE1 SPIP------FLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVG--KTFTYLLGSDAAALL :.: :::: . . .: ::. ::: .: : .: ..: . : : : CCDS54 RPFPAPPTHWFLGHQKFIQDDNMEKLEEIIEKYPRAFPF-WIGPFQAFFCIYDPDYAKTL 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE1 FNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEK .. . . .... :..:::.: . .: .......: :... .: .. .. . CCDS54 LSRTDPK---SQYLQKFSPPLLGKGLAA-LDGPKWFQHRRLLTPGFHFNILKAYIEVMAH 110 120 130 140 150 190 200 210 220 230 pF1KE1 ETKEYFESW-----GESGEKNVFEALSELIILTASHCLHGKEIRSQLN---EKVAQLYAD .: ....: .. .:.: .. . . .: .:: : : . :. . CCDS54 SVKMMLDKWEKICSTQDTSVEVYEHINSMSLDIIMKCAFSKETNCQTNSTHDPYAKAIFE 160 170 180 190 200 210 240 250 260 270 280 pF1KE1 LDGGFSHAAWLLPGWLPL-----PSFRRRDRAHREIKDIFYKAIQKRRQS---------- :. . : . : . :. : .. : ... ::.:..: CCDS54 LSKIIFHRLYSLLYHSDIIFKLSPQGYRFQKLSRVLNQYTDTIIQERKKSLQAGVKQDNT 220 230 240 250 260 270 290 300 310 320 330 pF1KE1 -QEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTL ..: .:.:. .:.: ..: ..: .: . . .::::. : ... .:. . :: . CCDS54 PKRKYQDFLDIVLSAKDESGSSFSDIDVHSEVSTFLLAGHDTLAASISWILYCLALNPEH 280 290 300 310 320 330 340 350 360 370 380 390 pF1KE1 QKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVA-G :..: : . . :.. .:.::: ... ::::: :: : : . : : : : CCDS54 QERCREEVRGILGDG-SSITWDQLGEMSYTTMCIKETCRLIPAVPSISRDLSKPLTFPDG 340 350 360 370 380 390 400 410 420 430 440 450 pF1KE1 YTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGE :.: : : .: .. : . :.: :. :.: . . .::.::.:: . :::. CCDS54 CTLPAGITVVLSIWGLHHNPAVWKNPKVFDPLRFSQENSDQRHPYAYLPFSAGSRNCIGQ 400 410 420 430 440 450 460 470 480 490 500 pF1KE1 NFAYVQIKTIWSTMLRLYEFDLI-DGYFPTVNYTTMIHTPENPVIRYKRRSK .::....:. . : : .: . : : . . .: :.: CCDS54 EFAMIELKV--TIALILLHFRVTPDPTRPLTFPNHFILKPKNGMYLHLKKLSEC 460 470 480 490 500 >>CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 (500 aa) initn: 245 init1: 117 opt: 344 Z-score: 414.7 bits: 86.3 E(32554): 8.8e-17 Smith-Waterman score: 396; 22.2% identity (54.4% similar) in 496 aa overlap (27-502:1-483) 10 20 30 40 50 60 pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL .. : :: . :: : ... : : .. .. CCDS99 MSPGLLLLGSAVLLAFGLCCTFVHR-ARSRYEHI 10 20 30 70 80 90 100 110 pF1KE1 PAGVKSPPYIFSPIPFLGHAIAFGKSPIE--FLENAYEKYGPVFSFTMVGKTFTYLLGSD : : : .... .: . . : .. ::. : .::::: .. :: . . . . CCDS99 P-GPPRPSFLLGHLPCFWKKDEVGGRVLQDVFLDWA-KKYGPVVRVNVFHKTSVIVTSPE 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE1 AAALLFNSKNEDLNAEDVYSRLTTP----VFGKGVAYDVPNPVFLEQKKMLKSGLNIAHF .. .. : . . ... .: : : .::.:.. . . .:.... ... . . CCDS99 SVKKFLMSTKYNKDSK-MYRALQTVFGERLFGQGLVSECNYERWHKQRRVIDLAFSRSSL 100 110 120 130 140 150 180 190 200 210 220 pF1KE1 KQHVSIIEKETKEYFESWGESGEKNVFEALSELIILTASHCL----HGKEI------RSQ . . ....... : ... .. ...... :: : : : .. CCDS99 VSLMETFNEKAEQLVEILEAKADGQTPVSMQDMLTYTAMDILAKAAFGMETSMLLGAQKP 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE1 LNEKVAQLYADLDGGFSHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKI :.. : . . .. . : .::: ..:. .. : .... .:.::.. .. CCDS99 LSQAVKLMLEGITASRNTLAKFLPG--KRKQLREVRESIRFLRQVGRDWVQRRREALKRG 220 230 240 250 260 290 300 310 320 330 340 pF1KE1 DDILQTLLDATYKDGRPLTDDEVAGML---IGLLLAGQHTSSTTSAWMGFFLARDKTLQK ... .: : . ::: :.: . ...::..::.. :. . :.:. . CCDS99 EEVPADILTQILKAEEGAQDDE--GLLDNFVTFFIAGHETSANHLAFTVMELSRQPEIVA 270 280 290 300 310 320 350 360 370 380 390 400 pF1KE1 KCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTI . : : : . : ...: :. :.. .::.::: ::. .:. . . : . CCDS99 RLQAEVDEVIGSKRY-LDFEDLGRLQYLSQVLKESLRLYPPAWGTFRLLEEETLIDGVRV 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE1 PPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFA : . . : : :. . . : :::::. : .:.: ::. :.. :::..:: CCDS99 PGNTPLLFSTYVMGRMDTYFEDPLTFNPDRFGPGAPK--PRFTYFPFSLGHRSCIGQQFA 390 400 410 420 430 440 470 480 490 500 pF1KE1 YVQIKTIWSTMLRLYEFDLIDGY-FPTVNYTTMIHTPENPVIRYKRRSK ...:.. . .:. :: :. : : . .:. : .::. CCDS99 QMEVKVVMAKLLQRLEFRLVPGQRFGLQEQATL--KPLDPVLCTLRPRGWQPAPPPPPC 450 460 470 480 490 500 >>CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 (503 aa) initn: 309 init1: 224 opt: 343 Z-score: 413.5 bits: 86.1 E(32554): 1e-16 Smith-Waterman score: 413; 23.6% identity (53.1% similar) in 484 aa overlap (41-502:16-490) 20 30 40 50 60 70 pF1KE1 GLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQLPAGVKSPPYI : .: :.:: . : . :. .: CCDS56 MALIPDLAMETWLLLAVSLVLLYLYGTHSHGLFK-KLGIPGP--- 10 20 30 40 80 90 100 110 120 130 pF1KE1 FSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNED .:.::::. ... :. : . ..::: :..: . . : .. .. . CCDS56 -TPLPFLGNILSYHKGFCMFDMECHKKYGKVWGFYDGQQPVLAITDPDMIKTVLVKECYS 50 60 70 80 90 100 140 150 160 170 180 pF1KE1 LNAEDVYSRLTTPV-FGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETK--- . .. : :: : :.. . . . . ...:. .. ...:. : :: . CCDS56 VFTN---RRPFGPVGFMKSAISIAEDEEWKRLRSLLSPTFTSGKLKEMVPIIAQYGDVLV 110 120 130 140 150 190 200 210 220 230 pF1KE1 EYFESWGESGE----KNVFEALSELIILTASHCLHGKEIRSQLNEKVAQ----LYADLDG . .. .:.:. :.:: : : .: ..: .. . . . : . : :. CCDS56 RNLRREAETGKPVTLKDVFGAYSMDVITSTSFGVNIDSLNNPQDPFVENTKKLLRFDFLD 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE1 GFSHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQS-----QEKIDDILQTLLD : . ..: .:. ::. ... :.... ..: :.. :.:: ..: CCDS56 PFFLSITVFPFLIPILEVLNICVFPREVTNFLRKSVKRMKESRLEDTQKHRVDFLQLMID 220 230 240 250 260 270 300 310 320 330 340 pF1KE1 ATY----KDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKT . .. . :.: :.... : ...:: .:.:.. ... . :: .:.: : . CCDS56 SQNSKETESHKALSDLELVAQSIIFIFAGYETTSSVLSFIMYELATHPDVQQKLQEEIDA 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE1 VCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCV : .. :: ::: . ... :: ..::::: : .: . :. . . :. :: : : . CCDS56 VLPNKAPP-TYDTVLQMEYLDMVVNETLRLFPIAMRLERVCKKDVEINGMFIPKGVVVMI 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE1 SPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIW . .: :.: : :.:. . : . . . :.:::.: . ::: :: ...: CCDS56 PSYALHRDPKYWTEPEKFLPERFSKKNKDNIDPYIYTPFGSGPRNCIGMRFALMNMKLAL 400 410 420 430 440 450 470 480 490 500 pF1KE1 STMLRLYEFD-LIDGYFPTVNYTTMIHTPENPVIRYKRRSK .:. . : . .: . ::.::. CCDS56 IRVLQNFSFKPCKETQIPLKLSLGGLLQPEKPVVLKVESRDGTVSGA 460 470 480 490 500 >>CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 (524 aa) initn: 185 init1: 105 opt: 341 Z-score: 410.8 bits: 85.6 E(32554): 1.5e-16 Smith-Waterman score: 404; 23.0% identity (56.7% similar) in 404 aa overlap (111-486:98-498) 90 100 110 120 130 140 pF1KE1 IAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNEDLNAEDVYSRL : : :. . :.. .... :. CCDS42 TPTEEGLKNSTQMSATYSQGFTVWLGPIIPFIVLCHPDTIRSITNASAAIAPKDNLFIRF 70 80 90 100 110 120 150 160 170 180 190 pF1KE1 TTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETKEYFESWGE-----S : .:.:. . . . ....:: .... .:....:..: .. ....: . : CCDS42 LKPWLGEGILLSGGDK-WSRHRRMLTPAFHFNILKSYITIFNKSANIMLDKWQHLASEGS 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE1 GEKNVFEALSELIILTASHCL-----HGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGW .. ..:: .: . . . ..:. : .: :. . .: : .. .: . CCDS42 SRLDMFEHISLMTLDSLQKCIFSFDSHCQERPSEYIATILELSALVEKRSQHILQHMDFL 190 200 210 220 230 240 260 270 280 290 pF1KE1 LPLP-SFRRRDRAHREIKDIFYKAIQKRRQS--QEKIDDILQ------------TLLDAT : . :: :: : ..:. .:..::.. . :::... .:: . CCDS42 YYLSHDGRRFHRACRLVHDFTDAVIRERRRTLPTQGIDDFFKDKAKSKTLDFIDVLLLSK 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE1 YKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENL .::. :.:... . ....:. :... .:. . ::: :..: : . . . CCDS42 DEDGKALSDEDIRAEADTFMFGGHDTTASGLSWVLYNLARHPEYQERCRQEVQELLKDRD 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE1 PP-LTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVA-GYTIPPGHQVCVSPTV : . .:.: .: .: :.::.:::.::. .. : .. : .:: : .:. . CCDS42 PKEIEWDDLAQLPFLTMCVKESLRLHPPAPFISRCCTQDIVLPDGRVIPKG-ITCLIDII 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE1 NQRLKDS-WVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTM . . . . : . ..: :. .: . .:..::.:: . :::. ::....:.. . : CCDS42 GVHHNPTVWPDPEVYDPFRFDPENSKGRSPLAFIPFSAGPRNCIGQAFAMAEMKVVLALM 430 440 450 460 470 480 480 490 500 pF1KE1 LRLYEFDLIDGYFPTVNYTTMIHTPENPVIRYKRRSK : ..: : : : CCDS42 LLHFRF-LPDHTEPRRKLELIMRAEGGLWLRVEPLNVSLQ 490 500 510 520 509 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 00:06:47 2016 done: Mon Nov 7 00:06:47 2016 Total Scan time: 3.160 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]