FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1549, 509 aa
1>>>pF1KE1549 509 - 509 aa - 509 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4478+/-0.00095; mu= 17.2683+/- 0.057
mean_var=68.3125+/-14.057, 0's: 0 Z-trim(105.7): 80 B-trim: 211 in 1/49
Lambda= 0.155176
statistics sampled from 8511 (8591) to 8511 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.638), E-opt: 0.2 (0.264), width: 16
Scan time: 3.160
The best scores are: opt bits E(32554)
CCDS5623.1 CYP51A1 gene_id:1595|Hs108|chr7 ( 509) 3392 768.6 0
CCDS55123.1 CYP51A1 gene_id:1595|Hs108|chr7 ( 404) 2717 617.5 8.8e-177
CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 ( 469) 433 106.2 8.4e-23
CCDS1919.1 CYP26B1 gene_id:56603|Hs108|chr2 ( 512) 386 95.7 1.3e-19
CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 ( 531) 385 95.5 1.6e-19
CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 352 88.1 2.7e-17
CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 345 86.5 7.7e-17
CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 344 86.3 8.8e-17
CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 343 86.1 1e-16
CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 341 85.6 1.5e-16
CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 340 85.4 1.6e-16
CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 340 85.4 1.7e-16
CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 340 85.4 1.7e-16
CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 337 84.7 2.6e-16
CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 337 84.7 2.8e-16
CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 330 83.1 6.3e-16
CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 331 83.4 6.9e-16
CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 330 83.1 7.8e-16
CCDS7427.1 CYP26A1 gene_id:1592|Hs108|chr10 ( 428) 329 82.9 7.9e-16
CCDS7426.1 CYP26A1 gene_id:1592|Hs108|chr10 ( 497) 329 82.9 9e-16
CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 328 82.7 1.1e-15
CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 327 82.5 1.2e-15
CCDS74303.1 CYP4F8 gene_id:11283|Hs108|chr19 ( 520) 324 81.8 2e-15
CCDS12332.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 319 80.7 4.4e-15
CCDS59362.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 319 80.7 4.4e-15
CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 318 80.5 5e-15
CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 315 79.8 8e-15
CCDS62934.1 CYP26B1 gene_id:56603|Hs108|chr2 ( 437) 311 78.9 1.3e-14
CCDS30707.1 CYP4A22 gene_id:284541|Hs108|chr1 ( 519) 307 78.0 2.8e-14
CCDS543.1 CYP4A11 gene_id:1579|Hs108|chr1 ( 519) 306 77.8 3.3e-14
CCDS10139.1 CYP19A1 gene_id:1588|Hs108|chr15 ( 503) 304 77.3 4.4e-14
CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 303 77.1 5.2e-14
CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 299 76.2 1e-13
CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 276 71.0 2.6e-12
CCDS55175.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 466) 274 70.6 4.3e-12
CCDS5855.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 534) 274 70.6 4.9e-12
CCDS55174.1 TBXAS1 gene_id:6916|Hs108|chr7 ( 580) 274 70.6 5.2e-12
CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 272 70.2 6.4e-12
CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 261 67.7 3.6e-11
CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 258 67.0 5.5e-11
CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 255 66.3 8.3e-11
CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 255 66.4 8.7e-11
>>CCDS5623.1 CYP51A1 gene_id:1595|Hs108|chr7 (509 aa)
initn: 3392 init1: 3392 opt: 3392 Z-score: 4102.4 bits: 768.6 E(32554): 0
Smith-Waterman score: 3392; 99.8% identity (100.0% similar) in 509 aa overlap (1-509:1-509)
10 20 30 40 50 60
pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 PAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 ALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 ALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 IEKETKEYFESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 IEKETKEYFESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 SHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 SHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 PLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 PLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 DQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDS
::::::::::::::::::::::.:::::::::::::::::::::::::::::::::::::
CCDS56 DQLKDLNLLDRCIKETLRLRPPIMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDS
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 WVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS56 WVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDL
430 440 450 460 470 480
490 500
pF1KE1 IDGYFPTVNYTTMIHTPENPVIRYKRRSK
:::::::::::::::::::::::::::::
CCDS56 IDGYFPTVNYTTMIHTPENPVIRYKRRSK
490 500
>>CCDS55123.1 CYP51A1 gene_id:1595|Hs108|chr7 (404 aa)
initn: 2717 init1: 2717 opt: 2717 Z-score: 3287.2 bits: 617.5 E(32554): 8.8e-177
Smith-Waterman score: 2717; 99.8% identity (100.0% similar) in 404 aa overlap (106-509:1-404)
80 90 100 110 120 130
pF1KE1 FLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNEDLNAED
::::::::::::::::::::::::::::::
CCDS55 MVGKTFTYLLGSDAAALLFNSKNEDLNAED
10 20 30
140 150 160 170 180 190
pF1KE1 VYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETKEYFESWGES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETKEYFESWGES
40 50 60 70 80 90
200 210 220 230 240 250
pF1KE1 GEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGWLPLPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GEKNVFEALSELIILTASHCLHGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGWLPLPS
100 110 120 130 140 150
260 270 280 290 300 310
pF1KE1 FRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLL
160 170 180 190 200 210
320 330 340 350 360 370
pF1KE1 LAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKE
220 230 240 250 260 270
380 390 400 410 420 430
pF1KE1 TLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQD
:::::::.::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TLRLRPPIMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQD
280 290 300 310 320 330
440 450 460 470 480 490
pF1KE1 NPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIH
340 350 360 370 380 390
500
pF1KE1 TPENPVIRYKRRSK
::::::::::::::
CCDS55 TPENPVIRYKRRSK
400
>>CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 (469 aa)
initn: 194 init1: 170 opt: 433 Z-score: 522.8 bits: 106.2 E(32554): 8.4e-23
Smith-Waterman score: 433; 23.6% identity (55.7% similar) in 483 aa overlap (45-507:7-468)
20 30 40 50 60 70
pF1KE1 AGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQLPAGVKSPPYIFSPI
... .. : :. ... :: : . :
CCDS49 MELISPTVIIILGCLALFLLLQRKNLRRPPCIKGWI
10 20 30
80 90 100 110 120 130
pF1KE1 PFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNED--LN
:..: .. :::.:.::.:.: ::::.:. .:. .:.. .. ....::. : :
CCDS49 PWIGVGFEFGKAPLEFIEKARIKYGPIFTVFAMGNRMTFVTEEEGINVFLKSKKVDFELA
40 50 60 70 80 90
140 150 160 170 180
pF1KE1 AEDVYSRLTTPVFGKGVAYDVPNPVFLEQKK----MLKSGLNIAHFKQHVSIIEKETKEY
.... : .. .:. ::: .. :::. .. ....: .. . .: .:
CCDS49 VQNIVYRTAS----------IPKNVFLALHEKLYIMLKGKMGTVNLHQFTGQLTEELHEQ
100 110 120 130 140
190 200 210 220 230 240
pF1KE1 FESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLNEKVA---QLYADLDGGFSHAAW
.:. : : .. . . .:. .. . : .: . : ..:. : . : : ...
CCDS49 LENLGTHGTMDLNNLVRHLLYPVTVNMLFNKSLFSTNKKKIKEFHQYFQVYDEDFEYGSQ
150 160 170 180 190 200
250 260 270 280 290 300
pF1KE1 LLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKIDDILQTLLDATYKDGRPLTDD
: : .: ..... . ..: : : . . :. . :::.:: . :.
CCDS49 L-----PECLLRNWSKSKKWFLELFEKNIPDIKACKSAKDNSM-TLLQATLDIVETETSK
210 220 230 240 250 260
310 320 330 340 350
pF1KE1 EVA---GMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTV---CGENLPPLT
: . :.: :: :. .. .. : .. ..: . ..: :.. ..
CCDS49 ENSPNYGLL--LLWASLSNAVPVAFWTLAYVLSHPDIHKAIMEGISSVFGKAGKDKIKVS
270 280 290 300 310
360 370 380 390 400 410
pF1KE1 YDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCVSPTVNQRLKD
:.:..: :. :. ::.::. : .: .... : . .: :: : . .:: .:
CCDS49 EDDLENLLLIKWCVLETIRLKAPGVITRKVVK-PVEILNYIIPSGDLLMLSPFWLHRNPK
320 330 340 350 360 370
420 430 440 450 460 470
pF1KE1 SWVERLDFNPDRYLQDNPASGEKF--AYVPFGAGRHRCIGENFAYVQIKTIWSTMLRLYE
. : :.:.:. . : ..: .. ::.:. .: .. :: .... .: :.
CCDS49 YFPEPELFKPERWKKAN-LEKHSFLDCFMAFGSGKFQCPARWFALLEVQMCIILILYKYD
380 390 400 410 420 430
480 490 500
pF1KE1 FDLIDGYFPTVNYTTMIHTPENP---VIRYKRRSK
.:.: .: .: .. .:. :.::.:
CCDS49 CSLLDP-LPKQSYLHLVGVPQPEGQCRIEYKQRI
440 450 460
>>CCDS1919.1 CYP26B1 gene_id:56603|Hs108|chr2 (512 aa)
initn: 183 init1: 91 opt: 386 Z-score: 465.4 bits: 95.7 E(32554): 1.3e-19
Smith-Waterman score: 388; 22.0% identity (55.2% similar) in 495 aa overlap (29-504:5-490)
10 20 30 40 50
pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSML--LIACAFTLSLV-------YLIR
: .:.: : : :: ...:. . .:
CCDS19 MLFEGLDLVSALATLAACLVSVTLLLAVSQQLWQLR
10 20 30
60 70 80 90 100 110
pF1KE1 LAAGHLVQLPAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTF
:: . . . . . : : :: . :.. : . :::: ::. ..:. .
CCDS19 WAATRDKSCKLPIPKGSMGFPLIGETGHWLLQGSG---FQSSRREKYGNVFKTHLLGRPL
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE1 TYLLGSDAAALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNI
. :.. . .. .... ...: . : : ..: ... . . . ...:.... ..
CCDS19 IRVTGAENVRKILMGEHHLVSTE--WPRSTRMLLGPNTVSNSIGDIHRNKRKVFSKIFSH
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE1 AHFKQHVSIIEKETKEYFESWGESGEK-NVFEALSELIILTASHCLHGKEIRSQLNEKVA
..... :. .. ...:. : ::.. ..: . : . : : : .: ..
CCDS19 EALESYLPKIQLVIQDTLRAWSSHPEAINVYQEAQKLTFRMAIRVLLGFSIP---EEDLG
160 170 180 190 200
240 250 260 270 280
pF1KE1 QLYADLDGGFSHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKID--DIL
.:. .. : .. :: ::. ..:: .:.. .. . :::... : . : : :
CCDS19 HLF-EVYQQFVDNVFSLPVDLPFSGYRRGIQARQILQKGLEKAIREKLQCTQGKDYLDAL
210 220 230 240 250 260
290 300 310 320 330 340
pF1KE1 QTLLDATYKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQK
. :.... . :. .: .:. . :..:. :....:. . . : . :. .: : .
CCDS19 DLLIESSKEHGKEMTMQELKDGTLELIFAAYATTASASTSLIMQLLKHPTVLEKLRDELR
270 280 290 300 310 320
350 360 370 380 390 400
pF1KE1 T---VCGENLP---PLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIP
. . . . : : : :. : :: :::..:: :. .: . . :. ::
CCDS19 AHGILHSGGCPCEGTLRLDTLSGLRYLDCVIKEVMRLFTPISGGYRTVLQTFELDGFQIP
330 340 350 360 370 380
410 420 430 440 450 460
pF1KE1 PGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGE-KFAYVPFGAGRHRCIGENFA
: .: : .. . . :.:::. : . . .: :.:::.: . :.:...:
CCDS19 KGWSVMYSIRDTHDTAPVFKDVNVFDPDRFSQARSEDKDGRFHYLPFGGGVRTCLGKHLA
390 400 410 420 430 440
470 480 490 500
pF1KE1 YVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIHTPENPVIRYKRRSK
. .:.. . .:.: :: .. . ..: .. ...
CCDS19 KLFLKVLAVELASTSRFELATRTFPRITLVPVLHPVDGLSVKFFGLDSNQNEILPETEAM
450 460 470 480 490 500
CCDS19 LSATV
510
>>CCDS12331.1 CYP4F22 gene_id:126410|Hs108|chr19 (531 aa)
initn: 320 init1: 155 opt: 385 Z-score: 463.9 bits: 95.5 E(32554): 1.6e-19
Smith-Waterman score: 414; 25.1% identity (58.2% similar) in 371 aa overlap (134-475:129-496)
110 120 130 140 150 160
pF1KE1 FTMVGKTFTYLLGSDAAALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKK
.:.. . : .: :. . . . ....
CCDS12 WMGPVLPLLVLVHPDYIKPLLGASAAIAPKDDLFYGFLKPWLGDGLLLSKGDK-WSRHRR
100 110 120 130 140 150
170 180 190 200 210
pF1KE1 MLKSGLNIAHFKQHVSIIEKETKEYFESW-----GESGEKNVFEALSELIILTASHCL--
.: .... .: ...:... . . .: : . ..:: .: . . . ..:.
CCDS12 LLTPAFHFDILKPYMKIFNQSADIMHAKWRHLAEGSAVSLDMFEHISLMTLDSLQKCVFS
160 170 180 190 200 210
220 230 240 250 260 270
pF1KE1 HGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGWLPLPSFRRRD-RAHREIKDIFY----
.... . .... .. . .:.. . . : .: . .: : : :. :. .
CCDS12 YNSNCQEKMSDYISAII-ELSALSVRRQYRLHHYLDFIYYRSADGRRFRQACDMVHHFTT
220 230 240 250 260 270
280 290 300 310
pF1KE1 KAIQKRRQS-------------QEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLLLAG
..::.::.. : : :....:: : .::. :.:... . ... :
CCDS12 EVIQERRRALRQQGAEAWLKAKQGKTLDFIDVLLLARDEDGKELSDEDIRAEADTFMFEG
280 290 300 310 320 330
320 330 340 350 360 370
pF1KE1 QHTSSTTSAWMGFFLARDKTLQKKCYLE-QKTVCGENLPPLTYDQLKDLNLLDRCIKETL
. :.:. .:: : ::. :.:: : :... :..: : .:.: .: . ::::.:
CCDS12 HDTTSSGISWMLFNLAKYPEYQEKCREEIQEVMKGRELEELEWDDLTQLPFTTMCIKESL
340 350 360 370 380 390
380 390 400 410 420 430
pF1KE1 RLRPPVMIMMRMARTPQTVA-GYTIPPGHQVC-VSPTVNQRLKDSWVERLDFNPDRYLQD
: ::: .. :. . : :: : .: :: ... : . .:: :. :
CCDS12 RQYPPVTLVSRQCTEDIKLPDGRIIPKG-IICLVSIYGTHHNPTVWPDSKVYNPYRFDPD
400 410 420 430 440 450
440 450 460 470 480 490
pF1KE1 NPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWS-TMLRLYEFDLIDGYFPTVNYTTMI
:: . .:::::.:: . :::..::....... . :.::.
CCDS12 NPQQRSPLAYVPFSAGPRNCIGQSFAMAELRVVVALTLLRFRLSVDRTRKVRRKPELILR
460 470 480 490 500 510
500
pF1KE1 HTPENPVIRYKRRSK
CCDS12 TENGLWLKVEPLPPRA
520 530
>>CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 (525 aa)
initn: 318 init1: 279 opt: 352 Z-score: 424.1 bits: 88.1 E(32554): 2.7e-17
Smith-Waterman score: 388; 23.2% identity (53.1% similar) in 525 aa overlap (17-508:3-521)
10 20 30 40 50 60
pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL
: :: . .:. . : : .: : .: : : :.:. ..
CCDS34 MAGLWLGLVWQKLLLWGAASALSLAGA-SLVLSLLQRVAS--YARK
10 20 30 40
70 80 90 100 110
pF1KE1 PAGVKSPPYIFSPIPFLGHAIAFGKSPIEFLENAYE-----KYGPVFSFTMVGKTFTYLL
.. : . :..:::. . . ::... : .. :.... . .. :
CCDS34 WQQMRPIPTVARAYPLVGHALLMKPDGREFFQQIIEYTEEYRHMPLLKLWVGPVPMVALY
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE1 GSDAAALLFNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFK
... . ....: ..... ..: .. : .: :. .. : . ..::: .... ..
CCDS34 NAENVEVILTS-SKQIDKSSMY-KFLEPWLGLGLLTSTGNK-WRSRRKMLTPTFHFTILE
110 120 130 140 150 160
180 190 200 210 220
pF1KE1 QHVSIIEKETK---EYFESWGESGEKNVFEALSELIILTASHCLHGKEIRSQLN---EKV
. ..:...... . .:. .. : : .. . . ::.: .: : : :
CCDS34 DFLDIMNEQANILVKKLEKHINQEAFNCFFYITLCALDIICETAMGKNIGAQSNDDSEYV
170 180 190 200 210 220
230 240 250 260 270
pF1KE1 AQLYADLDGGFSHAA--WL-LPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQ-------
.: . : . :: : : . . . . .: : ... .:
CCDS34 RAVYRMSEMIFRRIKMPWLWLDLWYLMFKEGWEHKKSLQILHTFTNSVIAERANEMNANE
230 240 250 260 270 280
280 290 300 310 320
pF1KE1 -----------SQEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAW
:..: .:. ::..: .: :. ... . ... :. :.... :
CCDS34 DCRGDGRGSAPSKNKRRAFLDLLLSVTDDEGNRLSHEDIREEVDTFMFEGHDTTAAAINW
290 300 310 320 330 340
330 340 350 360 370 380
pF1KE1 MGFFLARDKTLQKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMR
..:. . .::: : : :.. : : ..:: : :. ::::::: : : .. :
CCDS34 SLYLLGSNPEVQKKVDHELDDVFGKSDRPATVEDLKKLRYLECVIKETLRLFPSVPLFAR
350 360 370 380 390 400
390 400 410 420 430 440
pF1KE1 MARTPQTVAGYTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPF
. :::: . : .. . : . .: . . .:.:.:.. .: . . .:::::
CCDS34 SVSEDCEVAGYRVLKGTEAVIIPYALHRDPRYFPNPEEFQPERFFPENAQGRHPYAYVPF
410 420 430 440 450 460
450 460 470 480 490 500
pF1KE1 GAGRHRCIGENFAYVQIKTIWSTMLRLYEFDLIDGYFPTVNYTTMIHTPENPV-IRYKRR
.:: . :::..:: .. ::: : .:: . .. . .: : : . :. :::
CCDS34 SAGPRNCIGQKFAVMEEKTILSCILRHFWIESNQKREELGLEGQLILRPSNGIWIKLKRR
470 480 490 500 510 520
pF1KE1 SK
.
CCDS34 NADER
>>CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 (509 aa)
initn: 223 init1: 101 opt: 345 Z-score: 415.8 bits: 86.5 E(32554): 7.7e-17
Smith-Waterman score: 464; 24.6% identity (53.7% similar) in 492 aa overlap (42-499:14-497)
20 30 40 50 60 70
pF1KE1 LLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQLPAGVKSPPYIF
: :..:. . :. . ..: . .
CCDS54 MEFSWLETRWARPFYLAFVFCLALGLLQAIKLYLRRQRLLRDL
10 20 30 40
80 90 100 110 120
pF1KE1 SPIP------FLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVG--KTFTYLLGSDAAALL
:.: :::: . . .: ::. ::: .: : .: ..: . : : :
CCDS54 RPFPAPPTHWFLGHQKFIQDDNMEKLEEIIEKYPRAFPF-WIGPFQAFFCIYDPDYAKTL
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE1 FNSKNEDLNAEDVYSRLTTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEK
.. . . .... :..:::.: . .: .......: :... .: .. .. .
CCDS54 LSRTDPK---SQYLQKFSPPLLGKGLAA-LDGPKWFQHRRLLTPGFHFNILKAYIEVMAH
110 120 130 140 150
190 200 210 220 230
pF1KE1 ETKEYFESW-----GESGEKNVFEALSELIILTASHCLHGKEIRSQLN---EKVAQLYAD
.: ....: .. .:.: .. . . .: .:: : : . :. .
CCDS54 SVKMMLDKWEKICSTQDTSVEVYEHINSMSLDIIMKCAFSKETNCQTNSTHDPYAKAIFE
160 170 180 190 200 210
240 250 260 270 280
pF1KE1 LDGGFSHAAWLLPGWLPL-----PSFRRRDRAHREIKDIFYKAIQKRRQS----------
:. . : . : . :. : .. : ... ::.:..:
CCDS54 LSKIIFHRLYSLLYHSDIIFKLSPQGYRFQKLSRVLNQYTDTIIQERKKSLQAGVKQDNT
220 230 240 250 260 270
290 300 310 320 330
pF1KE1 -QEKIDDILQTLLDATYKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTL
..: .:.:. .:.: ..: ..: .: . . .::::. : ... .:. . :: .
CCDS54 PKRKYQDFLDIVLSAKDESGSSFSDIDVHSEVSTFLLAGHDTLAASISWILYCLALNPEH
280 290 300 310 320 330
340 350 360 370 380 390
pF1KE1 QKKCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVA-G
:..: : . . :.. .:.::: ... ::::: :: : : . : : : :
CCDS54 QERCREEVRGILGDG-SSITWDQLGEMSYTTMCIKETCRLIPAVPSISRDLSKPLTFPDG
340 350 360 370 380 390
400 410 420 430 440 450
pF1KE1 YTIPPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGE
:.: : : .: .. : . :.: :. :.: . . .::.::.:: . :::.
CCDS54 CTLPAGITVVLSIWGLHHNPAVWKNPKVFDPLRFSQENSDQRHPYAYLPFSAGSRNCIGQ
400 410 420 430 440 450
460 470 480 490 500
pF1KE1 NFAYVQIKTIWSTMLRLYEFDLI-DGYFPTVNYTTMIHTPENPVIRYKRRSK
.::....:. . : : .: . : : . . .: :.:
CCDS54 EFAMIELKV--TIALILLHFRVTPDPTRPLTFPNHFILKPKNGMYLHLKKLSEC
460 470 480 490 500
>>CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 (500 aa)
initn: 245 init1: 117 opt: 344 Z-score: 414.7 bits: 86.3 E(32554): 8.8e-17
Smith-Waterman score: 396; 22.2% identity (54.4% similar) in 496 aa overlap (27-502:1-483)
10 20 30 40 50 60
pF1KE1 MAAAAGMLLLGLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQL
.. : :: . :: : ... : : .. ..
CCDS99 MSPGLLLLGSAVLLAFGLCCTFVHR-ARSRYEHI
10 20 30
70 80 90 100 110
pF1KE1 PAGVKSPPYIFSPIPFLGHAIAFGKSPIE--FLENAYEKYGPVFSFTMVGKTFTYLLGSD
: : : .... .: . . : .. ::. : .::::: .. :: . . . .
CCDS99 P-GPPRPSFLLGHLPCFWKKDEVGGRVLQDVFLDWA-KKYGPVVRVNVFHKTSVIVTSPE
40 50 60 70 80 90
120 130 140 150 160 170
pF1KE1 AAALLFNSKNEDLNAEDVYSRLTTP----VFGKGVAYDVPNPVFLEQKKMLKSGLNIAHF
.. .. : . . ... .: : : .::.:.. . . .:.... ... . .
CCDS99 SVKKFLMSTKYNKDSK-MYRALQTVFGERLFGQGLVSECNYERWHKQRRVIDLAFSRSSL
100 110 120 130 140 150
180 190 200 210 220
pF1KE1 KQHVSIIEKETKEYFESWGESGEKNVFEALSELIILTASHCL----HGKEI------RSQ
. . ....... : ... .. ...... :: : : : ..
CCDS99 VSLMETFNEKAEQLVEILEAKADGQTPVSMQDMLTYTAMDILAKAAFGMETSMLLGAQKP
160 170 180 190 200 210
230 240 250 260 270 280
pF1KE1 LNEKVAQLYADLDGGFSHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQSQEKI
:.. : . . .. . : .::: ..:. .. : .... .:.::.. ..
CCDS99 LSQAVKLMLEGITASRNTLAKFLPG--KRKQLREVRESIRFLRQVGRDWVQRRREALKRG
220 230 240 250 260
290 300 310 320 330 340
pF1KE1 DDILQTLLDATYKDGRPLTDDEVAGML---IGLLLAGQHTSSTTSAWMGFFLARDKTLQK
... .: : . ::: :.: . ...::..::.. :. . :.:. .
CCDS99 EEVPADILTQILKAEEGAQDDE--GLLDNFVTFFIAGHETSANHLAFTVMELSRQPEIVA
270 280 290 300 310 320
350 360 370 380 390 400
pF1KE1 KCYLEQKTVCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTI
. : : : . : ...: :. :.. .::.::: ::. .:. . . : .
CCDS99 RLQAEVDEVIGSKRY-LDFEDLGRLQYLSQVLKESLRLYPPAWGTFRLLEEETLIDGVRV
330 340 350 360 370 380
410 420 430 440 450 460
pF1KE1 PPGHQVCVSPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFA
: . . : : :. . . : :::::. : .:.: ::. :.. :::..::
CCDS99 PGNTPLLFSTYVMGRMDTYFEDPLTFNPDRFGPGAPK--PRFTYFPFSLGHRSCIGQQFA
390 400 410 420 430 440
470 480 490 500
pF1KE1 YVQIKTIWSTMLRLYEFDLIDGY-FPTVNYTTMIHTPENPVIRYKRRSK
...:.. . .:. :: :. : : . .:. : .::.
CCDS99 QMEVKVVMAKLLQRLEFRLVPGQRFGLQEQATL--KPLDPVLCTLRPRGWQPAPPPPPC
450 460 470 480 490 500
>>CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 (503 aa)
initn: 309 init1: 224 opt: 343 Z-score: 413.5 bits: 86.1 E(32554): 1e-16
Smith-Waterman score: 413; 23.6% identity (53.1% similar) in 484 aa overlap (41-502:16-490)
20 30 40 50 60 70
pF1KE1 GLLQAGGSVLGQAMEKVTGGNLLSMLLIACAFTLSLVYLIRLAAGHLVQLPAGVKSPPYI
: .: :.:: . : . :. .:
CCDS56 MALIPDLAMETWLLLAVSLVLLYLYGTHSHGLFK-KLGIPGP---
10 20 30 40
80 90 100 110 120 130
pF1KE1 FSPIPFLGHAIAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNED
.:.::::. ... :. : . ..::: :..: . . : .. .. .
CCDS56 -TPLPFLGNILSYHKGFCMFDMECHKKYGKVWGFYDGQQPVLAITDPDMIKTVLVKECYS
50 60 70 80 90 100
140 150 160 170 180
pF1KE1 LNAEDVYSRLTTPV-FGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETK---
. .. : :: : :.. . . . . ...:. .. ...:. : :: .
CCDS56 VFTN---RRPFGPVGFMKSAISIAEDEEWKRLRSLLSPTFTSGKLKEMVPIIAQYGDVLV
110 120 130 140 150
190 200 210 220 230
pF1KE1 EYFESWGESGE----KNVFEALSELIILTASHCLHGKEIRSQLNEKVAQ----LYADLDG
. .. .:.:. :.:: : : .: ..: .. . . . : . : :.
CCDS56 RNLRREAETGKPVTLKDVFGAYSMDVITSTSFGVNIDSLNNPQDPFVENTKKLLRFDFLD
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE1 GFSHAAWLLPGWLPLPSFRRRDRAHREIKDIFYKAIQKRRQS-----QEKIDDILQTLLD
: . ..: .:. ::. ... :.... ..: :.. :.:: ..:
CCDS56 PFFLSITVFPFLIPILEVLNICVFPREVTNFLRKSVKRMKESRLEDTQKHRVDFLQLMID
220 230 240 250 260 270
300 310 320 330 340
pF1KE1 ATY----KDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKT
. .. . :.: :.... : ...:: .:.:.. ... . :: .:.: : .
CCDS56 SQNSKETESHKALSDLELVAQSIIFIFAGYETTSSVLSFIMYELATHPDVQQKLQEEIDA
280 290 300 310 320 330
350 360 370 380 390 400
pF1KE1 VCGENLPPLTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVAGYTIPPGHQVCV
: .. :: ::: . ... :: ..::::: : .: . :. . . :. :: : : .
CCDS56 VLPNKAPP-TYDTVLQMEYLDMVVNETLRLFPIAMRLERVCKKDVEINGMFIPKGVVVMI
340 350 360 370 380 390
410 420 430 440 450 460
pF1KE1 SPTVNQRLKDSWVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIW
. .: :.: : :.:. . : . . . :.:::.: . ::: :: ...:
CCDS56 PSYALHRDPKYWTEPEKFLPERFSKKNKDNIDPYIYTPFGSGPRNCIGMRFALMNMKLAL
400 410 420 430 440 450
470 480 490 500
pF1KE1 STMLRLYEFD-LIDGYFPTVNYTTMIHTPENPVIRYKRRSK
.:. . : . .: . ::.::.
CCDS56 IRVLQNFSFKPCKETQIPLKLSLGGLLQPEKPVVLKVESRDGTVSGA
460 470 480 490 500
>>CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 (524 aa)
initn: 185 init1: 105 opt: 341 Z-score: 410.8 bits: 85.6 E(32554): 1.5e-16
Smith-Waterman score: 404; 23.0% identity (56.7% similar) in 404 aa overlap (111-486:98-498)
90 100 110 120 130 140
pF1KE1 IAFGKSPIEFLENAYEKYGPVFSFTMVGKTFTYLLGSDAAALLFNSKNEDLNAEDVYSRL
: : :. . :.. .... :.
CCDS42 TPTEEGLKNSTQMSATYSQGFTVWLGPIIPFIVLCHPDTIRSITNASAAIAPKDNLFIRF
70 80 90 100 110 120
150 160 170 180 190
pF1KE1 TTPVFGKGVAYDVPNPVFLEQKKMLKSGLNIAHFKQHVSIIEKETKEYFESWGE-----S
: .:.:. . . . ....:: .... .:....:..: .. ....: . :
CCDS42 LKPWLGEGILLSGGDK-WSRHRRMLTPAFHFNILKSYITIFNKSANIMLDKWQHLASEGS
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE1 GEKNVFEALSELIILTASHCL-----HGKEIRSQLNEKVAQLYADLDGGFSHAAWLLPGW
.. ..:: .: . . . ..:. : .: :. . .: : .. .: .
CCDS42 SRLDMFEHISLMTLDSLQKCIFSFDSHCQERPSEYIATILELSALVEKRSQHILQHMDFL
190 200 210 220 230 240
260 270 280 290
pF1KE1 LPLP-SFRRRDRAHREIKDIFYKAIQKRRQS--QEKIDDILQ------------TLLDAT
: . :: :: : ..:. .:..::.. . :::... .:: .
CCDS42 YYLSHDGRRFHRACRLVHDFTDAVIRERRRTLPTQGIDDFFKDKAKSKTLDFIDVLLLSK
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE1 YKDGRPLTDDEVAGMLIGLLLAGQHTSSTTSAWMGFFLARDKTLQKKCYLEQKTVCGENL
.::. :.:... . ....:. :... .:. . ::: :..: : . . .
CCDS42 DEDGKALSDEDIRAEADTFMFGGHDTTASGLSWVLYNLARHPEYQERCRQEVQELLKDRD
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE1 PP-LTYDQLKDLNLLDRCIKETLRLRPPVMIMMRMARTPQTVA-GYTIPPGHQVCVSPTV
: . .:.: .: .: :.::.:::.::. .. : .. : .:: : .:. .
CCDS42 PKEIEWDDLAQLPFLTMCVKESLRLHPPAPFISRCCTQDIVLPDGRVIPKG-ITCLIDII
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE1 NQRLKDS-WVERLDFNPDRYLQDNPASGEKFAYVPFGAGRHRCIGENFAYVQIKTIWSTM
. . . . : . ..: :. .: . .:..::.:: . :::. ::....:.. . :
CCDS42 GVHHNPTVWPDPEVYDPFRFDPENSKGRSPLAFIPFSAGPRNCIGQAFAMAEMKVVLALM
430 440 450 460 470 480
480 490 500
pF1KE1 LRLYEFDLIDGYFPTVNYTTMIHTPENPVIRYKRRSK
: ..: : : :
CCDS42 LLHFRF-LPDHTEPRRKLELIMRAEGGLWLRVEPLNVSLQ
490 500 510 520
509 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 00:06:47 2016 done: Mon Nov 7 00:06:47 2016
Total Scan time: 3.160 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]