FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4535, 446 aa
1>>>pF1KB4535 446 - 446 aa - 446 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5064+/-0.000695; mu= 16.4065+/- 0.042
mean_var=65.2111+/-12.775, 0's: 0 Z-trim(109.8): 76 B-trim: 0 in 0/51
Lambda= 0.158823
statistics sampled from 11085 (11161) to 11085 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.707), E-opt: 0.2 (0.343), width: 16
Scan time: 3.330
The best scores are: opt bits E(32554)
CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 2999 695.7 2.4e-200
CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 2201 512.9 3e-145
CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 954 227.1 3.1e-59
CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 906 216.2 6.7e-56
CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 875 209.0 6.9e-54
CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 876 209.3 7.4e-54
CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 875 209.0 7.4e-54
CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 875 209.0 8.5e-54
CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 875 209.0 8.5e-54
CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 873 208.6 1.2e-53
CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 868 207.4 2.6e-53
CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 857 204.9 1.5e-52
CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 840 201.0 2.2e-51
CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 832 199.2 7.8e-51
CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 832 199.2 7.8e-51
CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 823 197.1 3.3e-50
CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 821 196.7 4.5e-50
CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 819 196.2 6.2e-50
CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 759 182.5 8.7e-46
CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 671 162.3 8.9e-40
CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 648 157.0 4e-38
CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 627 152.2 1.2e-36
CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 620 150.6 3.4e-36
CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 538 131.8 1.4e-30
CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 537 131.6 1.8e-30
CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 500 123.1 6.4e-28
CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 385 96.8 5.2e-20
CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 364 92.0 1.6e-18
CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 347 88.1 2.3e-17
CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 347 88.1 2.4e-17
CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 345 87.6 3.1e-17
CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 343 87.1 4.3e-17
CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 342 86.9 5e-17
CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 335 85.2 1.2e-16
CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 334 85.0 1.4e-16
CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 328 83.7 4.6e-16
CCDS42517.1 CYP4F12 gene_id:66002|Hs108|chr19 ( 524) 328 83.7 4.8e-16
CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 327 83.5 5.5e-16
CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 326 83.3 6.7e-16
CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 316 81.0 3.1e-15
CCDS12336.1 CYP4F2 gene_id:8529|Hs108|chr19 ( 520) 313 80.3 5.2e-15
CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 307 78.9 1.3e-14
CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 305 78.4 1.9e-14
CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 299 77.1 4.6e-14
CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 299 77.1 4.6e-14
CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 299 77.1 4.7e-14
CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 299 77.1 4.7e-14
CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 299 77.1 4.7e-14
CCDS59362.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 297 76.6 6.6e-14
CCDS12332.1 CYP4F3 gene_id:4051|Hs108|chr19 ( 520) 297 76.6 6.6e-14
>>CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 (446 aa)
initn: 2999 init1: 2999 opt: 2999 Z-score: 3710.2 bits: 695.7 E(32554): 2.4e-200
Smith-Waterman score: 2999; 99.3% identity (99.8% similar) in 446 aa overlap (1-446:1-446)
10 20 30 40 50 60
pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ
::::::::::.:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MGLEALVPLAVIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQGRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQGRP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 FRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 FRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 HIPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HIPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 DENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQA
:::: :::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 DENLRIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 HMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 PFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTG
370 380 390 400 410 420
430 440
pF1KB4 QPRPSHHGVFAFLVTPSPYELCAVPR
::::::::::::::.:::::::::::
CCDS33 QPRPSHHGVFAFLVSPSPYELCAVPR
430 440
>>CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 (497 aa)
initn: 2201 init1: 2201 opt: 2201 Z-score: 2721.3 bits: 512.9 E(32554): 3e-145
Smith-Waterman score: 2782; 88.9% identity (89.1% similar) in 478 aa overlap (20-446:20-497)
10 20 30 40 50 60
pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ
:::::::::::::::::::::::::::::::::::::::::
CCDS46 MGLEALVPLAVIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ
10 20 30 40 50 60
70 80 90 100 110
pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQG--
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQILGFGPRSQGVF
70 80 90 100 110 120
120
pF1KB4 -------------------------------------------------RPFRPNGLLDK
:::::::::::
CCDS46 LARYGPAWREQRRFSVSTLRNLGLGKKSLEQWVTEEAACLCAAFANHSGRPFRPNGLLDK
130 140 150 160 170 180
130 140 150 160 170 180
pF1KB4 AVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLHIPALAGKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 AVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLHIPALAGKV
190 200 210 220 230 240
190 200 210 220 230 240
pF1KB4 LRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::: ::::
CCDS46 LRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLRIVVA
250 260 270 280 290 300
250 260 270 280 290 300
pF1KB4 DLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 DLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVI
310 320 330 340 350 360
310 320 330 340 350 360
pF1KB4 HEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 HEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHF
370 380 390 400 410 420
370 380 390 400 410 420
pF1KB4 LDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGV
430 440 450 460 470 480
430 440
pF1KB4 FAFLVTPSPYELCAVPR
:::::.:::::::::::
CCDS46 FAFLVSPSPYELCAVPR
490
>>CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 (502 aa)
initn: 1023 init1: 628 opt: 954 Z-score: 1177.0 bits: 227.1 E(32554): 3.1e-59
Smith-Waterman score: 1075; 38.4% identity (64.9% similar) in 479 aa overlap (16-446:28-501)
10 20 30 40
pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLH
::: .:...::. ::::: :: :::..
CCDS61 MLAAMGSLAAALWAVVHPRTLLLGTVAFLLAADFLKRRR--PKNYPPGPWRLPFLGNFFL
10 20 30 40 50
50 60 70 80 90 100
pF1KB4 VDFQNTPYCFDQLRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQ
:::... . . ...:..:::.:. .:...:: ..:::. .. ..:: .:. .
CCDS61 VDFEQSHLEVQLFVKKYGNLFSLELGDISAVLITGLPLIKEALIHMDQNFGNRPVTPMRE
60 70 80 90 100 110
110 120
pF1KB4 IL----------------------------GFGPRS-------------------QGRPF
. :.: .: .:.::
CCDS61 HIFKKNGLIMSSGQAWKEQRRFTLTALRNFGLGKKSLEERIQEEAQHLTEAIKEENGQPF
120 130 140 150 160 170
130 140 150 160 170 180
pF1KB4 RPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVP-VLL
:. ...::::.: :.: :.::::.: : .:: : .: :.. .. :. : ..
CCDS61 DPHFKINNAVSNIICSITFGERFEYQDSWFQQLLKLLDEVTYLEASKTCQLYNVFPWIMK
180 190 200 210 220 230
190 200 210 220 230 240
pF1KB4 HIPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFN
.:. .. : . ..... .:: :.::. ::. .:.: :: : ::: :::.
CCDS61 FLPGPHQTLFSNWKKLKLFVSHMIDKHRKDWNPAET-RDFIDAYLKEMSKHTGNPTSSFH
240 250 260 270 280 290
250 260 270 280 290 300
pF1KB4 DENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQA
.::: . ::: :: :::::: :.:: : :.:..:..:: ::: :::: ..: . .
CCDS61 EENLICSTLDLFFAGTETTSTTLRWALLYMALYPEIQEKVQAEIDRVIGQGQQPSTAARE
300 310 320 330 340 350
310 320 330 340 350 360
pF1KB4 HMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEK
::::.::::::::.:.:.::.: . .. : . :...:::: ..:::... .: . :
CCDS61 SMPYTNAVIHEVQRMGNIIPLNVPREVTVDTTLAGYHLPKGTMILTNLTALHRDPTEWAT
360 370 380 390 400 410
370 380 390 400 410 420
pF1KB4 PFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTG
: :.:.:::. .:.: : :::.::: :.:::::: ::: :::.:::::.:.:.: :..
CCDS61 PDTFNPDHFLE-NGQFKKREAFMPFSIGKRACLGEQLARTELFIFFTSLMQKFTFRPPNN
420 430 440 450 460 470
430 440
pF1KB4 QPRPSHHGVFAFLVTPSPYELCAVPR
. . : . ... ..: ..:::::.
CCDS61 E-KLSLKFRMGITISPVSHRLCAVPQV
480 490 500
>>CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 (544 aa)
initn: 1030 init1: 693 opt: 906 Z-score: 1117.0 bits: 216.2 E(32554): 6.7e-56
Smith-Waterman score: 940; 38.2% identity (65.3% similar) in 432 aa overlap (60-441:109-539)
30 40 50 60 70 80
pF1KB4 AARYPPGPLPLPGLGNLLHVDFQNTPYCFDQLRRRFGDVFSLQLAWTPVVVLNGLAAVRE
.: : .:..::. .. ::::. . .:::
CCDS34 PFLRRRSWLSSRTRAAGIDPSVIGPQVLLAHLARVYGSIFSFFIGHYLVVVLSDFHSVRE
80 90 100 110 120 130
90 100 110
pF1KB4 ALVTHGEDTADRPPVPITQILG---------FGP--RSQ-------------GR------
::: ..: .::: ::. .:. .:: :.: :.
CCDS34 ALVQQAEVFSDRPRVPLISIVTKEKGVVFAHYGPVWRQQRKFSHSTLRHFGLGKLSLEPK
140 150 160 170 180 190
120 130 140 150 160
pF1KB4 ------------------PFRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEG
:: : .....::::.: :: :.::.: . .: ..: . ..:
CCDS34 IIEEFKYVKAEMQKHGEDPFCPFSIISNAVSNIICSLCFGQRFDYTNSEFKKMLGFMSRG
200 210 220 230 240 250
170 180 190 200 210 220
pF1KB4 LKEESGFLREVLNAVPVLLHIPALAGKVLR-FQKAFLTQLDELLTEHRMTWDPAQPPRDL
:. . ..: : : ..: : :: ..: . . : ... .:. . : . :.:.
CCDS34 LEICLNSQVLLVNICPWLYYLPFGPFKELRQIEKDITSFLKKIIKDHQESLD-RENPQDF
260 270 280 290 300 310
230 240 250 260 270
pF1KB4 TEAFLAEMEKA-KGNPESSFNDENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRR
. .: .::. :.: .:::..: : ...::: :: ::...: : :: : :.::::..
CCDS34 IDMYLLHMEEERKNNSNSSFDEEYLFYIIGDLFIAGTDTTTNSLLWCLLYMSLNPDVQEK
320 330 340 350 360 370
280 290 300 310 320 330
pF1KB4 VQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIP
:..::. ::: : : . :.:.:::: :.: ::::. .:::.. ::::.. .::. ::
CCDS34 VHEEIERVIGANRAPSLTDKAQMPYTEATIMEVQRLTVVVPLAIPHMTSENTVLQGYTIP
380 390 400 410 420 430
340 350 360 370 380 390
pF1KB4 KGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLAR
::: .. :: :: .: :.:::: :.:..::: ::...: :.:.::. :.:.:.:: ::.
CCDS34 KGTLILPNLWSVHRDPAIWEKPEDFYPNRFLDDQGQLIKKETFIPFGIGKRVCMGEQLAK
440 450 460 470 480 490
400 410 420 430 440
pF1KB4 MELFLFFTSLLQHFSFSVPTGQPRPSHHGVFAFLVTPSPYELCAVPR
:::::.:.::.: :.:..: . .: : :.. ..: :...
CCDS34 MELFLMFVSLMQSFAFALPEDSKKPLLTGRFGLTLAPHPFNITISRR
500 510 520 530 540
>>CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 (388 aa)
initn: 777 init1: 777 opt: 875 Z-score: 1080.9 bits: 209.0 E(32554): 6.9e-54
Smith-Waterman score: 875; 42.9% identity (68.2% similar) in 333 aa overlap (115-445:56-387)
90 100 110 120 130 140
pF1KB4 AAVREALVTHGEDTADRPPVPITQILGFGPRSQGRPFRPNGLLDKAVSNVIASLTCGRRF
.... : :. .: : ::: :.. .::
CCDS55 LTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKASPCDPTFILGCAPCNVICSVVFQKRF
30 40 50 60 70 80
150 160 170 180 190 200
pF1KB4 EYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLH-IPALAGKVLRFQKAFLTQLDEL
.: : :: :. .:... .. .: : :.:. .:. .:::. . . :
CCDS55 DYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLLIDCFPGTHNKVLKNVALTRSYIREK
90 100 110 120 130 140
210 220 230 240 250 260
pF1KB4 LTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVADLFSAGMVTTSTTL
. ::. . : .. :::. . :: .::. : : .: :: ::: .::::: :: ::::::
CCDS55 VKEHQASLD-VNNPRDFIDCFLIKMEQEKDNQKSEFNIENLVGTVADLFVAGTETTSTTL
150 160 170 180 190 200
270 280 290 300 310 320
pF1KB4 AWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEVQRFGDIVPLGV
.::::.. ::.: .::.::: :::. : : : :..::::: ::.::.::..:.:: ::
CCDS55 RYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQDRSHMPYTDAVVHEIQRYSDLVPTGV
210 220 230 240 250 260
330 340 350 360 370 380
pF1KB4 THMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDAQGHFVKPEAFL
: .. : . ... ::::::... :.:::.:. . .: : : :::: .:.: : . :.
CCDS55 PHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEFPNPNIFDPGHFLDKNGNFKKSDYFM
270 280 290 300 310 320
390 400 410 420 430 440
pF1KB4 PFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGVFAFLVT-PSPYELC
:::::.: : :: :::::::::.:..::.:... . .: .:. : :..:
CCDS55 PFSAGKRICAGEGLARMELFLFLTTILQNFNLKSVDDLKNLNTTAVTKGIVSLPPSYQIC
330 340 350 360 370 380
pF1KB4 AVPR
.:
CCDS55 FIPV
>>CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 (501 aa)
initn: 1098 init1: 843 opt: 876 Z-score: 1080.4 bits: 209.3 E(32554): 7.4e-54
Smith-Waterman score: 967; 37.7% identity (63.2% similar) in 475 aa overlap (26-446:32-501)
10 20 30 40 50
pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNT-
.:: .:::: :: .::. . ..
CCDS78 WKLWRAEEGAAALGGALFLLLFALGVRQLLKQRRPMGFPPGPPGLPFIGNIYSLAASSEL
10 20 30 40 50 60
60 70 80 90 100
pF1KB4 PYCFDQLRRR---FGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPI----T
:. . .:.. .:..:::.:. .::::: .:.: :: ..: :::: .:. :
CCDS78 PHVY--MRKQSQVYGEIFSLDLGGISTVVLNGYDVVKECLVHQSEIFADRPCLPLFMKMT
70 80 90 100 110
110 120
pF1KB4 QI-------------------------LGFGPRS-------------------QGRPFRP
.. .:.: .: .::::
CCDS78 KMGGLLNSRYGRGWVDHRRLAVNSFRYFGYGQKSFESKILEETKFFNDAIETYKGRPFDF
120 130 140 150 160 170
130 140 150 160 170 180
pF1KB4 NGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLHIP
. :. .::::. . :.:: :.: : ....: .:... .. . :: : . .:
CCDS78 KQLITNAVSNITNLIIFGERFTYEDTDFQHMIELFSENVELAASASVFLYNAFPWIGILP
180 190 200 210 220 230
190 200 210 220 230 240
pF1KB4 ALAGKVLRFQKAFLTQ--LDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFND
. : :..: .. :..:. . .. : : :. ...:.: ::...:..: :.:.
CCDS78 FGKHQQL-FRNAAVVYDFLSRLIEKASVNRKP-QLPQHFVDAYLDEMDQGKNDPSSTFSK
240 250 260 270 280 290
250 260 270 280 290 300
pF1KB4 ENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAH
::: . :..:. :: ::...: :..:.: :.:..: .::.::: ..: .: :. .
CCDS78 ENLIFSVGELIIAGTETTTNVLRWAILFMALYPNIQGQVQKEIDLIMGPNGKPSWDDKCK
300 310 320 330 340 350
310 320 330 340 350 360
pF1KB4 MPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKP
:::: ::.::: :: .:::::. : ::.: :.:. ::::::.:::: :: :: :. :
CCDS78 MPYTEAVLHEVLRFCNIVPLGIFHATSEDAVVRGYSIPKGTTVITNLYSVHFDEKYWRDP
360 370 380 390 400 410
370 380 390 400 410 420
pF1KB4 FRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQ
::::.:::..:.:.: ::..::: ::: :::: :::::.:::::.:::.: . : .
CCDS78 EVFHPERFLDSSGYFAKKEALVPFSLGRRHCLGEHLARMEMFLFFTALLQRFHLHFPH-E
420 430 440 450 460 470
430 440
pF1KB4 PRPSHHGVFAFLVTPSPYELCAVPR
:. . ... . :.:: .:: :
CCDS78 LVPDLKPRLGMTLQPQPYLICAERR
480 490 500
>>CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 (420 aa)
initn: 853 init1: 777 opt: 875 Z-score: 1080.4 bits: 209.0 E(32554): 7.4e-54
Smith-Waterman score: 885; 38.8% identity (61.0% similar) in 418 aa overlap (77-445:3-419)
50 60 70 80 90 100
pF1KB4 LHVDFQNTPYCFDQLRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPI
:.::..: ::.:::. .::. . : ::
CCDS73 MNPIVVFHGYEAVKEALIDNGEEFSGRGNSPI
10 20 30
110
pF1KB4 TQIL----------------------------GFGPRS-------------------QGR
.: . :.: :: ..
CCDS73 SQRITKGLGIISSNGKRWKEIRRFSLTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKAS
40 50 60 70 80 90
120 130 140 150 160 170
pF1KB4 PFRPNGLLDKAVSNVIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVL
: :. .: : ::: :.. .::.: : :: :. .:... .. .: : :.:
CCDS73 PCDPTFILGCAPCNVICSVVFQKRFDYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLL
100 110 120 130 140 150
180 190 200 210 220 230
pF1KB4 LH-IPALAGKVLRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESS
. .:. .:::. . . : . ::. . : .. :::. . :: .::. : : .:
CCDS73 IDCFPGTHNKVLKNVALTRSYIREKVKEHQASLD-VNNPRDFIDCFLIKMEQEKDNQKSE
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB4 FNDENLCIVVADLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGD
:: ::: .::::: :: :::::: .::::.. ::.: .::.::: :::. : : : :
CCDS73 FNIENLVGTVADLFVAGTETTSTTLRYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQD
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB4 QAHMPYTTAVIHEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVW
..::::: ::.::.::..:.:: :: : .. : . ... ::::::... :.:::.:. .
CCDS73 RSHMPYTDAVVHEIQRYSDLVPTGVPHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEF
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB4 EKPFRFHPEHFLDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVP
.: : : :::: .:.: : . :.:::::.: : :: :::::::::.:..::.:...
CCDS73 PNPNIFDPGHFLDKNGNFKKSDYFMPFSAGKRICAGEGLARMELFLFLTTILQNFNLKSV
340 350 360 370 380 390
420 430 440
pF1KB4 TGQPRPSHHGVFAFLVT-PSPYELCAVPR
. .: .:. : :..: .:
CCDS73 DDLKNLNTTAVTKGIVSLPPSYQICFIPV
400 410 420
>>CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 (490 aa)
initn: 993 init1: 777 opt: 875 Z-score: 1079.3 bits: 209.0 E(32554): 8.5e-54
Smith-Waterman score: 1023; 38.0% identity (61.6% similar) in 479 aa overlap (16-445:13-489)
10 20 30 40 50 60
pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ
:.:: .: .. : . :::: ::: .::.:..: .. : .
CCDS74 MEPFVVLVLCLSFMLLFSLWRQSCR-RRKLPPGPTPLPIIGNMLQIDVKDICKSFTN
10 20 30 40 50
70 80 90 100 110
pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPITQIL----------
. . .: ::.. .. .:.::..: ::.:::. .::. . : ::.: .
CCDS74 FSKVYGPVFTVYFGMNPIVVFHGYEAVKEALIDNGEEFSGRGNSPISQRITKGLGIISSN
60 70 80 90 100 110
120 130
pF1KB4 ------------------GFGPRS-------------------QGRPFRPNGLLDKAVSN
:.: :: .. : :. .: : :
CCDS74 GKRWKEIRRFSLTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKASPCDPTFILGCAPCN
120 130 140 150 160 170
140 150 160 170 180 190
pF1KB4 VIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLH-IPALAGKVLRF
:: :.. .::.: : :: :. .:... .. .: : :.:. .:. .:::.
CCDS74 VICSVVFQKRFDYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLLIDCFPGTHNKVLKN
180 190 200 210 220 230
200 210 220 230 240 250
pF1KB4 QKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVADLF
. . : . ::. . : .. :::. . :: .::. : : .: :: ::: .:::::
CCDS74 VALTRSYIREKVKEHQASLD-VNNPRDFIDCFLIKMEQEKDNQKSEFNIENLVGTVADLF
240 250 260 270 280 290
260 270 280 290 300 310
pF1KB4 SAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEV
:: :::::: .::::.. ::.: .::.::: :::. : : : :..::::: ::.::.
CCDS74 VAGTETTSTTLRYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQDRSHMPYTDAVVHEI
300 310 320 330 340 350
320 330 340 350 360 370
pF1KB4 QRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDA
::..:.:: :: : .. : . ... ::::::... :.:::.:. . .: : : ::::
CCDS74 QRYSDLVPTGVPHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEFPNPNIFDPGHFLDK
360 370 380 390 400 410
380 390 400 410 420 430
pF1KB4 QGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPRPSHHGVFAF
.:.: : . :.:::::.: : :: :::::::::.:..::.:... . .:
CCDS74 NGNFKKSDYFMPFSAGKRICAGEGLARMELFLFLTTILQNFNLKSVDDLKNLNTTAVTKG
420 430 440 450 460 470
440
pF1KB4 LVT-PSPYELCAVPR
.:. : :..: .:
CCDS74 IVSLPPSYQICFIPV
480 490
>>CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 (491 aa)
initn: 979 init1: 768 opt: 875 Z-score: 1079.3 bits: 209.0 E(32554): 8.5e-54
Smith-Waterman score: 980; 37.8% identity (61.6% similar) in 487 aa overlap (13-446:13-491)
10 20 30 40 50 60
pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWAARYPPGPLPLPGLGNLLHVDFQNTPYCFDQ
.:. ::. : : . .. :::: :: ::::: . :. . .
CCDS12 MDSISTAILLLLLALVCLLLTLSSRDK---GKLPPGPRPLSILGNLLLLCSQDMLTSLTK
10 20 30 40 50
70 80 90 100
pF1KB4 LRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPPVPI--------------
: ...:......:. ::::.: ::.:::: .::. . : :
CCDS12 LSKEYGSMYTVHLGPRRVVVLSGYQAVKEALVDQGEEFSGRGDYPAFFNFTKGNGIAFSS
60 70 80 90 100 110
110 120 130
pF1KB4 -----------TQIL---GFGPRS-------------------QGRPFRPNGLLDKAVSN
::: :.: :: .:.:: :. .:...:::
CCDS12 GDRWKVLRQFSIQILRNFGMGKRSIEERILEEGSFLLAELRKTEGEPFDPTFVLSRSVSN
120 130 140 150 160 170
140 150 160 170 180 190
pF1KB4 VIASLTCGRRFEYDDPRFLRLLDLAQEGLKEESGFLREVLNAVPVLLH-IPALAGKVLRF
.: :. : ::.::: :.: .. : ..... :. :. . : :: .:. ....
CCDS12 IICSVLFGSRFDYDDERLLTIIRLINDNFQIMSSPWGELYDIFPSLLDWVPGPHQRIFQN
180 190 200 210 220 230
200 210 220 230 240 250
pF1KB4 QKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVADLF
: . . . . .:. . :: . :::. . ::..: . : .: : :. ..: ... .:.
CCDS12 FKCLRDLIAHSVHDHQASLDP-RSPRDFIQCFLTKMAEEKEDPLSHFHMDTLLMTTHNLL
240 250 260 270 280 290
260 270 280 290 300 310
pF1KB4 SAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVIHEV
.: :.:::: ..: .. .: :: :::.::: :.:..: : . :.: :::: ::::::
CCDS12 FGGTKTVSTTLHHAFLALMKYPKVQARVQEEIDLVVGRARLPALKDRAAMPYTDAVIHEV
300 310 320 330 340 350
320 330 340 350 360 370
pF1KB4 QRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHFLDA
:::.::.:... : ..:: .:: ::::: .:: :..: : . . : .:.:::::::
CCDS12 QRFADIIPMNLPHRVTRDTAFRGFLIPKGTDVITLLNTVHYDPSQFLTPQEFNPEHFLDA
360 370 380 390 400 410
380 390 400 410 420
pF1KB4 QGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPR-----PSHH
. : : ::.::::::: :::: ::::::::..:..:: ::.. : : :. :
CCDS12 NQSFKKSPAFMPFSAGRRLCLGESLARMELFLYLTAILQSFSLQ-PLGAPEDIDLTPLSS
420 430 440 450 460 470
430 440
pF1KB4 GVFAFLVTPSPYELCAVPR
:. . : :..:: ::
CCDS12 GLGNL---PRPFQLCLRPR
480 490
>>CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 (494 aa)
initn: 953 init1: 767 opt: 873 Z-score: 1076.8 bits: 208.6 E(32554): 1.2e-53
Smith-Waterman score: 957; 36.1% identity (63.5% similar) in 477 aa overlap (26-446:25-494)
10 20 30 40 50
pF1KB4 MGLEALVPLAMIVAIFLLLVDLMHRRQRWA-ARYPPGPLPLPGLGNLLHVDFQNTPYCFD
::: . .. :::: ::: .:: :... .. .
CCDS12 MLASGLLLVTLLACLTVMVLMSVWRQRKSRGKLPPGPTPLPFIGNYLQLNTEQMYNSLM
10 20 30 40 50
60 70 80 90 100
pF1KB4 QLRRRFGDVFSLQLAWTPVVVLNGLAAVREALVTHGEDTADRPP----------------
.. .:.: ::...:. :::: : ::.:::: ..:. . :
CCDS12 KISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKGYGVAFS
60 70 80 90 100 110
110 120 130
pF1KB4 ----------VPITQILGFGPRSQGRPFR---------------------PNGLLDKAVS
:. . ::: ..: : :. .:...::
CCDS12 NGERAKQLRRFSIATLRGFGVGKRGIEERIQEEAGFLIDALRGTHGANIDPTFFLSRTVS
120 130 140 150 160 170
140 150 160 170 180
pF1KB4 NVIASLTCGRRFEYDDPRFLRLLDLAQEGLK---EESGFLREVLNAVPVLLHIPALAGKV
:::.:.. : ::.:.: .:: :: . ... .: : :....: . :.:. ..
CCDS12 NVISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEMFSSV--MKHLPGPQQQA
180 190 200 210 220 230
190 200 210 220 230 240
pF1KB4 LRFQKAFLTQLDELLTEHRMTWDPAQPPRDLTEAFLAEMEKAKGNPESSFNDENLCIVVA
.. ... . . . ... : :: . :::. ..:: .:.. . ::.. : .:: ...
CCDS12 FKELQGLEDFIAKKVEHNQRTLDP-NSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTL
240 250 260 270 280 290
250 260 270 280 290 300
pF1KB4 DLFSAGMVTTSTTLAWGLLLMILHPDVQRRVQQEIDDVIGQVRRPEMGDQAHMPYTTAVI
.:: :: :.:::: .:.::.. ::.:. .:..::: :::. :.:.. :.:.:::: :::
CCDS12 NLFFAGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYTEAVI
300 310 320 330 340 350
310 320 330 340 350 360
pF1KB4 HEVQRFGDIVPLGVTHMTSRDIEVQGFRIPKGTTLITNLSSVLKDEAVWEKPFRFHPEHF
::.:::::..:.:..: ...: . . : .:::: .. :.:::.: . .: :.:.::
CCDS12 HEIQRFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVLRDPRFFSNPRDFNPQHF
360 370 380 390 400 410
370 380 390 400 410 420
pF1KB4 LDAQGHFVKPEAFLPFSAGRRACLGEPLARMELFLFFTSLLQHFSFSVPTGQPR-----P
:: .:.: : .::.::: :.: :.:: :::::::::::...:.: :. : . :. :
CCDS12 LDKKGQFKKSDAFVPFSIGKRYCFGEGLARMELFLFFTTIMQNFRFKSPQS-PKDIDVSP
420 430 440 450 460 470
430 440
pF1KB4 SHHGVFAFLVTPSPYELCAVPR
.: : : . : : . .::
CCDS12 KHVG---FATIPRNYTMSFLPR
480 490
446 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 03:02:43 2016 done: Fri Nov 4 03:02:44 2016
Total Scan time: 3.330 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]