FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5659, 493 aa 1>>>pF1KE5659 493 - 493 aa - 493 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4885+/-0.000869; mu= 16.9031+/- 0.052 mean_var=66.6053+/-13.161, 0's: 0 Z-trim(106.6): 80 B-trim: 0 in 0/51 Lambda= 0.157152 statistics sampled from 8970 (9052) to 8970 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.657), E-opt: 0.2 (0.278), width: 16 Scan time: 2.760 The best scores are: opt bits E(32554) CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 ( 493) 3355 769.7 0 CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 ( 490) 2015 465.9 4.5e-131 CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 490) 1988 459.7 3.2e-129 CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 ( 490) 1972 456.1 3.9e-128 CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 490) 1938 448.4 8.1e-126 CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 420) 1694 393.1 3.2e-109 CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 ( 491) 1671 387.9 1.4e-107 CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 ( 494) 1611 374.3 1.7e-103 CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 ( 494) 1610 374.0 2e-103 CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 ( 388) 1586 368.6 7e-102 CCDS12570.1 CYP2B6 gene_id:1555|Hs108|chr19 ( 491) 1576 366.3 4.2e-101 CCDS12569.1 CYP2A7 gene_id:1549|Hs108|chr19 ( 494) 1553 361.1 1.6e-99 CCDS12573.1 CYP2S1 gene_id:29785|Hs108|chr19 ( 504) 1318 307.8 1.7e-83 CCDS613.1 CYP2J2 gene_id:1573|Hs108|chr1 ( 502) 1272 297.4 2.4e-80 CCDS46721.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 497) 1196 280.2 3.6e-75 CCDS5319.2 CYP2W1 gene_id:54905|Hs108|chr7 ( 490) 1154 270.7 2.6e-72 CCDS7818.1 CYP2R1 gene_id:120227|Hs108|chr11 ( 501) 1067 250.9 2.3e-66 CCDS34047.1 CYP2U1 gene_id:113612|Hs108|chr4 ( 544) 963 227.4 3.1e-59 CCDS44460.1 CYP2C18 gene_id:1562|Hs108|chr10 ( 431) 930 219.8 4.6e-57 CCDS33657.1 CYP2D6 gene_id:1565|Hs108|chr22 ( 446) 848 201.3 1.9e-51 CCDS7541.1 CYP17A1 gene_id:1586|Hs108|chr10 ( 508) 686 164.6 2.4e-40 CCDS4735.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 495) 683 163.9 3.7e-40 CCDS32293.1 CYP1A2 gene_id:1544|Hs108|chr15 ( 516) 611 147.6 3.2e-35 CCDS10268.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 512) 607 146.7 5.9e-35 CCDS1793.1 CYP1B1 gene_id:1545|Hs108|chr2 ( 543) 565 137.1 4.5e-32 CCDS47406.1 CYP21A2 gene_id:1589|Hs108|chr6 ( 465) 559 135.7 1e-31 CCDS5676.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 503) 447 110.4 4.8e-24 CCDS5675.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 504) 444 109.7 7.7e-24 CCDS5674.1 CYP3A4 gene_id:1576|Hs108|chr7 ( 503) 436 107.9 2.7e-23 CCDS5672.1 CYP3A5 gene_id:1577|Hs108|chr7 ( 502) 431 106.7 5.9e-23 CCDS33491.1 CYP24A1 gene_id:1591|Hs108|chr20 ( 514) 422 104.7 2.5e-22 CCDS5673.1 CYP3A7 gene_id:1551|Hs108|chr7 ( 503) 407 101.3 2.6e-21 CCDS75639.1 CYP3A51P gene_id:100861540|Hs108|chr7 ( 535) 407 101.3 2.7e-21 CCDS81906.1 CYP1A1 gene_id:1543|Hs108|chr15 ( 483) 394 98.3 1.9e-20 CCDS34119.1 CYP4V2 gene_id:285440|Hs108|chr4 ( 525) 376 94.3 3.5e-19 CCDS5677.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 420) 359 90.4 4.2e-18 CCDS33285.1 CYP27C1 gene_id:339761|Hs108|chr2 ( 372) 353 89.0 9.6e-18 CCDS64723.1 CYP3A43 gene_id:64816|Hs108|chr7 ( 393) 344 87.0 4.2e-17 CCDS8954.1 CYP27B1 gene_id:1594|Hs108|chr12 ( 508) 345 87.2 4.4e-17 CCDS544.1 CYP4X1 gene_id:260293|Hs108|chr1 ( 509) 323 82.3 1.4e-15 CCDS542.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 511) 321 81.8 1.9e-15 CCDS41328.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 512) 318 81.1 3.1e-15 CCDS2423.1 CYP27A1 gene_id:1593|Hs108|chr2 ( 531) 317 80.9 3.8e-15 CCDS81318.1 CYP4B1 gene_id:1580|Hs108|chr1 ( 497) 305 78.2 2.3e-14 CCDS9954.1 CYP46A1 gene_id:10858|Hs108|chr14 ( 500) 299 76.8 6e-14 CCDS6393.1 CYP11B2 gene_id:1585|Hs108|chr8 ( 503) 295 75.9 1.1e-13 CCDS12337.1 CYP4F11 gene_id:57834|Hs108|chr19 ( 524) 295 75.9 1.2e-13 CCDS6392.1 CYP11B1 gene_id:1584|Hs108|chr8 ( 503) 288 74.3 3.4e-13 CCDS10139.1 CYP19A1 gene_id:1588|Hs108|chr15 ( 503) 284 73.4 6.4e-13 CCDS545.1 CYP4Z1 gene_id:199974|Hs108|chr1 ( 505) 278 72.1 1.7e-12 >>CCDS7686.1 CYP2E1 gene_id:1571|Hs108|chr10 (493 aa) initn: 3355 init1: 3355 opt: 3355 Z-score: 4108.5 bits: 769.7 E(32554): 0 Smith-Waterman score: 3355; 99.6% identity (99.8% similar) in 493 aa overlap (1-493:1-493) 10 20 30 40 50 60 pF1KE5 MSALGVTVALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 MSALGVTVALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTRL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 AQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAFHAHRDRGIIFNNGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 AQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAFHAHRDRGIIFNNGP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 AWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNVI .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 TWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNVI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 ADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNVA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 EVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 EVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFAG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 TETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 TETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQRF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 ITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENGK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 FKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFGC :::::::::::::::::::::::: ::::::::::::::::::::::::::::::::::: CCDS76 FKYSDYFKPFSTGKRVCAGEGLARMELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFGC 430 440 450 460 470 480 490 pF1KE5 IPPRYKLCVIPRS ::::::::::::: CCDS76 IPPRYKLCVIPRS 490 >>CCDS7436.1 CYP2C19 gene_id:1557|Hs108|chr10 (490 aa) initn: 2009 init1: 1640 opt: 2015 Z-score: 2466.6 bits: 465.9 E(32554): 4.5e-131 Smith-Waterman score: 2015; 57.5% identity (85.2% similar) in 485 aa overlap (8-491:5-489) 10 20 30 40 50 60 pF1KE5 MSALGVTVALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTRL :.:.. . :::.:.::: . .::::: :::.:::..:...:.. ::.: : CCDS74 MDPFVVLVLCLSCLLLLSIWRQSSGRGKLPPGPTPLPVIGNILQIDIKDVSKSLTNL 10 20 30 40 50 70 80 90 100 110 pF1KE5 AQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLP-AFHAHRDRGIIFNNG .. .::::::: : .::::.:::..:::::.: .:::::: .: : .:.: ::.:.:: CCDS74 SKIYGPVFTLYFGLERMVVLHGYEVVKEALIDLGEEFSGRGHFPLAERANRGFGIVFSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 PAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNV ::.:::::: ::::.::::.. :.:.:.::. :.: ::::...: ::::..::::::: CCDS74 KRWKEIRRFSLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTKASPCDPTFILGCAPCNV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 IADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNV : .:.:.:.:::.:..:: :: .:::....::::.:. ::::... :.::.: :..::. CCDS74 ICSIIFQKRFDYKDQQFLNLMEKLNENIRIVSTPWIQICNNFPTIIDYFPGTHNKLLKNL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 AEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFA : .. . :.::::..:.: : :::. ::.:..:::::.. . .:......:.:::. : CCDS74 AFMESDILEKVKEHQESMDINNPRDFIDCFLIKMEKEKQNQQSEFTIENLVITAADLLGA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 GTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQR :::::::::::.::.:.:.::. :..:::.:::: .: : ..:: .::: ::::::.:: CCDS74 GTETTSTTLRYALLLLLKHPEVTAKVQEEIERVIGRNRSPCMQDRGHMPYTDAVVHEVQR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 FITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENG .: :.:..::: .: :. ::.:::::::... .: :::.::.:::.:: : :.:::.:.: CCDS74 YIDLIPTSLPHAVTCDVKFRNYLIPKGTTILTSLTSVLHDNKEFPNPEMFDPRHFLDEGG 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 KFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFG .:: :.:: :::.:::.:.:::::: ::::.: :::.:::: :.::::.: .:. ::. CCDS74 NFKKSNYFMPFSAGKRICVGEGLARMELFLFLTFILQNFNLKSLIDPKDLDTTPVVNGFA 420 430 440 450 460 470 480 490 pF1KE5 CIPPRYKLCVIPRS .:: :.:: :: CCDS74 SVPPFYQLCFIPV 480 490 >>CCDS7435.1 CYP2C18 gene_id:1562|Hs108|chr10 (490 aa) initn: 1986 init1: 1635 opt: 1988 Z-score: 2433.5 bits: 459.7 E(32554): 3.2e-129 Smith-Waterman score: 1988; 57.3% identity (83.7% similar) in 485 aa overlap (8-491:5-489) 10 20 30 40 50 60 pF1KE5 MSALGVTVALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTRL :::.. . :.:.:.::: . :: :: :::::::..::..:.. ::.: . CCDS74 MDPAVALVLCLSCLFLLSLWRQSSGRGRLPSGPTPLPIIGNILQLDVKDMSKSLTNF 10 20 30 40 50 70 80 90 100 110 pF1KE5 AQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLP-AFHAHRDRGIIFNNG .. .:::::.: : . .::.:::.::::::.:. .::::::..: : .... ::.:.:: CCDS74 SKVYGPVFTVYFGLKPIVVLHGYEAVKEALIDHGEEFSGRGSFPVAEKVNKGLGILFSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 PAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNV ::.:::: : ::::.::::.. :.:.:.::. :.: ::::...: ::::..::::::: CCDS74 KRWKEIRRFCLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTNASPCDPTFILGCAPCNV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 IADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNV : ...:. .:::.:..:: :: ::::...::.::.:. ::::... :::::: :. .: CCDS74 ICSVIFHDRFDYKDQRFLNLMEKFNENLRILSSPWIQVCNNFPALIDYLPGSHNKIAENF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 AEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFA : .: :: ::.:::..::: : ::. ::.:..::.:::. . .:.... .::.:.: : CCDS74 AYIKSYVLERIKEHQESLDMNSARDFIDCFLIKMEQEKHNQQSEFTVESLIATVTDMFGA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 GTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQR ::::::::::::::.:.::::. :..:::. :.: .: : ..::..::: ::::::::: CCDS74 GTETTSTTLRYGLLLLLKYPEVTAKVQEEIECVVGRNRSPCMQDRSHMPYTDAVVHEIQR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 FITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENG .: :.:.:::: .: :. :..:::::::... .: :::....:::.:: : : :::...: CCDS74 YIDLLPTNLPHAVTCDVKFKNYLIPKGTTIITSLTSVLHNDKEFPNPEMFDPGHFLDKSG 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 KFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFG .:: :::: :::.:::.: :::::: ::::.: .:::.:::: :::::::..:: .:: CCDS74 NFKKSDYFMPFSAGKRMCMGEGLARMELFLFLTTILQNFNLKSQVDPKDIDITPIANAFG 420 430 440 450 460 470 480 490 pF1KE5 CIPPRYKLCVIPRS .:: :.:: :: CCDS74 RVPPLYQLCFIPV 480 490 >>CCDS7437.1 CYP2C9 gene_id:1559|Hs108|chr10 (490 aa) initn: 1966 init1: 1612 opt: 1972 Z-score: 2413.9 bits: 456.1 E(32554): 3.9e-128 Smith-Waterman score: 1972; 57.5% identity (83.7% similar) in 485 aa overlap (8-491:5-489) 10 20 30 40 50 60 pF1KE5 MSALGVTVALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTRL :.:.. . :::.:.::: . .::::: :::.:::..:. .:.: ::.: : CCDS74 MDSLVVLVLCLSCLLLLSLWRQSSGRGKLPPGPTPLPVIGNILQIGIKDISKSLTNL 10 20 30 40 50 70 80 90 100 110 pF1KE5 AQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLP-AFHAHRDRGIIFNNG .. .::::::: : . .::.:::.::::::.: .:::::: .: : .:.: ::.:.:: CCDS74 SKVYGPVFTLYFGLKPIVVLHGYEAVKEALIDLGEEFSGRGIFPLAERANRGFGIVFSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 PAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNV ::.:::::: ::::.::::.. :.:.:.::. :.: ::::...: ::::..::::::: CCDS74 KKWKEIRRFSLMTLRNFGMGKRSIEDRVQEEARCLVEELRKTKASPCDPTFILGCAPCNV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 IADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNV : .:.:.:.:::.:..:: :: .:::...::.::.:. ::: .. :.::.: :..::: CCDS74 ICSIIFHKRFDYKDQQFLNLMEKLNENIKILSSPWIQICNNFSPIIDYFPGTHNKLLKNV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 AEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFA : .: :. :.::::..:.: : :.:. ::.:..::::::. .:.... :..::: : CCDS74 AFMKSYILEKVKEHQESMDMNNPQDFIDCFLMKMEKEKHNQPSEFTIESLENTAVDLFGA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 GTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQR :::::::::::.::.:.:.::. :..:::.:::: .: : ..::..::: ::::::.:: CCDS74 GTETTSTTLRYALLLLLKHPEVTAKVQEEIERVIGRNRSPCMQDRSHMPYTDAVVHEVQR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 FITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENG .: :.:..::: .: : ::.:::::::... .: :::.::.:::.:: : :.:::.:.: CCDS74 YIDLLPTSLPHAVTCDIKFRNYLIPKGTTILISLTSVLHDNKEFPNPEMFDPHHFLDEGG 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 KFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFG .:: : :: :::.:::.:.::.:: ::::.: .:::.:::: :::::..: .:. ::. CCDS74 NFKKSKYFMPFSAGKRICVGEALAGMELFLFLTSILQNFNLKSLVDPKNLDTTPVVNGFA 420 430 440 450 460 470 480 490 pF1KE5 CIPPRYKLCVIPRS .:: :.:: :: CCDS74 SVPPFYQLCFIPV 480 490 >>CCDS7438.1 CYP2C8 gene_id:1558|Hs108|chr10 (490 aa) initn: 1938 init1: 1583 opt: 1938 Z-score: 2372.3 bits: 448.4 E(32554): 8.1e-126 Smith-Waterman score: 1938; 56.9% identity (82.1% similar) in 485 aa overlap (8-491:5-489) 10 20 30 40 50 60 pF1KE5 MSALGVTVALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTRL :.:.. .:.:: :.::: .::::: :::::::..:...:.: :::: . CCDS74 MEPFVVLVLCLSFMLLFSLWRQSCRRRKLPPGPTPLPIIGNMLQIDVKDICKSFTNF 10 20 30 40 50 70 80 90 100 110 pF1KE5 AQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAFH-AHRDRGIIFNNG .. .:::::.: : . .::.:::.::::::.: .::::::. : . . ::: .:: CCDS74 SKVYGPVFTVYFGMNPIVVFHGYEAVKEALIDNGEEFSGRGNSPISQRITKGLGIISSNG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 PAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNV ::.:::::::::::.::::.. :.:.:.::: :.: ::::...: ::::..::::::: CCDS74 KRWKEIRRFSLTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKASPCDPTFILGCAPCNV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 IADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNV : ...:.:.:::.:..:: :: :::::..:..::.:. :::: .. .::.: ::.::: CCDS74 ICSVVFQKRFDYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLLIDCFPGTHNKVLKNV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 AEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFA : .. :. :.::::. ::: : :::. ::.:..::.:: . . ....... :::::: : CCDS74 ALTRSYIREKVKEHQASLDVNNPRDFIDCFLIKMEQEKDNQKSEFNIENLVGTVADLFVA 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 GTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQR ::::::::::::::.:.:.::. :..::::.::: : : ..::..::: ::::::::: CCDS74 GTETTSTTLRYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQDRSHMPYTDAVVHEIQR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 FITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENG . :::...:: .: :: ::.:::::::... : :::.:..:::.:. : : :::..:: CCDS74 YSDLVPTGVPHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEFPNPNIFDPGHFLDKNG 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 KFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFG .:: :::: :::.:::.:::::::: ::::.: .:::.:::: . : :... . . :. CCDS74 NFKKSDYFMPFSAGKRICAGEGLARMELFLFLTTILQNFNLKSVDDLKNLNTTAVTKGIV 420 430 440 450 460 470 480 490 pF1KE5 CIPPRYKLCVIPRS .:: :..: :: CCDS74 SLPPSYQICFIPV 480 490 >>CCDS73166.1 CYP2C8 gene_id:1558|Hs108|chr10 (420 aa) initn: 1699 init1: 1583 opt: 1694 Z-score: 2074.3 bits: 393.1 E(32554): 3.2e-109 Smith-Waterman score: 1694; 57.9% identity (82.7% similar) in 416 aa overlap (77-491:4-419) 50 60 70 80 90 100 pF1KE5 QLELKNIPKSFTRLAQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAF .::.:::.::::::.: .::::::. : CCDS73 MNPIVVFHGYEAVKEALIDNGEEFSGRGNSPIS 10 20 30 110 120 130 140 150 160 pF1KE5 H-AHRDRGIIFNNGPAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQP . . ::: .:: ::.:::::::::::.::::.. :.:.:.::: :.: ::::...: CCDS73 QRITKGLGIISSNGKRWKEIRRFSLTTLRNFGMGKRSIEDRVQEEAHCLVEELRKTKASP 40 50 60 70 80 90 170 180 190 200 210 220 pF1KE5 FDPTFLIGCAPCNVIADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFL ::::..:::::::: ...:.:.:::.:..:: :: :::::..:..::.:. :::: .. CCDS73 CDPTFILGCAPCNVICSVVFQKRFDYKDQNFLTLMKRFNENFRILNSPWIQVCNNFPLLI 100 110 120 130 140 150 230 240 250 260 270 280 pF1KE5 HYLPGSHRKVIKNVAEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYT .::.: ::.:::: .. :. :.::::. ::: : :::. ::.:..::.:: . . .. CCDS73 DCFPGTHNKVLKNVALTRSYIREKVKEHQASLDVNNPRDFIDCFLIKMEQEKDNQKSEFN 160 170 180 190 200 210 290 300 310 320 330 340 pF1KE5 MDGITVTVADLFFAGTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQ ..... :::::: :::::::::::::::.:.:.::. :..::::.::: : : ..::. CCDS73 IENLVGTVADLFVAGTETTSTTLRYGLLLLLKHPEVTAKVQEEIDHVIGRHRSPCMQDRS 220 230 240 250 260 270 350 360 370 380 390 400 pF1KE5 EMPYMDAVVHEIQRFITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPD .::: :::::::::. :::...:: .: :: ::.:::::::... : :::.:..:::. CCDS73 HMPYTDAVVHEIQRYSDLVPTGVPHAVTTDTKFRNYLIPKGTTIMALLTSVLHDDKEFPN 280 290 300 310 320 330 410 420 430 440 450 460 pF1KE5 PEKFKPEHFLNENGKFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVD :. : : :::..::.:: :::: :::.:::.:::::::: ::::.: .:::.:::: . : CCDS73 PNIFDPGHFLDKNGNFKKSDYFMPFSAGKRICAGEGLARMELFLFLTTILQNFNLKSVDD 340 350 360 370 380 390 470 480 490 pF1KE5 PKDIDLSPIHIGFGCIPPRYKLCVIPRS :... . . :. .:: :..: :: CCDS73 LKNLNTTAVTKGIVSLPPSYQICFIPV 400 410 420 >>CCDS12572.1 CYP2F1 gene_id:1572|Hs108|chr19 (491 aa) initn: 1654 init1: 1383 opt: 1671 Z-score: 2045.1 bits: 387.9 E(32554): 1.4e-107 Smith-Waterman score: 1671; 47.7% identity (78.5% similar) in 493 aa overlap (1-492:1-491) 10 20 30 40 50 60 pF1KE5 MSALGVTVALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTRL :....... ::. : ::... . ... .::::: :: :.:::. : ... :.:.: CCDS12 MDSISTAILLLLLALVCLLLTL--SSRDKGKLPPGPRPLSILGNLLLLCSQDMLTSLTKL 10 20 30 40 50 70 80 90 100 110 pF1KE5 AQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAFHAH-RDRGIIFNNG ....: ..:...: .:.::. ::.::::::.: .::::::: ::: . :: :..: CCDS12 SKEYGSMYTVHLGPRRVVVLSGYQAVKEALVDQGEEFSGRGDYPAFFNFTKGNGIAFSSG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 PAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNV :: .:.::. :::.::::.. : :: .:. ::: ::::.:.::::::... . :. CCDS12 DRWKVLRQFSIQILRNFGMGKRSIEERILEEGSFLLAELRKTEGEPFDPTFVLSRSVSNI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 IADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNV : ..:: ..:::.::..: .. :.:.::...:.:: .::. :::.: ..:: :.....: CCDS12 ICSVLFGSRFDYDDERLLTIIRLINDNFQIMSSPWGELYDIFPSLLDWVPGPHQRIFQNF 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 AEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFA ... ... :..:. :::: :::. .:.:..: .::.. . :: . .:. .:.:. CCDS12 KCLRDLIAHSVHDHQASLDPRSPRDFIQCFLTKMAEEKEDPLSHFHMDTLLMTTHNLLFG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 GTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQR ::.:.::::....: :::::... ...:::: :.: .:.::.::: ::: :::.::.:: CCDS12 GTKTVSTTLHHAFLALMKYPKVQARVQEEIDLVVGRARLPALKDRAAMPYTDAVIHEVQR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 FITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENG : ..: ::::..:::: :::.:::::: :. :..: :: ..: :..:.:::::. : CCDS12 FADIIPMNLPHRVTRDTAFRGFLIPKGTDVITLLNTVHYDPSQFLTPQEFNPEHFLDANQ 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 KFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFG .:: : : :::.:.:.: ::.::: :::: : :::: :.:.:: :.::::.:. :.: CCDS12 SFKKSPAFMPFSAGRRLCLGESLARMELFLYLTAILQSFSLQPLGAPEDIDLTPLSSGLG 420 430 440 450 460 470 480 490 pF1KE5 CIPPRYKLCVIPRS .: ..::. :: CCDS12 NLPRPFQLCLRPR 480 490 >>CCDS12571.1 CYP2A13 gene_id:1553|Hs108|chr19 (494 aa) initn: 1611 init1: 1288 opt: 1611 Z-score: 1971.5 bits: 374.3 E(32554): 1.7e-103 Smith-Waterman score: 1611; 47.4% identity (78.5% similar) in 494 aa overlap (1-492:1-494) 10 20 30 40 50 pF1KE5 MSALGVT-VALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTR : : :. :.::. . ..:.:.::: .: .::::: :::.::: .::. ... .:. . CCDS12 MLASGLLLVTLLACLTVMVLMSVWRQRKSRGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 LAQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAFH-AHRDRGIIFNN ...:.:::::...: .:.::. :. ::::::.: .::::::. .: . :. :.: CCDS12 ISERYGPVFTIHLGPRRVVVLCGHDAVKEALVDQAEEFSGRGEQATFDWLFKGYGVAFSN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 GPAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCN : :..::::..:::..:.::.: : :::.:: ::..::: :.: .::::... . : CCDS12 GERAKQLRRFSIATLRGFGVGKRGIEERIQEEAGFLIDALRGTHGANIDPTFFLSRTVSN 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 VIADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKN ::..:.: .:::.:..:: :. .. .:.. .: :::. : : ...::: .....:. CCDS12 VISSIVFGDRFDYEDKEFLSLLRMMLGSFQFTATSTGQLYEMFSSVMKHLPGPQQQAFKE 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 VAEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFF . ........:......:::: :::. : .:..:..:... . . . ....:. .::: CCDS12 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFF 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 AGTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQ :::::.:::::::.:.:::.::.: :.::::::::: .: : ..:: .::: .::.:::: CCDS12 AGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYTEAVIHEIQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE5 RFITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNEN :: ..: .: :....:: :: ...:::: : : : ::: : . : .:. :.:.:::... CCDS12 RFGDMLPMGLAHRVNKDTKFRDFFLPKGTEVFPMLGSVLRDPRFFSNPRDFNPQHFLDKK 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE5 GKFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGF :.:: :: : ::: ::: : :::::: ::::.. .:.:.: .: .:::::.:: :.:: CCDS12 GQFKKSDAFVPFSIGKRYCFGEGLARMELFLFFTTIMQNFRFKSPQSPKDIDVSPKHVGF 430 440 450 460 470 480 480 490 pF1KE5 GCIPPRYKLCVIPRS . :: : . .:: CCDS12 ATIPRNYTMSFLPR 490 >>CCDS12568.1 CYP2A6 gene_id:1548|Hs108|chr19 (494 aa) initn: 1608 init1: 1283 opt: 1610 Z-score: 1970.3 bits: 374.0 E(32554): 2e-103 Smith-Waterman score: 1610; 47.4% identity (78.5% similar) in 494 aa overlap (1-492:1-494) 10 20 30 40 50 pF1KE5 MSALGVT-VALLVWAAFLLLVSMWRQVHSSWNLPPGPFPLPIIGNLFQLELKNIPKSFTR : : :. ::::: . ..:.:.:.: .:. .::::: :::.::: .::. ... .:. . CCDS12 MLASGMLLVALLVCLTVMVLMSVWQQRKSKGKLPPGPTPLPFIGNYLQLNTEQMYNSLMK 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE5 LAQRFGPVFTLYVGSQRMVVMHGYKAVKEALLDYKDEFSGRGDLPAFH-AHRDRGIIFNN ...:.:::::...: .:.::. :. ::.:::.: .::::::. .: . . :..:.: CCDS12 ISERYGPVFTIHLGPRRVVVLCGHDAVREALVDQAEEFSGRGEQATFDWVFKGYGVVFSN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 GPAWKDIRRFSLTTLRNYGMGKQGNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCN : :..::::..:::..:.::.: : :::.:: ::..::: : : .::::... . : CCDS12 GERAKQLRRFSIATLRDFGVGKRGIEERIQEEAGFLIDALRGTGGANIDPTFFLSRTVSN 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 VIADILFRKHFDYNDEKFLRLMYLFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKN ::..:.: .:::.:..:: :. .. :.. :: :::. : : ...::: ...... CCDS12 VISSIVFGDRFDYKDKEFLSLLRMMLGIFQFTSTSTGQLYEMFSSVMKHLPGPQQQAFQL 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 VAEVKEYVSERVKEHHQSLDPNCPRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFF . ........:......:::: :::. : .:..:..:... . . . ....:. .::. CCDS12 LQGLEDFIAKKVEHNQRTLDPNSPRDFIDSFLIRMQEEEKNPNTEFYLKNLVMTTLNLFI 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 AGTETTSTTLRYGLLILMKYPEIEEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQ .::::.:::::::.:.:::.::.: :.::::::::: .: : ..:: .::::.::.:::: CCDS12 GGTETVSTTLRYGFLLLMKHPEVEAKVHEEIDRVIGKNRQPKFEDRAKMPYMEAVIHEIQ 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE5 RFITLVPSNLPHEATRDTIFRGYLIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNEN :: ..: .: ... .:: :: ...:::: : : : ::: : . : .:. :.:.:::::. CCDS12 RFGDVIPMSLARRVKKDTKFRDFFLPKGTEVYPMLGSVLRDPSFFSNPQDFNPQHFLNEK 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE5 GKFKYSDYFKPFSTGKRVCAGEGLARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGF :.:: :: : ::: ::: : :::::: ::::.. ...:.: :: .:::::.:: :.:: CCDS12 GQFKKSDAFVPFSIGKRNCFGEGLARMELFLFFTTVMQNFRLKSSQSPKDIDVSPKHVGF 430 440 450 460 470 480 480 490 pF1KE5 GCIPPRYKLCVIPRS . :: : . .:: CCDS12 ATIPRNYTMSFLPR 490 >>CCDS55721.1 CYP2C8 gene_id:1558|Hs108|chr10 (388 aa) initn: 1586 init1: 1586 opt: 1586 Z-score: 1942.5 bits: 368.6 E(32554): 7e-102 Smith-Waterman score: 1586; 58.4% identity (83.7% similar) in 380 aa overlap (112-491:8-387) 90 100 110 120 130 140 pF1KE5 GYKAVKEALLDYKDEFSGRGDLPAFHAHRDRGIIFNNGPAWKDIRRFSLTTLRNYGMGKQ .::: .:: ::.:::::::::::.::::. CCDS55 MFLQPIAKGIISSNGKRWKEIRRFSLTTLRNFGMGKR 10 20 30 150 160 170 180 190 200 pF1KE5 GNESRIQREAHFLLEALRKTQGQPFDPTFLIGCAPCNVIADILFRKHFDYNDEKFLRLMY . :.:.:.::: :.: ::::...: ::::..:::::::: ...:.:.:::.:..:: :: CCDS55 SIEDRVQEEAHCLVEELRKTKASPCDPTFILGCAPCNVICSVVFQKRFDYKDQNFLTLMK 40 50 60 70 80 90 210 220 230 240 250 260 pF1KE5 LFNENFHLLSTPWLQLYNNFPSFLHYLPGSHRKVIKNVAEVKEYVSERVKEHHQSLDPNC :::::..:..::.:. :::: .. .::.: ::.:::: .. :. :.::::. ::: : CCDS55 RFNENFRILNSPWIQVCNNFPLLIDCFPGTHNKVLKNVALTRSYIREKVKEHQASLDVNN 100 110 120 130 140 150 270 280 290 300 310 320 pF1KE5 PRDLTDCLLVEMEKEKHSAERLYTMDGITVTVADLFFAGTETTSTTLRYGLLILMKYPEI :::. ::.:..::.:: . . ....... :::::: :::::::::::::::.:.:.::. CCDS55 PRDFIDCFLIKMEQEKDNQKSEFNIENLVGTVADLFVAGTETTSTTLRYGLLLLLKHPEV 160 170 180 190 200 210 330 340 350 360 370 380 pF1KE5 EEKLHEEIDRVIGPSRIPAIKDRQEMPYMDAVVHEIQRFITLVPSNLPHEATRDTIFRGY :..::::.::: : : ..::..::: :::::::::. :::...:: .: :: ::.: CCDS55 TAKVQEEIDHVIGRHRSPCMQDRSHMPYTDAVVHEIQRYSDLVPTGVPHAVTTDTKFRNY 220 230 240 250 260 270 390 400 410 420 430 440 pF1KE5 LIPKGTVVVPTLDSVLYDNQEFPDPEKFKPEHFLNENGKFKYSDYFKPFSTGKRVCAGEG ::::::... : :::.:..:::.:. : : :::..::.:: :::: :::.:::.::::: CCDS55 LIPKGTTIMALLTSVLHDDKEFPNPNIFDPGHFLDKNGNFKKSDYFMPFSAGKRICAGEG 280 290 300 310 320 330 450 460 470 480 490 pF1KE5 LARTELFLLLCAILQHFNLKPLVDPKDIDLSPIHIGFGCIPPRYKLCVIPRS ::: ::::.: .:::.:::: . : :... . . :. .:: :..: :: CCDS55 LARMELFLFLTTILQNFNLKSVDDLKNLNTTAVTKGIVSLPPSYQICFIPV 340 350 360 370 380 493 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:36:58 2016 done: Tue Nov 8 05:36:58 2016 Total Scan time: 2.760 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]