FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1909, 444 aa 1>>>pF1KE1909 444 - 444 aa - 444 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6999+/-0.00104; mu= 15.7520+/- 0.062 mean_var=72.6031+/-14.591, 0's: 0 Z-trim(104.0): 22 B-trim: 0 in 0/49 Lambda= 0.150521 statistics sampled from 7677 (7685) to 7677 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.61), E-opt: 0.2 (0.236), width: 16 Scan time: 2.780 The best scores are: opt bits E(32554) CCDS7829.1 TPH1 gene_id:7166|Hs108|chr11 ( 444) 2976 655.8 2.5e-188 CCDS31859.1 TPH2 gene_id:121278|Hs108|chr12 ( 490) 2243 496.6 2.2e-140 CCDS9092.1 PAH gene_id:5053|Hs108|chr12 ( 452) 1626 362.6 4.5e-100 CCDS7730.1 TH gene_id:7054|Hs108|chr11 ( 497) 1422 318.4 1.1e-86 CCDS31338.1 TH gene_id:7054|Hs108|chr11 ( 524) 1422 318.4 1.1e-86 CCDS7731.1 TH gene_id:7054|Hs108|chr11 ( 528) 1422 318.4 1.1e-86 >>CCDS7829.1 TPH1 gene_id:7166|Hs108|chr11 (444 aa) initn: 2976 init1: 2976 opt: 2976 Z-score: 3494.6 bits: 655.8 E(32554): 2.5e-188 Smith-Waterman score: 2976; 100.0% identity (100.0% similar) in 444 aa overlap (1-444:1-444) 10 20 30 40 50 60 pF1KE1 MIEDNKENKDHSLERGRASLIFSLKNEVGGLIKALKIFQEKHVNLLHIESRKSKRRNSEF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 MIEDNKENKDHSLERGRASLIFSLKNEVGGLIKALKIFQEKHVNLLHIESRKSKRRNSEF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 EIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTLKEDGMETVPWFPKKISDLDHCAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 EIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTLKEDGMETVPWFPKKISDLDHCAN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKHGDPIPKVEFTEEEIKTWGTVFQE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 RVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKHGDPIPKVEFTEEEIKTWGTVFQE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 LNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDVSNFLKERTGFSIRPVAGYLSPRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 LNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDVSNFLKERTGFSIRPVAGYLSPRD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 FLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGHVPLLAEPSFAQFSQEIGLASLGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 FLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGHVPLLAEPSFAQFSQEIGLASLGA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 SEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSSISELKHALSGHAKVKPFDPKITC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 SEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSSISELKHALSGHAKVKPFDPKITC 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 KQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPFGVKYNPYTRSIQILKDTKSITSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS78 KQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPFGVKYNPYTRSIQILKDTKSITSA 370 380 390 400 410 420 430 440 pF1KE1 MNELQHDLDVVSDALAKVSRKPSI :::::::::::::::::::::::: CCDS78 MNELQHDLDVVSDALAKVSRKPSI 430 440 >>CCDS31859.1 TPH2 gene_id:121278|Hs108|chr12 (490 aa) initn: 2213 init1: 2213 opt: 2243 Z-score: 2633.7 bits: 496.6 E(32554): 2.2e-140 Smith-Waterman score: 2243; 71.7% identity (92.5% similar) in 442 aa overlap (4-440:45-486) 10 20 pF1KE1 MIEDNKENKDHS-----LERGRASLIFSLKNEV :.: :: : : :.....::::::: CCDS31 RRGFSLDSAVPEEHQLLGSSTLNKPNSGKNDDKGNKGSSKREAATESGKTAVVFSLKNEV 20 30 40 50 60 70 30 40 50 60 70 80 pF1KE1 GGLIKALKIFQEKHVNLLHIESRKSKRRNSEFEIFVDCDINREQLNDIFHLLKSHTNVLS :::.:::..::::.::..:::::::.::.:: ::::::. .. ..:....::: .:.... CCDS31 GGLVKALRLFQEKRVNMVHIESRKSRRRSSEVEIFVDCECGKTEFNELIQLLKFQTTIVT 80 90 100 110 120 130 90 100 110 120 130 140 pF1KE1 VNLPDNFTLKEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYF .: :.:. .:. .: :::::.:::.::.:..::::::::::::::::::::::.::::: CCDS31 LNPPENIWTEEEELEDVPWFPRKISELDKCSHRVLMYGSELDADHPGFKDNVYRQRRKYF 140 150 160 170 180 190 150 160 170 180 190 200 pF1KE1 ADLAMNYKHGDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYRE .:.::.::.:.:::.::.:::: ::::.::.::.::::::::::::::.:::.::::::: CCDS31 VDVAMGYKYGQPIPRVEYTEEETKTWGVVFRELSKLYPTHACREYLKNFPLLTKYCGYRE 200 210 220 230 240 250 210 220 230 240 250 260 pF1KE1 DNIPQLEDVSNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEP ::.::::::: :::::.::..:::::::::::::.:::.::::::::.::.:::.::::: CCDS31 DNVPQLEDVSMFLKERSGFTVRPVAGYLSPRDFLAGLAYRVFHCTQYIRHGSDPLYTPEP 260 270 280 290 300 310 270 280 290 300 310 320 pF1KE1 DTCHELLGHVPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLR ::::::::::::::.:.::::::::::::::::.: :::::::::::.:::::::.:::: CCDS31 DTCHELLGHVPLLADPKFAQFSQEIGLASLGASDEDVQKLATCYFFTIEFGLCKQEGQLR 320 330 340 350 360 370 330 340 350 360 370 380 pF1KE1 VFGAGLLSSISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMRE ..::::::::.::::::: .: :: :::: :: :::::::::..::::::::.::::::. CCDS31 AYGAGLLSSIGELKHALSDKACVKAFDPKTTCLQECLITTFQEAYFVSESFEEAKEKMRD 380 390 400 410 420 430 390 400 410 420 430 440 pF1KE1 FTKTIKRPFGVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI :.:.: :::.: .::::.::.:::::.:: .....:. ::..: ::: :... CCDS31 FAKSITRPFSVYFNPYTQSIEILKDTRSIENVVQDLRSDLNTVCDALNKMNQYLGI 440 450 460 470 480 490 >>CCDS9092.1 PAH gene_id:5053|Hs108|chr12 (452 aa) initn: 1622 init1: 1458 opt: 1626 Z-score: 1910.2 bits: 362.6 E(32554): 4.5e-100 Smith-Waterman score: 1626; 55.9% identity (80.3% similar) in 431 aa overlap (9-438:26-451) 10 20 30 40 pF1KE1 MIEDNKENKDHSLERGRASLIFSLKNEVGGLIKALKIFQEKHV .:. . : :::::::.:::.: :.:..:.:. : CCDS90 MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE1 NLLHIESRKSKRRNSEFEIFVDCDINR-EQLNDIFHLLKSHTNVLSVNLPDNFTLKEDGM :: ::::: :. ...:.:.:. : :..:...:. .. .: .. CCDS90 NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELS-----RDKKK 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 ETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKHGDPIP .::::::. :..::. ::..: ::.::::::::::: ::: ::: :::.:.::.::.::: CCDS90 DTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIP 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 KVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDVSNFLK .::. ::: :::::::. :..:: :::: :: . .::: ::::..:::::::::::.::. CCDS90 RVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQ 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 ERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGHVPLLA ::: .::::: :: ::::.::::::::::::.::.: :.:::::: ::::::::::.. CCDS90 TCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFS 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 EPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSSISELK . :::::::::::::::: .: ..:::: :.:::::::::: .....:::::::..::. CCDS90 DRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQ 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 HALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPFGVKYN . :: . :. :.. . : :. .: :: .:.:.:::.:::::.:.:. :: :::.:.:. CCDS90 YCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYD 360 370 380 390 400 410 410 420 430 440 pF1KE1 PYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI :::. :..: .:... . .. .. .. .:: :. CCDS90 PYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK 420 430 440 450 >>CCDS7730.1 TH gene_id:7054|Hs108|chr11 (497 aa) initn: 1426 init1: 1402 opt: 1422 Z-score: 1670.1 bits: 318.4 E(32554): 1.1e-86 Smith-Waterman score: 1449; 50.3% identity (78.7% similar) in 431 aa overlap (14-438:76-496) 10 20 30 40 pF1KE1 MIEDNKENKDHSLERGRA--SLIFSLK-NEVGGLIKALKIFQE ..:.: .:.:: . .. ..: .:.:.:. CCDS77 RKEREAAVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFET 50 60 70 80 90 100 50 60 70 80 90 pF1KE1 KHVNLLHIESRKSKRRNS---EFEIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTL .... :.:.: ..: . ..: :: .. : .:. :: ..: .:. : . CCDS77 FEAKIHHLETRPAQRPRAGGPHLEYFVRLEVRR---GDLAALL---SGVRQVS-ED---V 110 120 130 140 150 100 110 120 130 140 150 pF1KE1 KEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKH . . :::::.:.:.::.: . : . .:: :::::.:.:::.::: .:..:..:.: CCDS77 RSPAGPKVPWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRH 160 170 180 190 200 210 160 170 180 190 200 210 pF1KE1 GDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDV :::::.::.: ::: :: :. :. :: :::: :.:. . :: .. ::::::::::::: CCDS77 GDPIPRVEYTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDV 220 230 240 250 260 270 220 230 240 250 260 270 pF1KE1 SNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGH : ::::::::..::::: :: ::::..::::::.::::.::.:.:...:::: ::::::: CCDS77 SRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGH 280 290 300 310 320 330 280 290 300 310 320 330 pF1KE1 VPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSS ::.::. .::::::.:::::::::.: ..::.: :.::::::::::.:.....::::::: CCDS77 VPMLADRTFAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSS 340 350 360 370 380 390 340 350 360 370 380 390 pF1KE1 ISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPF .:: : :: . ... :::. . : :.:.:::::::: :::.:.: ... :.::: CCDS77 YGELLHCLSEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPF 400 410 420 430 440 450 400 410 420 430 440 pF1KE1 GVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI .::..::: .:..: . ... ... .: .::... ::. . CCDS77 SVKFDPYTLAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG 460 470 480 490 >>CCDS31338.1 TH gene_id:7054|Hs108|chr11 (524 aa) initn: 1426 init1: 1402 opt: 1422 Z-score: 1669.8 bits: 318.4 E(32554): 1.1e-86 Smith-Waterman score: 1449; 50.3% identity (78.7% similar) in 431 aa overlap (14-438:103-523) 10 20 30 40 pF1KE1 MIEDNKENKDHSLERGRA--SLIFSLK-NEVGGLIKALKIFQE ..:.: .:.:: . .. ..: .:.:.:. CCDS31 RKEREAAVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFET 80 90 100 110 120 130 50 60 70 80 90 pF1KE1 KHVNLLHIESRKSKRRNS---EFEIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTL .... :.:.: ..: . ..: :: .. : .:. :: ..: .:. : . CCDS31 FEAKIHHLETRPAQRPRAGGPHLEYFVRLEVRR---GDLAALL---SGVRQVS-ED---V 140 150 160 170 180 100 110 120 130 140 150 pF1KE1 KEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKH . . :::::.:.:.::.: . : . .:: :::::.:.:::.::: .:..:..:.: CCDS31 RSPAGPKVPWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRH 190 200 210 220 230 240 160 170 180 190 200 210 pF1KE1 GDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDV :::::.::.: ::: :: :. :. :: :::: :.:. . :: .. ::::::::::::: CCDS31 GDPIPRVEYTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDV 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE1 SNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGH : ::::::::..::::: :: ::::..::::::.::::.::.:.:...:::: ::::::: CCDS31 SRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGH 310 320 330 340 350 360 280 290 300 310 320 330 pF1KE1 VPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSS ::.::. .::::::.:::::::::.: ..::.: :.::::::::::.:.....::::::: CCDS31 VPMLADRTFAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSS 370 380 390 400 410 420 340 350 360 370 380 390 pF1KE1 ISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPF .:: : :: . ... :::. . : :.:.:::::::: :::.:.: ... :.::: CCDS31 YGELLHCLSEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPF 430 440 450 460 470 480 400 410 420 430 440 pF1KE1 GVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI .::..::: .:..: . ... ... .: .::... ::. . CCDS31 SVKFDPYTLAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG 490 500 510 520 >>CCDS7731.1 TH gene_id:7054|Hs108|chr11 (528 aa) initn: 1426 init1: 1402 opt: 1422 Z-score: 1669.7 bits: 318.4 E(32554): 1.1e-86 Smith-Waterman score: 1449; 50.3% identity (78.7% similar) in 431 aa overlap (14-438:107-527) 10 20 30 40 pF1KE1 MIEDNKENKDHSLERGRA--SLIFSLK-NEVGGLIKALKIFQE ..:.: .:.:: . .. ..: .:.:.:. CCDS77 RKEREAAVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFET 80 90 100 110 120 130 50 60 70 80 90 pF1KE1 KHVNLLHIESRKSKRRNS---EFEIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTL .... :.:.: ..: . ..: :: .. : .:. :: ..: .:. : . CCDS77 FEAKIHHLETRPAQRPRAGGPHLEYFVRLEVRR---GDLAALL---SGVRQVS-ED---V 140 150 160 170 180 100 110 120 130 140 150 pF1KE1 KEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKH . . :::::.:.:.::.: . : . .:: :::::.:.:::.::: .:..:..:.: CCDS77 RSPAGPKVPWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRH 190 200 210 220 230 240 160 170 180 190 200 210 pF1KE1 GDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDV :::::.::.: ::: :: :. :. :: :::: :.:. . :: .. ::::::::::::: CCDS77 GDPIPRVEYTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDV 250 260 270 280 290 300 220 230 240 250 260 270 pF1KE1 SNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGH : ::::::::..::::: :: ::::..::::::.::::.::.:.:...:::: ::::::: CCDS77 SRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGH 310 320 330 340 350 360 280 290 300 310 320 330 pF1KE1 VPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSS ::.::. .::::::.:::::::::.: ..::.: :.::::::::::.:.....::::::: CCDS77 VPMLADRTFAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSS 370 380 390 400 410 420 340 350 360 370 380 390 pF1KE1 ISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPF .:: : :: . ... :::. . : :.:.:::::::: :::.:.: ... :.::: CCDS77 YGELLHCLSEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPF 430 440 450 460 470 480 400 410 420 430 440 pF1KE1 GVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI .::..::: .:..: . ... ... .: .::... ::. . CCDS77 SVKFDPYTLAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG 490 500 510 520 444 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 15:15:28 2016 done: Sun Nov 6 15:15:28 2016 Total Scan time: 2.780 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]