FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4434, 452 aa 1>>>pF1KE4434 452 - 452 aa - 452 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5076+/-0.000996; mu= 16.5455+/- 0.060 mean_var=63.1875+/-12.426, 0's: 0 Z-trim(103.5): 20 B-trim: 0 in 0/50 Lambda= 0.161346 statistics sampled from 7435 (7446) to 7435 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.604), E-opt: 0.2 (0.229), width: 16 Scan time: 2.800 The best scores are: opt bits E(32554) CCDS9092.1 PAH gene_id:5053|Hs108|chr12 ( 452) 3019 711.7 3.9e-205 CCDS31859.1 TPH2 gene_id:121278|Hs108|chr12 ( 490) 1675 398.8 6.3e-111 CCDS7829.1 TPH1 gene_id:7166|Hs108|chr11 ( 444) 1617 385.3 6.7e-107 CCDS7730.1 TH gene_id:7054|Hs108|chr11 ( 497) 1507 359.7 3.8e-99 CCDS31338.1 TH gene_id:7054|Hs108|chr11 ( 524) 1507 359.7 4e-99 CCDS7731.1 TH gene_id:7054|Hs108|chr11 ( 528) 1507 359.7 4e-99 >>CCDS9092.1 PAH gene_id:5053|Hs108|chr12 (452 aa) initn: 3019 init1: 3019 opt: 3019 Z-score: 3796.3 bits: 711.7 E(32554): 3.9e-205 Smith-Waterman score: 3019; 99.8% identity (99.8% similar) in 452 aa overlap (1-452:1-452) 10 20 30 40 50 60 pF1KE4 MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPW 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 FPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 FPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 EEGKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF :: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 EEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 QFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 QFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 KPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 KPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQR 370 380 390 400 410 420 430 440 450 pF1KE4 IEVLDNTQQLKILADSINSEIGILCSALQKIK :::::::::::::::::::::::::::::::: CCDS90 IEVLDNTQQLKILADSINSEIGILCSALQKIK 430 440 450 >>CCDS31859.1 TPH2 gene_id:121278|Hs108|chr12 (490 aa) initn: 1637 init1: 1488 opt: 1675 Z-score: 2104.9 bits: 398.8 E(32554): 6.3e-111 Smith-Waterman score: 1675; 54.1% identity (81.3% similar) in 455 aa overlap (1-451:31-484) 10 20 30 pF1KE4 MSTAVLENPGLGRKLSDFGQETSYIEDNCN .....:..:. :.. .: :.. : .. . CCDS31 MQPAMMMFSSKYWARRGFSLDSAVPEEHQLLGSSTLNKPNSGKN-DDKGNKGSSKREAAT 10 20 30 40 50 40 50 60 70 80 pF1KE4 QNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLD--KRSL ..: ...::::.:::.:.:.::::.:. ::..::::: :: ...: :.:. . : . CCDS31 ESGKTAVVFSLKNEVGGLVKALRLFQEKRVNMVHIESRKSRRRSSEVEIFVDCECGKTEF 60 70 80 90 100 110 90 100 110 120 130 140 pF1KE4 PALTNIIKILRHDIGATVHE--LSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADH : ...:. . . : ..... . :::::: :.:::. ....: ::.:::::: CCDS31 NELIQLLKFQTTIVTLNPPENIWTEEEELEDVPWFPRKISELDKCSHRVLMYGSELDADH 120 130 140 150 160 170 150 160 170 180 190 200 pF1KE4 PGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEGKKTWGTVFKTLKSLYKTHACYEY ::::: ::: ::: :.:.:..:..::::::::: :: ::::.::. :..:: :::: :: CCDS31 PGFKDNVYRQRRKYFVDVAMGYKYGQPIPRVEYTEEETKTWGVVFRELSKLYPTHACREY 180 190 200 210 220 230 210 220 230 240 250 260 pF1KE4 NHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCT . :::: ::::..:::.:::::::.::. .:: .::::: :: ::::.:::.:::::: CCDS31 LKNFPLLTKYCGYREDNVPQLEDVSMFLKERSGFTVRPVAGYLSPRDFLAGLAYRVFHCT 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE4 QYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYW ::::::: :.:::::: ::::::::::..: .::::::::::::::: :: ..:::: :. CCDS31 QYIRHGSDPLYTPEPDTCHELLGHVPLLADPKFAQFSQEIGLASLGASDEDVQKLATCYF 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE4 FTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLY ::.::::::: ...:::::::::.:::.. ::.: . .. . : .:. .: :: : CCDS31 FTIEFGLCKQEGQLRAYGAGLLSSIGELKHALSDKACVKAFDPKTTCLQECLITTFQEAY 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE4 YVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCS .:.:::..::::.:.:: .: ::::: ..:::: ::.: .:.... ..... :... .:. CCDS31 FVSESFEEAKEKMRDFAKSITRPFSVYFNPYTQSIEILKDTRSIENVVQDLRSDLNTVCD 420 430 440 450 460 470 450 pF1KE4 ALQKIK ::.:. CCDS31 ALNKMNQYLGI 480 490 >>CCDS7829.1 TPH1 gene_id:7166|Hs108|chr11 (444 aa) initn: 1613 init1: 1449 opt: 1617 Z-score: 2032.7 bits: 385.3 E(32554): 6.7e-107 Smith-Waterman score: 1617; 56.1% identity (80.3% similar) in 431 aa overlap (26-451:9-438) 10 20 30 40 50 60 pF1KE4 MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV .:. . : :::::::.:::.: :.:..:.:. : CCDS78 MIEDNKENKDHSLERGRASLIFSLKNEVGGLIKALKIFQEKHV 10 20 30 40 70 80 90 100 110 pF1KE4 NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRD--KKKD-- :: ::::: :. ...:.:.:. : :..:...:. .. .: . :.: CCDS78 NLLHIESRKSKRRNSEFEIFVDCDINR-EQLNDIFHLLKSHTNVLSVNLPDNFTLKEDGM 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 -TVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIP ::::::. :..::. ::..: ::.::::::::::: ::: ::: :::.:.::.::.::: CCDS78 ETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKHGDPIP 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 RVEYMEEGKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQ .::. :: :::::::. :..:: :::: :: . .::: ::::..:::::::::::.::. CCDS78 KVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDVSNFLK 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 TCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFS ::: .::::: :: ::::.::::::::::::.::.: :.:::::: ::::::::::.. CCDS78 ERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGHVPLLA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 DRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQ . :::::::::::::::: .: ..:::: :.:::::::::: .....:::::::..::. CCDS78 EPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSSISELK 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 YCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYD . :: . :. :.. . : :. .: :: .:.:.:::.:::::.:.:. :: :::.:.:. CCDS78 HALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPFGVKYN 350 360 370 380 390 400 420 430 440 450 pF1KE4 PYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK :::. :..: .:... . .. .. .. .:: :. CCDS78 PYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI 410 420 430 440 >>CCDS7730.1 TH gene_id:7054|Hs108|chr11 (497 aa) initn: 1512 init1: 1433 opt: 1507 Z-score: 1893.5 bits: 359.7 E(32554): 3.8e-99 Smith-Waterman score: 1507; 53.0% identity (78.0% similar) in 423 aa overlap (35-451:82-496) 10 20 30 40 50 60 pF1KE4 VLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKE-EVGALAKVLRLFEENDVNLT ..:.:: . . .::......:: .... CCDS77 AVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFETFEAKIH 60 70 80 90 100 110 70 80 90 100 110 pF1KE4 HIESRPS---RLKKDEYEFFTHLDKR--SLPALTNIIKILRHDIGATVHELSRDKKKDTV :.:.::. : . :.:..:. : .: :: . .. . .:. :. : CCDS77 HLETRPAQRPRAGGPHLEYFVRLEVRRGDLAALLSGVRQVSEDV--------RSPAGPKV 120 130 140 150 160 120 130 140 150 160 170 pF1KE4 PWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVE ::::: ..:::. . . .. .:: :::::.: ::: ::: .:.::..::::.:::::: CCDS77 PWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRHGDPIPRVE 170 180 190 200 210 220 180 190 200 210 220 230 pF1KE4 YMEEGKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCT : : :: :. :::.:: :::: :. . : :::.. :..:::::::::::.::. : CCDS77 YTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDVSRFLKERT 230 240 250 260 270 280 240 250 260 270 280 290 pF1KE4 GFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRS ::.:::::::::.::::..::::::.:::::::.:.::..:::: :::::::::...::. CCDS77 GFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGHVPMLADRT 290 300 310 320 330 340 300 310 320 330 340 350 pF1KE4 FAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCL ::::::.:::::::: :: ::::.:.::::::::::::. .::::::::::.::: .:: CCDS77 FAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSSYGELLHCL 350 360 370 380 390 400 360 370 380 390 400 410 pF1KE4 SEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYT ::.:.. .. : .:.: : .: .:.:.:::.:::.:.:..:. : :::::..:::: CCDS77 SEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPFSVKFDPYT 410 420 430 440 450 460 420 430 440 450 pF1KE4 QRIEVLDNTQQLKILADSINSEIGILCSALQKIK :.:::. : .. .....:. : ::. : CCDS77 LAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG 470 480 490 >>CCDS31338.1 TH gene_id:7054|Hs108|chr11 (524 aa) initn: 1512 init1: 1433 opt: 1507 Z-score: 1893.1 bits: 359.7 E(32554): 4e-99 Smith-Waterman score: 1507; 53.0% identity (78.0% similar) in 423 aa overlap (35-451:109-523) 10 20 30 40 50 60 pF1KE4 VLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKE-EVGALAKVLRLFEENDVNLT ..:.:: . . .::......:: .... CCDS31 AVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFETFEAKIH 80 90 100 110 120 130 70 80 90 100 110 pF1KE4 HIESRPS---RLKKDEYEFFTHLDKR--SLPALTNIIKILRHDIGATVHELSRDKKKDTV :.:.::. : . :.:..:. : .: :: . .. . .:. :. : CCDS31 HLETRPAQRPRAGGPHLEYFVRLEVRRGDLAALLSGVRQVSEDV--------RSPAGPKV 140 150 160 170 180 190 120 130 140 150 160 170 pF1KE4 PWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVE ::::: ..:::. . . .. .:: :::::.: ::: ::: .:.::..::::.:::::: CCDS31 PWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRHGDPIPRVE 200 210 220 230 240 250 180 190 200 210 220 230 pF1KE4 YMEEGKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCT : : :: :. :::.:: :::: :. . : :::.. :..:::::::::::.::. : CCDS31 YTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDVSRFLKERT 260 270 280 290 300 310 240 250 260 270 280 290 pF1KE4 GFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRS ::.:::::::::.::::..::::::.:::::::.:.::..:::: :::::::::...::. CCDS31 GFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGHVPMLADRT 320 330 340 350 360 370 300 310 320 330 340 350 pF1KE4 FAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCL ::::::.:::::::: :: ::::.:.::::::::::::. .::::::::::.::: .:: CCDS31 FAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSSYGELLHCL 380 390 400 410 420 430 360 370 380 390 400 410 pF1KE4 SEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYT ::.:.. .. : .:.: : .: .:.:.:::.:::.:.:..:. : :::::..:::: CCDS31 SEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPFSVKFDPYT 440 450 460 470 480 490 420 430 440 450 pF1KE4 QRIEVLDNTQQLKILADSINSEIGILCSALQKIK :.:::. : .. .....:. : ::. : CCDS31 LAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG 500 510 520 >>CCDS7731.1 TH gene_id:7054|Hs108|chr11 (528 aa) initn: 1512 init1: 1433 opt: 1507 Z-score: 1893.1 bits: 359.7 E(32554): 4e-99 Smith-Waterman score: 1507; 53.0% identity (78.0% similar) in 423 aa overlap (35-451:113-527) 10 20 30 40 50 60 pF1KE4 VLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKE-EVGALAKVLRLFEENDVNLT ..:.:: . . .::......:: .... CCDS77 AVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFETFEAKIH 90 100 110 120 130 140 70 80 90 100 110 pF1KE4 HIESRPS---RLKKDEYEFFTHLDKR--SLPALTNIIKILRHDIGATVHELSRDKKKDTV :.:.::. : . :.:..:. : .: :: . .. . .:. :. : CCDS77 HLETRPAQRPRAGGPHLEYFVRLEVRRGDLAALLSGVRQVSEDV--------RSPAGPKV 150 160 170 180 190 120 130 140 150 160 170 pF1KE4 PWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVE ::::: ..:::. . . .. .:: :::::.: ::: ::: .:.::..::::.:::::: CCDS77 PWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRHGDPIPRVE 200 210 220 230 240 250 180 190 200 210 220 230 pF1KE4 YMEEGKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCT : : :: :. :::.:: :::: :. . : :::.. :..:::::::::::.::. : CCDS77 YTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDVSRFLKERT 260 270 280 290 300 310 240 250 260 270 280 290 pF1KE4 GFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRS ::.:::::::::.::::..::::::.:::::::.:.::..:::: :::::::::...::. CCDS77 GFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGHVPMLADRT 320 330 340 350 360 370 300 310 320 330 340 350 pF1KE4 FAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCL ::::::.:::::::: :: ::::.:.::::::::::::. .::::::::::.::: .:: CCDS77 FAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSSYGELLHCL 380 390 400 410 420 430 360 370 380 390 400 410 pF1KE4 SEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYT ::.:.. .. : .:.: : .: .:.:.:::.:::.:.:..:. : :::::..:::: CCDS77 SEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPFSVKFDPYT 440 450 460 470 480 490 420 430 440 450 pF1KE4 QRIEVLDNTQQLKILADSINSEIGILCSALQKIK :.:::. : .. .....:. : ::. : CCDS77 LAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG 500 510 520 452 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:09:51 2016 done: Sun Nov 6 01:09:51 2016 Total Scan time: 2.800 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]