FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1909, 444 aa
1>>>pF1KE1909 444 - 444 aa - 444 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6999+/-0.00104; mu= 15.7520+/- 0.062
mean_var=72.6031+/-14.591, 0's: 0 Z-trim(104.0): 22 B-trim: 0 in 0/49
Lambda= 0.150521
statistics sampled from 7677 (7685) to 7677 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.61), E-opt: 0.2 (0.236), width: 16
Scan time: 2.780
The best scores are: opt bits E(32554)
CCDS7829.1 TPH1 gene_id:7166|Hs108|chr11 ( 444) 2976 655.8 2.5e-188
CCDS31859.1 TPH2 gene_id:121278|Hs108|chr12 ( 490) 2243 496.6 2.2e-140
CCDS9092.1 PAH gene_id:5053|Hs108|chr12 ( 452) 1626 362.6 4.5e-100
CCDS7730.1 TH gene_id:7054|Hs108|chr11 ( 497) 1422 318.4 1.1e-86
CCDS31338.1 TH gene_id:7054|Hs108|chr11 ( 524) 1422 318.4 1.1e-86
CCDS7731.1 TH gene_id:7054|Hs108|chr11 ( 528) 1422 318.4 1.1e-86
>>CCDS7829.1 TPH1 gene_id:7166|Hs108|chr11 (444 aa)
initn: 2976 init1: 2976 opt: 2976 Z-score: 3494.6 bits: 655.8 E(32554): 2.5e-188
Smith-Waterman score: 2976; 100.0% identity (100.0% similar) in 444 aa overlap (1-444:1-444)
10 20 30 40 50 60
pF1KE1 MIEDNKENKDHSLERGRASLIFSLKNEVGGLIKALKIFQEKHVNLLHIESRKSKRRNSEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 MIEDNKENKDHSLERGRASLIFSLKNEVGGLIKALKIFQEKHVNLLHIESRKSKRRNSEF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 EIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTLKEDGMETVPWFPKKISDLDHCAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 EIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTLKEDGMETVPWFPKKISDLDHCAN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 RVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKHGDPIPKVEFTEEEIKTWGTVFQE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 RVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKHGDPIPKVEFTEEEIKTWGTVFQE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 LNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDVSNFLKERTGFSIRPVAGYLSPRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 LNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDVSNFLKERTGFSIRPVAGYLSPRD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 FLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGHVPLLAEPSFAQFSQEIGLASLGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 FLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGHVPLLAEPSFAQFSQEIGLASLGA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 SEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSSISELKHALSGHAKVKPFDPKITC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 SEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSSISELKHALSGHAKVKPFDPKITC
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 KQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPFGVKYNPYTRSIQILKDTKSITSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 KQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPFGVKYNPYTRSIQILKDTKSITSA
370 380 390 400 410 420
430 440
pF1KE1 MNELQHDLDVVSDALAKVSRKPSI
::::::::::::::::::::::::
CCDS78 MNELQHDLDVVSDALAKVSRKPSI
430 440
>>CCDS31859.1 TPH2 gene_id:121278|Hs108|chr12 (490 aa)
initn: 2213 init1: 2213 opt: 2243 Z-score: 2633.7 bits: 496.6 E(32554): 2.2e-140
Smith-Waterman score: 2243; 71.7% identity (92.5% similar) in 442 aa overlap (4-440:45-486)
10 20
pF1KE1 MIEDNKENKDHS-----LERGRASLIFSLKNEV
:.: :: : : :.....:::::::
CCDS31 RRGFSLDSAVPEEHQLLGSSTLNKPNSGKNDDKGNKGSSKREAATESGKTAVVFSLKNEV
20 30 40 50 60 70
30 40 50 60 70 80
pF1KE1 GGLIKALKIFQEKHVNLLHIESRKSKRRNSEFEIFVDCDINREQLNDIFHLLKSHTNVLS
:::.:::..::::.::..:::::::.::.:: ::::::. .. ..:....::: .:....
CCDS31 GGLVKALRLFQEKRVNMVHIESRKSRRRSSEVEIFVDCECGKTEFNELIQLLKFQTTIVT
80 90 100 110 120 130
90 100 110 120 130 140
pF1KE1 VNLPDNFTLKEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYF
.: :.:. .:. .: :::::.:::.::.:..::::::::::::::::::::::.:::::
CCDS31 LNPPENIWTEEEELEDVPWFPRKISELDKCSHRVLMYGSELDADHPGFKDNVYRQRRKYF
140 150 160 170 180 190
150 160 170 180 190 200
pF1KE1 ADLAMNYKHGDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYRE
.:.::.::.:.:::.::.:::: ::::.::.::.::::::::::::::.:::.:::::::
CCDS31 VDVAMGYKYGQPIPRVEYTEEETKTWGVVFRELSKLYPTHACREYLKNFPLLTKYCGYRE
200 210 220 230 240 250
210 220 230 240 250 260
pF1KE1 DNIPQLEDVSNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEP
::.::::::: :::::.::..:::::::::::::.:::.::::::::.::.:::.:::::
CCDS31 DNVPQLEDVSMFLKERSGFTVRPVAGYLSPRDFLAGLAYRVFHCTQYIRHGSDPLYTPEP
260 270 280 290 300 310
270 280 290 300 310 320
pF1KE1 DTCHELLGHVPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLR
::::::::::::::.:.::::::::::::::::.: :::::::::::.:::::::.::::
CCDS31 DTCHELLGHVPLLADPKFAQFSQEIGLASLGASDEDVQKLATCYFFTIEFGLCKQEGQLR
320 330 340 350 360 370
330 340 350 360 370 380
pF1KE1 VFGAGLLSSISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMRE
..::::::::.::::::: .: :: :::: :: :::::::::..::::::::.::::::.
CCDS31 AYGAGLLSSIGELKHALSDKACVKAFDPKTTCLQECLITTFQEAYFVSESFEEAKEKMRD
380 390 400 410 420 430
390 400 410 420 430 440
pF1KE1 FTKTIKRPFGVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI
:.:.: :::.: .::::.::.:::::.:: .....:. ::..: ::: :...
CCDS31 FAKSITRPFSVYFNPYTQSIEILKDTRSIENVVQDLRSDLNTVCDALNKMNQYLGI
440 450 460 470 480 490
>>CCDS9092.1 PAH gene_id:5053|Hs108|chr12 (452 aa)
initn: 1622 init1: 1458 opt: 1626 Z-score: 1910.2 bits: 362.6 E(32554): 4.5e-100
Smith-Waterman score: 1626; 55.9% identity (80.3% similar) in 431 aa overlap (9-438:26-451)
10 20 30 40
pF1KE1 MIEDNKENKDHSLERGRASLIFSLKNEVGGLIKALKIFQEKHV
.:. . : :::::::.:::.: :.:..:.:. :
CCDS90 MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE1 NLLHIESRKSKRRNSEFEIFVDCDINR-EQLNDIFHLLKSHTNVLSVNLPDNFTLKEDGM
:: ::::: :. ...:.:.:. : :..:...:. .. .: ..
CCDS90 NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELS-----RDKKK
70 80 90 100 110
110 120 130 140 150 160
pF1KE1 ETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKHGDPIP
.::::::. :..::. ::..: ::.::::::::::: ::: ::: :::.:.::.::.:::
CCDS90 DTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIP
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 KVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDVSNFLK
.::. ::: :::::::. :..:: :::: :: . .::: ::::..:::::::::::.::.
CCDS90 RVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQ
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 ERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGHVPLLA
::: .::::: :: ::::.::::::::::::.::.: :.:::::: ::::::::::..
CCDS90 TCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFS
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE1 EPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSSISELK
. :::::::::::::::: .: ..:::: :.:::::::::: .....:::::::..::.
CCDS90 DRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQ
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE1 HALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPFGVKYN
. :: . :. :.. . : :. .: :: .:.:.:::.:::::.:.:. :: :::.:.:.
CCDS90 YCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYD
360 370 380 390 400 410
410 420 430 440
pF1KE1 PYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI
:::. :..: .:... . .. .. .. .:: :.
CCDS90 PYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK
420 430 440 450
>>CCDS7730.1 TH gene_id:7054|Hs108|chr11 (497 aa)
initn: 1426 init1: 1402 opt: 1422 Z-score: 1670.1 bits: 318.4 E(32554): 1.1e-86
Smith-Waterman score: 1449; 50.3% identity (78.7% similar) in 431 aa overlap (14-438:76-496)
10 20 30 40
pF1KE1 MIEDNKENKDHSLERGRA--SLIFSLK-NEVGGLIKALKIFQE
..:.: .:.:: . .. ..: .:.:.:.
CCDS77 RKEREAAVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFET
50 60 70 80 90 100
50 60 70 80 90
pF1KE1 KHVNLLHIESRKSKRRNS---EFEIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTL
.... :.:.: ..: . ..: :: .. : .:. :: ..: .:. : .
CCDS77 FEAKIHHLETRPAQRPRAGGPHLEYFVRLEVRR---GDLAALL---SGVRQVS-ED---V
110 120 130 140 150
100 110 120 130 140 150
pF1KE1 KEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKH
. . :::::.:.:.::.: . : . .:: :::::.:.:::.::: .:..:..:.:
CCDS77 RSPAGPKVPWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRH
160 170 180 190 200 210
160 170 180 190 200 210
pF1KE1 GDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDV
:::::.::.: ::: :: :. :. :: :::: :.:. . :: .. :::::::::::::
CCDS77 GDPIPRVEYTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDV
220 230 240 250 260 270
220 230 240 250 260 270
pF1KE1 SNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGH
: ::::::::..::::: :: ::::..::::::.::::.::.:.:...:::: :::::::
CCDS77 SRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGH
280 290 300 310 320 330
280 290 300 310 320 330
pF1KE1 VPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSS
::.::. .::::::.:::::::::.: ..::.: :.::::::::::.:.....:::::::
CCDS77 VPMLADRTFAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSS
340 350 360 370 380 390
340 350 360 370 380 390
pF1KE1 ISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPF
.:: : :: . ... :::. . : :.:.:::::::: :::.:.: ... :.:::
CCDS77 YGELLHCLSEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPF
400 410 420 430 440 450
400 410 420 430 440
pF1KE1 GVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI
.::..::: .:..: . ... ... .: .::... ::. .
CCDS77 SVKFDPYTLAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG
460 470 480 490
>>CCDS31338.1 TH gene_id:7054|Hs108|chr11 (524 aa)
initn: 1426 init1: 1402 opt: 1422 Z-score: 1669.8 bits: 318.4 E(32554): 1.1e-86
Smith-Waterman score: 1449; 50.3% identity (78.7% similar) in 431 aa overlap (14-438:103-523)
10 20 30 40
pF1KE1 MIEDNKENKDHSLERGRA--SLIFSLK-NEVGGLIKALKIFQE
..:.: .:.:: . .. ..: .:.:.:.
CCDS31 RKEREAAVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFET
80 90 100 110 120 130
50 60 70 80 90
pF1KE1 KHVNLLHIESRKSKRRNS---EFEIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTL
.... :.:.: ..: . ..: :: .. : .:. :: ..: .:. : .
CCDS31 FEAKIHHLETRPAQRPRAGGPHLEYFVRLEVRR---GDLAALL---SGVRQVS-ED---V
140 150 160 170 180
100 110 120 130 140 150
pF1KE1 KEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKH
. . :::::.:.:.::.: . : . .:: :::::.:.:::.::: .:..:..:.:
CCDS31 RSPAGPKVPWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRH
190 200 210 220 230 240
160 170 180 190 200 210
pF1KE1 GDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDV
:::::.::.: ::: :: :. :. :: :::: :.:. . :: .. :::::::::::::
CCDS31 GDPIPRVEYTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDV
250 260 270 280 290 300
220 230 240 250 260 270
pF1KE1 SNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGH
: ::::::::..::::: :: ::::..::::::.::::.::.:.:...:::: :::::::
CCDS31 SRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGH
310 320 330 340 350 360
280 290 300 310 320 330
pF1KE1 VPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSS
::.::. .::::::.:::::::::.: ..::.: :.::::::::::.:.....:::::::
CCDS31 VPMLADRTFAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSS
370 380 390 400 410 420
340 350 360 370 380 390
pF1KE1 ISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPF
.:: : :: . ... :::. . : :.:.:::::::: :::.:.: ... :.:::
CCDS31 YGELLHCLSEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPF
430 440 450 460 470 480
400 410 420 430 440
pF1KE1 GVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI
.::..::: .:..: . ... ... .: .::... ::. .
CCDS31 SVKFDPYTLAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG
490 500 510 520
>>CCDS7731.1 TH gene_id:7054|Hs108|chr11 (528 aa)
initn: 1426 init1: 1402 opt: 1422 Z-score: 1669.7 bits: 318.4 E(32554): 1.1e-86
Smith-Waterman score: 1449; 50.3% identity (78.7% similar) in 431 aa overlap (14-438:107-527)
10 20 30 40
pF1KE1 MIEDNKENKDHSLERGRA--SLIFSLK-NEVGGLIKALKIFQE
..:.: .:.:: . .. ..: .:.:.:.
CCDS77 RKEREAAVAAAAAAVPSEPGDPLEAVAFEEKEGKAVLNLLFSPRATKPSALSRAVKVFET
80 90 100 110 120 130
50 60 70 80 90
pF1KE1 KHVNLLHIESRKSKRRNS---EFEIFVDCDINREQLNDIFHLLKSHTNVLSVNLPDNFTL
.... :.:.: ..: . ..: :: .. : .:. :: ..: .:. : .
CCDS77 FEAKIHHLETRPAQRPRAGGPHLEYFVRLEVRR---GDLAALL---SGVRQVS-ED---V
140 150 160 170 180
100 110 120 130 140 150
pF1KE1 KEDGMETVPWFPKKISDLDHCANRVLMYGSELDADHPGFKDNVYRKRRKYFADLAMNYKH
. . :::::.:.:.::.: . : . .:: :::::.:.:::.::: .:..:..:.:
CCDS77 RSPAGPKVPWFPRKVSELDKCHHLVTKFDPDLDLDHPGFSDQVYRQRRKLIAEIAFQYRH
190 200 210 220 230 240
160 170 180 190 200 210
pF1KE1 GDPIPKVEFTEEEIKTWGTVFQELNKLYPTHACREYLKNLPLLSKYCGYREDNIPQLEDV
:::::.::.: ::: :: :. :. :: :::: :.:. . :: .. :::::::::::::
CCDS77 GDPIPRVEYTAEEIATWKEVYTTLKGLYATHACGEHLEAFALLERFSGYREDNIPQLEDV
250 260 270 280 290 300
220 230 240 250 260 270
pF1KE1 SNFLKERTGFSIRPVAGYLSPRDFLSGLAFRVFHCTQYVRHSSDPFYTPEPDTCHELLGH
: ::::::::..::::: :: ::::..::::::.::::.::.:.:...:::: :::::::
CCDS77 SRFLKERTGFQLRPVAGLLSARDFLASLAFRVFQCTQYIRHASSPMHSPEPDCCHELLGH
310 320 330 340 350 360
280 290 300 310 320 330
pF1KE1 VPLLAEPSFAQFSQEIGLASLGASEEAVQKLATCYFFTVEFGLCKQDGQLRVFGAGLLSS
::.::. .::::::.:::::::::.: ..::.: :.::::::::::.:.....:::::::
CCDS77 VPMLADRTFAQFSQDIGLASLGASDEEIEKLSTLYWFTVEFGLCKQNGEVKAYGAGLLSS
370 380 390 400 410 420
340 350 360 370 380 390
pF1KE1 ISELKHALSGHAKVKPFDPKITCKQECLITTFQDVYFVSESFEDAKEKMREFTKTIKRPF
.:: : :: . ... :::. . : :.:.:::::::: :::.:.: ... :.:::
CCDS77 YGELLHCLSEEPEIRAFDPEAAAVQPYQDQTYQSVYFVSESFSDAKDKLRSYASRIQRPF
430 440 450 460 470 480
400 410 420 430 440
pF1KE1 GVKYNPYTRSIQILKDTKSITSAMNELQHDLDVVSDALAKVSRKPSI
.::..::: .:..: . ... ... .: .::... ::. .
CCDS77 SVKFDPYTLAIDVLDSPQAVRRSLEGVQDELDTLAHALSAIG
490 500 510 520
444 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 15:15:28 2016 done: Sun Nov 6 15:15:28 2016
Total Scan time: 2.780 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]