FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1965, 529 aa
1>>>pF1KE1965 529 - 529 aa - 529 aa
Library: human.CCDS.faa
18921897 residues in 33420 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5137+/-0.000823; mu= 17.7280+/- 0.050
mean_var=77.7352+/-15.130, 0's: 0 Z-trim(108.6): 21 B-trim: 30 in 2/50
Lambda= 0.145467
statistics sampled from 10418 (10428) to 10418 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.691), E-opt: 0.2 (0.312), width: 16
Scan time: 1.400
The best scores are: opt bits E(33420)
CCDS8284.1 TYR gene_id:7299|Hs109|chr11 ( 529) 3753 797.3 0
CCDS34990.1 TYRP1 gene_id:7306|Hs109|chr9 ( 537) 1400 303.4 4.3e-82
CCDS9470.1 DCT gene_id:1638|Hs109|chr13 ( 519) 1389 301.1 2.1e-81
CCDS45060.1 DCT gene_id:1638|Hs109|chr13 ( 552) 1179 257.1 4e-68
>>CCDS8284.1 TYR gene_id:7299|Hs109|chr11 (529 aa)
initn: 3753 init1: 3753 opt: 3753 Z-score: 4256.4 bits: 797.3 E(33420): 0
Smith-Waterman score: 3753; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529)
10 20 30 40 50 60
pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSPCGQLSGRGSCQNILL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSPCGQLSGRGSCQNILL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 SNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNCTERRLLVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 SNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNCTERRLLVR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 RNIFDLSAPEKDKFFAYLTLAKHTISSDYVIPIGTYGQMKNGSTPMFNDINIYDLFVWMH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 RNIFDLSAPEKDKFFAYLTLAKHTISSDYVIPIGTYGQMKNGSTPMFNDINIYDLFVWMH
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 YYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTGDENFTIPYWDWRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 YYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTGDENFTIPYWDWRD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 AEKCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQSLCNGTPEGPLRRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 AEKCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQSLCNGTPEGPLRRN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 PGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEGFASPLTGIADASQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 PGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEGFASPLTGIADASQS
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 SMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHRPLQEVYPEANAPIGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 SMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHRPLQEVYPEANAPIGH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 NRESYMVPFIPLYRNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRIWSWLLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 NRESYMVPFIPLYRNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRIWSWLLG
430 440 450 460 470 480
490 500 510 520
pF1KE1 AAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL
:::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 AAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL
490 500 510 520
>>CCDS34990.1 TYRP1 gene_id:7306|Hs109|chr9 (537 aa)
initn: 1325 init1: 454 opt: 1400 Z-score: 1587.5 bits: 303.4 E(33420): 4.3e-82
Smith-Waterman score: 1439; 41.3% identity (66.2% similar) in 538 aa overlap (3-524:9-529)
10 20 30 40 50
pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCP---PWSGDRSP-CGQLS
:. .. : :: . ..::: :.. . : ::: : :: . ::. :
CCDS34 MSAPKLLSLGCIFFPLLLFQQARAQFPRQCATVEALRSGMCCPDLSPVSGPGTDRCGSSS
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE1 GRGSCQNILLSNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGP
::: :. . .. : .::.: : :::: :: :.::::.:.::: : :::.:. :. :
CCDS34 GRGRCEAVTADSRPHSPQYPHDGRDDREVWPLRFFNRTCHCNGNFSGHNCGTCRPGWRGA
70 80 90 100 110 120
120 130 140 150 160
pF1KE1 NCTERRLLVRRNIFDLSAPEKDKFFAYLTLAKHTISSDYVIPIGTYGQM--KNGSTPMFN
: .: :.::::..::: ::..: : .::.: .:: .. .:.::.:.
CCDS34 ACDQRVLIVRRNLLDLSKEEKNHFVRALDMAKRTTHPLFVIATRRSEEILGPDGNTPQFE
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE1 DINIYDLFVWMHYYVSMDALLG-GSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTG
.:.::. ::: ::: ..:: :.: . ..::.::.:::: ::: ::: :...:..
CCDS34 NISIYNYFVWTHYYSVKKTFLGVGQESFGEVDFSHEGPAFLTWHRYHLLRLEKDMQEMLQ
190 200 210 220 230 240
230 240 250 260 270 280
pF1KE1 DENFTIPYWDWRDAEK-CDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQ
. .:..:::.. ... ::::::. ::.. . .:.:: : ::.:..::. ::.:..
CCDS34 EPSFSLPYWNFATGKNVCDICTDDLMGSRSNFDSTLISPNSVFSQWRVVCDSLEDYDTLG
250 260 270 280 290 300
290 300 310 320 330 340
pF1KE1 SLCNGTPEGPLRRNP-GNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLE
.:::.: .::.:::: :: . . ::: :: :: . ... . . .. :::::.:
CCDS34 TLCNSTEDGPIRRNPAGNVARPMVQRLPEPQDVAQCLEVGLFDTPPFYSNSTNSFRNTVE
310 320 330 340 350 360
350 360 370 380 390 400
pF1KE1 GFASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHR
:...: :: : . :.:: :...::: .:.. : :::::.: :.:.:..:..::::.
CCDS34 GYSDP-TGKYDPAVRSLHNLAHLFLNGTGGQTHLSPNDPIFVLLHTFTDAVFDEWLRRYN
370 380 390 400 410
410 420 430 440 450 460
pF1KE1 PLQEVYPEANAPIGHNRESYMVPFIPLYRNGDFFISSKD-LGYDYSYLQDSDPDSFQDYI
..: ::::::::. :::: : : ..:... : ::: : : : . :
CCDS34 ADISTFPLENAPIGHNRQYNMVPFWPPVTNTEMFVTAPDNLGYTYEIQWPSREFSVPEII
420 430 440 450 460 470
470 480 490 500 510
pF1KE1 KSYLEQASRIWSWLLGAAMVGAVL-TALLAGLVSLLCRHKRKQLPEEKQPLLMEK-----
. :.:::.: .::. : .: : : :... : .:::: ..
CCDS34 ---------------AIAVVGALLLVALIFGTASYLIR-ARRSMDEANQPLLTDQYQCYA
480 490 500 510 520
520
pF1KE1 EDYHSLYQSHL
:.:..:
CCDS34 EEYEKLQNPNQSVV
530
>>CCDS9470.1 DCT gene_id:1638|Hs109|chr13 (519 aa)
initn: 1053 init1: 325 opt: 1389 Z-score: 1575.3 bits: 301.1 E(33420): 2.1e-81
Smith-Waterman score: 1391; 40.1% identity (68.9% similar) in 521 aa overlap (2-515:9-506)
10 20 30 40 50
pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSP-CGQLSGR
::. : : . . . :.:::.:.. .:..::::: ... . ::. .::
CCDS94 MSPLWWGFLLSCLGCKI--LPGAQGQFPRVCMTVDSLVNKECCPRLGAESANVCGSQQGR
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 GSCQNILLSNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNC
:.: .. .. : . . . . :::: :: :..:::.:.::: :.:::.::::. ::::
CCDS94 GQCTEVRADTRPWSGPYILRNQDDRELWPRKFFHRTCKCTGNFAGYNCGDCKFGWTGPNC
60 70 80 90 100 110
120 130 140 150 160
pF1KE1 TERRL-LVRRNIFDLSAPEKDKFFAYLTLAKHTISSDYVIP----IGTYGQMKNGSTPMF
... ..:.:: .:: :...:.. : :::. . :::: .: : ::. :.:
CCDS94 ERKKPPVIRQNIHSLSPQEREQFLGALDLAKKRVHPDYVITTQHWLGLLG--PNGTQPQF
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 NDINIYDLFVWMHYYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTG
. ..::.:::.::: :.::: .. .: :::.:..:::. ::: :: :...:.: :
CCDS94 ANCSVYDFFVWLHYYSVRDTLLGPGRPYRAIDFSHQGPAFVTWHRYHLLCLERDLQRLIG
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 DENFTIPYWDWRDAE-KCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQ
.:.:..:::.. .. .::.:::. .:. .: .:.:.: : ::::. ::. :..::
CCDS94 NESFALPYWNFATGRNECDVCTDQLFGAARPDDPTLISRNSRFSSWETVCDSLDDYNHLV
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE1 SLCNGTPEGPLRRNPGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEG
.::::: :: :::: ... . .::. :.. :::: .... . . ..:::::.:::
CCDS94 TLCNGTYEGLLRRNQMGRN---SMKLPTLKDIRDCLSLQKFDNPPFFQNSTFSFRNALEG
300 310 320 330 340 350
350 360 370 380 390 400
pF1KE1 FASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHRP
: . : :.. :.:: .: ..::: . ...::::::.. :.:.:.::..:..: :
CCDS94 FDKA-DGTLDSQVMSLHNLVHSFLNGTNALPHSAANDPIFVVLHSFTDAIFDEWMKRFNP
360 370 380 390 400 410
410 420 430 440 450 460
pF1KE1 LQEVYPEANAPIGHNRESYMVPFIPLYRNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKS
...:. ::::::: ::::.: : ..:..: .:::.:. : :
CCDS94 PADAWPQELAPIGHNRMYNMVPFFPPVTNEELFLTSDQLGYSYAI----------DLPVS
420 430 440 450 460
470 480 490 500 510 520
pF1KE1 YLEQASRIWSWLLGAAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQ
: . : : ..: ..:.::. :: :: . ..: . ::.
CCDS94 VEETPG--WPTTLLVVM--GTLVALV-GLFVLLAFLQYRRLRKGYTPLMETHLSSKRYTE
470 480 490 500 510
pF1KE1 SHL
CCDS94 EA
>>CCDS45060.1 DCT gene_id:1638|Hs109|chr13 (552 aa)
initn: 1097 init1: 313 opt: 1179 Z-score: 1336.7 bits: 257.1 E(33420): 4e-68
Smith-Waterman score: 1322; 38.1% identity (65.0% similar) in 554 aa overlap (2-515:9-539)
10 20 30 40 50
pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSP-CGQLSGR
::. : : . . . :.:::.:.. .:..::::: ... . ::. .::
CCDS45 MSPLWWGFLLSCLGCKI--LPGAQGQFPRVCMTVDSLVNKECCPRLGAESANVCGSQQGR
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 GSCQNILLSNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNC
:.: .. .. : . . . . :::: :: :..:::.:.::: :.:::.::::. ::::
CCDS45 GQCTEVRADTRPWSGPYILRNQDDRELWPRKFFHRTCKCTGNFAGYNCGDCKFGWTGPNC
60 70 80 90 100 110
120 130 140 150 160
pF1KE1 TERRL-LVRRNIFDLSAPEKDKFFAYLTLAKHTISSDYVIP----IGTYGQMKNGSTPMF
... ..:.:: .:: :...:.. : :::. . :::: .: : ::. :.:
CCDS45 ERKKPPVIRQNIHSLSPQEREQFLGALDLAKKRVHPDYVITTQHWLGLLG--PNGTQPQF
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE1 NDINIYDLFVWMHYYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTG
. ..::.:::.::: :.::: .. .: :::.:..:::. ::: :: :...:.: :
CCDS45 ANCSVYDFFVWLHYYSVRDTLLGPGRPYRAIDFSHQGPAFVTWHRYHLLCLERDLQRLIG
180 190 200 210 220 230
230 240 250 260 270 280
pF1KE1 DENFTIPYWDWRDAE-KCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQ
.:.:..:::.. .. .::.:::. .:. .: .:.:.: : ::::. ::. :..::
CCDS45 NESFALPYWNFATGRNECDVCTDQLFGAARPDDPTLISRNSRFSSWETVCDSLDDYNHLV
240 250 260 270 280 290
290 300 310 320 330 340
pF1KE1 SLCNGTPEGPLRRNPGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEG
.::::: :: :::: ... . .::. :.. :::: .... . . ..:::::.:::
CCDS45 TLCNGTYEGLLRRNQMGRN---SMKLPTLKDIRDCLSLQKFDNPPFFQNSTFSFRNALEG
300 310 320 330 340 350
350 360 370 380
pF1KE1 FASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFL-------------------
: . : :.. :.:: .: ..::: . ...::::::.
CCDS45 FDKA-DGTLDSQVMSLHNLVHSFLNGTNALPHSAANDPIFVVISNRLLYNATTNILEHVR
360 370 380 390 400 410
390 400 410 420 430
pF1KE1 ----------LH----HAFVDSIFEQWLRRHRPLQEVYPEANAPIGHNRESYMVPFIPLY
:: :.:.:.::..:..: : ...:. ::::::: ::::.:
CCDS45 KEKATKELPSLHVLVLHSFTDAIFDEWMKRFNPPADAWPQELAPIGHNRMYNMVPFFPPV
420 430 440 450 460 470
440 450 460 470 480 490
pF1KE1 RNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRIWSWLLGAAMVGAVLTALLA
: ..:..: .:::.:. : : : . : : ..: ..:.::.
CCDS45 TNEELFLTSDQLGYSYAI----------DLPVSVEETPG--WPTTLLVVM--GTLVALV-
480 490 500 510
500 510 520
pF1KE1 GLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL
:: :: . ..: . ::.
CCDS45 GLFVLLAFLQYRRLRKGYTPLMETHLSSKRYTEEA
520 530 540 550
529 residues in 1 query sequences
18921897 residues in 33420 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Jul 3 20:42:49 2020 done: Fri Jul 3 20:42:49 2020
Total Scan time: 1.400 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]