FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5579, 355 aa
1>>>pF1KE5579 355 - 355 aa - 355 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.5762+/-0.000937; mu= 6.4654+/- 0.057
mean_var=126.6801+/-24.839, 0's: 0 Z-trim(109.1): 14 B-trim: 80 in 1/51
Lambda= 0.113952
statistics sampled from 10639 (10650) to 10639 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.689), E-opt: 0.2 (0.327), width: 16
Scan time: 2.510
The best scores are: opt bits E(32554)
CCDS48080.1 ATXN3L gene_id:92552|Hs108|chrX ( 355) 2353 397.8 7.1e-111
CCDS9900.1 ATXN3 gene_id:4287|Hs108|chr14 ( 361) 1612 276.0 3.4e-74
CCDS32143.1 ATXN3 gene_id:4287|Hs108|chr14 ( 306) 1238 214.5 9.5e-56
CCDS45154.1 ATXN3 gene_id:4287|Hs108|chr14 ( 346) 1153 200.6 1.7e-51
CCDS73680.1 ATXN3 gene_id:4287|Hs108|chr14 ( 291) 1149 199.9 2.3e-51
CCDS53908.1 ATXN3 gene_id:4287|Hs108|chr14 ( 182) 556 102.3 3.4e-22
>>CCDS48080.1 ATXN3L gene_id:92552|Hs108|chrX (355 aa)
initn: 2353 init1: 2353 opt: 2353 Z-score: 2104.0 bits: 397.8 E(32554): 7.1e-111
Smith-Waterman score: 2353; 100.0% identity (100.0% similar) in 355 aa overlap (1-355:1-355)
10 20 30 40 50 60
pF1KE5 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 NREDEHLRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQEQKQQQQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 NREDEHLRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQEQKQQQQQ
250 260 270 280 290 300
310 320 330 340 350
pF1KE5 SDLPGHSSYLHERPTTSSRAIESDLSDDISEGTVQAAVDTILEIMRKNLKIKGEK
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS48 SDLPGHSSYLHERPTTSSRAIESDLSDDISEGTVQAAVDTILEIMRKNLKIKGEK
310 320 330 340 350
>>CCDS9900.1 ATXN3 gene_id:4287|Hs108|chr14 (361 aa)
initn: 1431 init1: 1311 opt: 1612 Z-score: 1445.6 bits: 276.0 E(32554): 3.4e-74
Smith-Waterman score: 1612; 69.8% identity (85.9% similar) in 361 aa overlap (1-355:1-361)
10 20 30 40 50 60
pF1KE5 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA
:. :::::::: :::::::::::::::::::::.::::::::::::::::::::::.: .
CCDS99 MESIFHEKQEGSLCAQHCLNNLLQGEYFSPVELSSIAHQLDEEERMRMAEGGVTSEDYRT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW
:::::: ::::.::::::::::::: ::::.: ::.::::.: ::::::::::::::.::
CCDS99 FLQQPSGNMDDSGFFSIQVISNALKVWGLELILFNSPEYQRLRIDPINERSFICNYKEHW
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI
::.::.::.::::::::.:::::::: :: :::.:::..::.:::::::::::::::::.
CCDS99 FTVRKLGKQWFNLNSLLTGPELISDTYLALFLAQLQQEGYSIFVVKGDLPDCEADQLLQM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET
: :..: ::: :..:.. ::.::.:: ::.: : .: :: :.::::.:::: :::::
CCDS99 IRVQQMHRPKLIGEELAQLKEQRVHKTDLERVLEANDGSGMLDEDEEDLQRALALSRQEI
190 200 210 220 230 240
250 260 270 280 290
pF1KE5 NREDEH--LRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQ---EQK
. :::. :: .:.::::::: : :::. .:: .. .::. .: .: ::::.:: .:.
CCDS99 DMEDEEADLRRAIQLSMQGSSRNISQDMTQTSGTNLTSEELRKRREAYFEKQQQKQQQQQ
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE5 QQQQQSDLPGHSSYLHERPTTSSRAIESDLSDDISE-GTVQAAVDTILEIMRKNLKIKGE
:::::.:: :.::. :::.::: :. :::.: .:: .:::: :: .:..:: .:.
CCDS99 QQQQQGDLSGQSSHPCERPATSSGALGSDLGDAMSEEDMLQAAVTMSLETVRNDLKTEGK
310 320 330 340 350 360
pF1KE5 K
:
CCDS99 K
>>CCDS32143.1 ATXN3 gene_id:4287|Hs108|chr14 (306 aa)
initn: 1057 init1: 937 opt: 1238 Z-score: 1114.4 bits: 214.5 E(32554): 9.5e-56
Smith-Waterman score: 1238; 65.6% identity (83.9% similar) in 299 aa overlap (63-355:8-306)
40 50 60 70 80 90
pF1KE5 LASIAHQLDEEERMRMAEGGVTSEEYLAFLQQPSENMDDTGFFSIQVISNALKFWGLEII
.::: ::::.::::::::::::: ::::.:
CCDS32 MESIFHEKQPSGNMDDSGFFSIQVISNALKVWGLELI
10 20 30
100 110 120 130 140 150
pF1KE5 HFNNPEYQKLGIDPINERSFICNYKQHWFTIRKFGKHWFNLNSLLAGPELISDTCLANFL
::.::::.: ::::::::::::::.::::.::.::.::::::::.:::::::: :: ::
CCDS32 LFNSPEYQRLRIDPINERSFICNYKEHWFTVRKLGKQWFNLNSLLTGPELISDTYLALFL
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE5 ARLQQQAYSVFVVKGDLPDCEADQLLQIISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKV
:.:::..::.:::::::::::::::::.: :..: ::: :..:.. ::.::.:: ::.:
CCDS32 AQLQQEGYSIFVVKGDLPDCEADQLLQMIRVQQMHRPKLIGEELAQLKEQRVHKTDLERV
100 110 120 130 140 150
220 230 240 250 260 270
pF1KE5 SEESDESGTSDQDEEDFQRALELSRQETNREDEH--LRSTIELSMQGSSGNTSQDLPKTS
: .: :: :.::::.:::: ::::: . :::. :: .:.::::::: : :::. .::
CCDS32 LEANDGSGMLDEDEEDLQRALALSRQEIDMEDEEADLRRAIQLSMQGSSRNISQDMTQTS
160 170 180 190 200 210
280 290 300 310 320
pF1KE5 CVTPASEQPKKIKEDYFEKHQQ---EQKQQQQQSDLPGHSSYLHERPTTSSRAIESDLSD
.. .::. .: .: ::::.:: .:.:::::.:: :.::. :::.::: :. :::.:
CCDS32 GTNLTSEELRKRREAYFEKQQQKQQQQQQQQQQGDLSGQSSHPCERPATSSGALGSDLGD
220 230 240 250 260 270
330 340 350
pF1KE5 DISE-GTVQAAVDTILEIMRKNLKIKGEK
.:: .:::: :: .:..:: .:.:
CCDS32 AMSEEDMLQAAVTMSLETVRNDLKTEGKK
280 290 300
>>CCDS45154.1 ATXN3 gene_id:4287|Hs108|chr14 (346 aa)
initn: 972 init1: 852 opt: 1153 Z-score: 1038.0 bits: 200.6 E(32554): 1.7e-51
Smith-Waterman score: 1480; 66.2% identity (82.0% similar) in 361 aa overlap (1-355:1-346)
10 20 30 40 50 60
pF1KE5 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA
:. :::::::: :::::::::::::::::::::.::::::::::::::::::::::.: .
CCDS45 MESIFHEKQEGSLCAQHCLNNLLQGEYFSPVELSSIAHQLDEEERMRMAEGGVTSEDYRT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW
::: ::::::: ::::.: ::.::::.: ::::::::::::::.::
CCDS45 FLQ---------------VISNALKVWGLELILFNSPEYQRLRIDPINERSFICNYKEHW
70 80 90 100
130 140 150 160 170 180
pF1KE5 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI
::.::.::.::::::::.:::::::: :: :::.:::..::.:::::::::::::::::.
CCDS45 FTVRKLGKQWFNLNSLLTGPELISDTYLALFLAQLQQEGYSIFVVKGDLPDCEADQLLQM
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE5 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET
: :..: ::: :..:.. ::.::.:: ::.: : .: :: :.::::.:::: :::::
CCDS45 IRVQQMHRPKLIGEELAQLKEQRVHKTDLERVLEANDGSGMLDEDEEDLQRALALSRQEI
170 180 190 200 210 220
250 260 270 280 290
pF1KE5 NREDEH--LRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQ---EQK
. :::. :: .:.::::::: : :::. .:: .. .::. .: .: ::::.:: .:.
CCDS45 DMEDEEADLRRAIQLSMQGSSRNISQDMTQTSGTNLTSEELRKRREAYFEKQQQKQQQQQ
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE5 QQQQQSDLPGHSSYLHERPTTSSRAIESDLSDDISE-GTVQAAVDTILEIMRKNLKIKGE
:::::.:: :.::. :::.::: :. :::.: .:: .:::: :: .:..:: .:.
CCDS45 QQQQQGDLSGQSSHPCERPATSSGALGSDLGDAMSEEDMLQAAVTMSLETVRNDLKTEGK
290 300 310 320 330 340
pF1KE5 K
:
CCDS45 K
>>CCDS73680.1 ATXN3 gene_id:4287|Hs108|chr14 (291 aa)
initn: 965 init1: 845 opt: 1149 Z-score: 1035.6 bits: 199.9 E(32554): 2.3e-51
Smith-Waterman score: 1149; 64.1% identity (82.9% similar) in 287 aa overlap (75-355:5-291)
50 60 70 80 90 100
pF1KE5 RMRMAEGGVTSEEYLAFLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGI
: .::::::: ::::.: ::.::::.: :
CCDS73 MESIFHEKVISNALKVWGLELILFNSPEYQRLRI
10 20 30
110 120 130 140 150 160
pF1KE5 DPINERSFICNYKQHWFTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFV
:::::::::::::.::::.::.::.::::::::.:::::::: :: :::.:::..::.::
CCDS73 DPINERSFICNYKEHWFTVRKLGKQWFNLNSLLTGPELISDTYLALFLAQLQQEGYSIFV
40 50 60 70 80 90
170 180 190 200 210 220
pF1KE5 VKGDLPDCEADQLLQIISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQ
:::::::::::::::.: :..: ::: :..:.. ::.::.:: ::.: : .: :: :.
CCDS73 VKGDLPDCEADQLLQMIRVQQMHRPKLIGEELAQLKEQRVHKTDLERVLEANDGSGMLDE
100 110 120 130 140 150
230 240 250 260 270 280
pF1KE5 DEEDFQRALELSRQETNREDEH--LRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKI
::::.:::: ::::: . :::. :: .:.::::::: : :::. .:: .. .::. .:
CCDS73 DEEDLQRALALSRQEIDMEDEEADLRRAIQLSMQGSSRNISQDMTQTSGTNLTSEELRKR
160 170 180 190 200 210
290 300 310 320 330
pF1KE5 KEDYFEKHQQ---EQKQQQQQSDLPGHSSYLHERPTTSSRAIESDLSDDISE-GTVQAAV
.: ::::.:: .:.:::::.:: :.::. :::.::: :. :::.: .:: .::::
CCDS73 REAYFEKQQQKQQQQQQQQQQGDLSGQSSHPCERPATSSGALGSDLGDAMSEEDMLQAAV
220 230 240 250 260 270
340 350
pF1KE5 DTILEIMRKNLKIKGEK
:: .:..:: .:.:
CCDS73 TMSLETVRNDLKTEGKK
280 290
>>CCDS53908.1 ATXN3 gene_id:4287|Hs108|chr14 (182 aa)
initn: 375 init1: 255 opt: 556 Z-score: 511.9 bits: 102.3 E(32554): 3.4e-22
Smith-Waterman score: 556; 54.4% identity (76.9% similar) in 182 aa overlap (180-355:1-182)
150 160 170 180 190 200
pF1KE5 NFLARLQQQAYSVFVVKGDLPDCEADQLLQIISVEEMDTPKLNGKKLVKQKEHRVYKTVL
.: :..: ::: :..:.. ::.::.:: :
CCDS53 MIRVQQMHRPKLIGEELAQLKEQRVHKTDL
10 20 30
210 220 230 240 250 260
pF1KE5 EKVSEESDESGTSDQDEEDFQRALELSRQETNREDEH--LRSTIELSMQGSSGNTSQDLP
:.: : .: :: :.::::.:::: ::::: . :::. :: .:.::::::: : :::.
CCDS53 ERVLEANDGSGMLDEDEEDLQRALALSRQEIDMEDEEADLRRAIQLSMQGSSRNISQDMT
40 50 60 70 80 90
270 280 290 300 310 320
pF1KE5 KTSCVTPASEQPKKIKEDYFEKHQQ---EQKQQQQQSDLPGHSSYLHERPTTSSRAIESD
.:: .. .::. .: .: ::::.:: .:.:::::.:: :.::. :::.::: :. ::
CCDS53 QTSGTNLTSEELRKRREAYFEKQQQKQQQQQQQQQQGDLSGQSSHPCERPATSSGALGSD
100 110 120 130 140 150
330 340 350
pF1KE5 LSDDISE-GTVQAAVDTILEIMRKNLKIKGEK
:.: .:: .:::: :: .:..:: .:.:
CCDS53 LGDAMSEEDMLQAAVTMSLETVRNDLKTEGKK
160 170 180
355 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 02:02:04 2016 done: Tue Nov 8 02:02:04 2016
Total Scan time: 2.510 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]