FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5579, 355 aa 1>>>pF1KE5579 355 - 355 aa - 355 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.5762+/-0.000937; mu= 6.4654+/- 0.057 mean_var=126.6801+/-24.839, 0's: 0 Z-trim(109.1): 14 B-trim: 80 in 1/51 Lambda= 0.113952 statistics sampled from 10639 (10650) to 10639 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.689), E-opt: 0.2 (0.327), width: 16 Scan time: 2.510 The best scores are: opt bits E(32554) CCDS48080.1 ATXN3L gene_id:92552|Hs108|chrX ( 355) 2353 397.8 7.1e-111 CCDS9900.1 ATXN3 gene_id:4287|Hs108|chr14 ( 361) 1612 276.0 3.4e-74 CCDS32143.1 ATXN3 gene_id:4287|Hs108|chr14 ( 306) 1238 214.5 9.5e-56 CCDS45154.1 ATXN3 gene_id:4287|Hs108|chr14 ( 346) 1153 200.6 1.7e-51 CCDS73680.1 ATXN3 gene_id:4287|Hs108|chr14 ( 291) 1149 199.9 2.3e-51 CCDS53908.1 ATXN3 gene_id:4287|Hs108|chr14 ( 182) 556 102.3 3.4e-22 >>CCDS48080.1 ATXN3L gene_id:92552|Hs108|chrX (355 aa) initn: 2353 init1: 2353 opt: 2353 Z-score: 2104.0 bits: 397.8 E(32554): 7.1e-111 Smith-Waterman score: 2353; 100.0% identity (100.0% similar) in 355 aa overlap (1-355:1-355) 10 20 30 40 50 60 pF1KE5 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 NREDEHLRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQEQKQQQQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 NREDEHLRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQEQKQQQQQ 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 SDLPGHSSYLHERPTTSSRAIESDLSDDISEGTVQAAVDTILEIMRKNLKIKGEK ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS48 SDLPGHSSYLHERPTTSSRAIESDLSDDISEGTVQAAVDTILEIMRKNLKIKGEK 310 320 330 340 350 >>CCDS9900.1 ATXN3 gene_id:4287|Hs108|chr14 (361 aa) initn: 1431 init1: 1311 opt: 1612 Z-score: 1445.6 bits: 276.0 E(32554): 3.4e-74 Smith-Waterman score: 1612; 69.8% identity (85.9% similar) in 361 aa overlap (1-355:1-361) 10 20 30 40 50 60 pF1KE5 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA :. :::::::: :::::::::::::::::::::.::::::::::::::::::::::.: . CCDS99 MESIFHEKQEGSLCAQHCLNNLLQGEYFSPVELSSIAHQLDEEERMRMAEGGVTSEDYRT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW :::::: ::::.::::::::::::: ::::.: ::.::::.: ::::::::::::::.:: CCDS99 FLQQPSGNMDDSGFFSIQVISNALKVWGLELILFNSPEYQRLRIDPINERSFICNYKEHW 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI ::.::.::.::::::::.:::::::: :: :::.:::..::.:::::::::::::::::. CCDS99 FTVRKLGKQWFNLNSLLTGPELISDTYLALFLAQLQQEGYSIFVVKGDLPDCEADQLLQM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET : :..: ::: :..:.. ::.::.:: ::.: : .: :: :.::::.:::: ::::: CCDS99 IRVQQMHRPKLIGEELAQLKEQRVHKTDLERVLEANDGSGMLDEDEEDLQRALALSRQEI 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 NREDEH--LRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQ---EQK . :::. :: .:.::::::: : :::. .:: .. .::. .: .: ::::.:: .:. CCDS99 DMEDEEADLRRAIQLSMQGSSRNISQDMTQTSGTNLTSEELRKRREAYFEKQQQKQQQQQ 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 QQQQQSDLPGHSSYLHERPTTSSRAIESDLSDDISE-GTVQAAVDTILEIMRKNLKIKGE :::::.:: :.::. :::.::: :. :::.: .:: .:::: :: .:..:: .:. CCDS99 QQQQQGDLSGQSSHPCERPATSSGALGSDLGDAMSEEDMLQAAVTMSLETVRNDLKTEGK 310 320 330 340 350 360 pF1KE5 K : CCDS99 K >>CCDS32143.1 ATXN3 gene_id:4287|Hs108|chr14 (306 aa) initn: 1057 init1: 937 opt: 1238 Z-score: 1114.4 bits: 214.5 E(32554): 9.5e-56 Smith-Waterman score: 1238; 65.6% identity (83.9% similar) in 299 aa overlap (63-355:8-306) 40 50 60 70 80 90 pF1KE5 LASIAHQLDEEERMRMAEGGVTSEEYLAFLQQPSENMDDTGFFSIQVISNALKFWGLEII .::: ::::.::::::::::::: ::::.: CCDS32 MESIFHEKQPSGNMDDSGFFSIQVISNALKVWGLELI 10 20 30 100 110 120 130 140 150 pF1KE5 HFNNPEYQKLGIDPINERSFICNYKQHWFTIRKFGKHWFNLNSLLAGPELISDTCLANFL ::.::::.: ::::::::::::::.::::.::.::.::::::::.:::::::: :: :: CCDS32 LFNSPEYQRLRIDPINERSFICNYKEHWFTVRKLGKQWFNLNSLLTGPELISDTYLALFL 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE5 ARLQQQAYSVFVVKGDLPDCEADQLLQIISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKV :.:::..::.:::::::::::::::::.: :..: ::: :..:.. ::.::.:: ::.: CCDS32 AQLQQEGYSIFVVKGDLPDCEADQLLQMIRVQQMHRPKLIGEELAQLKEQRVHKTDLERV 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE5 SEESDESGTSDQDEEDFQRALELSRQETNREDEH--LRSTIELSMQGSSGNTSQDLPKTS : .: :: :.::::.:::: ::::: . :::. :: .:.::::::: : :::. .:: CCDS32 LEANDGSGMLDEDEEDLQRALALSRQEIDMEDEEADLRRAIQLSMQGSSRNISQDMTQTS 160 170 180 190 200 210 280 290 300 310 320 pF1KE5 CVTPASEQPKKIKEDYFEKHQQ---EQKQQQQQSDLPGHSSYLHERPTTSSRAIESDLSD .. .::. .: .: ::::.:: .:.:::::.:: :.::. :::.::: :. :::.: CCDS32 GTNLTSEELRKRREAYFEKQQQKQQQQQQQQQQGDLSGQSSHPCERPATSSGALGSDLGD 220 230 240 250 260 270 330 340 350 pF1KE5 DISE-GTVQAAVDTILEIMRKNLKIKGEK .:: .:::: :: .:..:: .:.: CCDS32 AMSEEDMLQAAVTMSLETVRNDLKTEGKK 280 290 300 >>CCDS45154.1 ATXN3 gene_id:4287|Hs108|chr14 (346 aa) initn: 972 init1: 852 opt: 1153 Z-score: 1038.0 bits: 200.6 E(32554): 1.7e-51 Smith-Waterman score: 1480; 66.2% identity (82.0% similar) in 361 aa overlap (1-355:1-346) 10 20 30 40 50 60 pF1KE5 MDFIFHEKQEGFLCAQHCLNNLLQGEYFSPVELASIAHQLDEEERMRMAEGGVTSEEYLA :. :::::::: :::::::::::::::::::::.::::::::::::::::::::::.: . CCDS45 MESIFHEKQEGSLCAQHCLNNLLQGEYFSPVELSSIAHQLDEEERMRMAEGGVTSEDYRT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 FLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGIDPINERSFICNYKQHW ::: ::::::: ::::.: ::.::::.: ::::::::::::::.:: CCDS45 FLQ---------------VISNALKVWGLELILFNSPEYQRLRIDPINERSFICNYKEHW 70 80 90 100 130 140 150 160 170 180 pF1KE5 FTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFVVKGDLPDCEADQLLQI ::.::.::.::::::::.:::::::: :: :::.:::..::.:::::::::::::::::. CCDS45 FTVRKLGKQWFNLNSLLTGPELISDTYLALFLAQLQQEGYSIFVVKGDLPDCEADQLLQM 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE5 ISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQDEEDFQRALELSRQET : :..: ::: :..:.. ::.::.:: ::.: : .: :: :.::::.:::: ::::: CCDS45 IRVQQMHRPKLIGEELAQLKEQRVHKTDLERVLEANDGSGMLDEDEEDLQRALALSRQEI 170 180 190 200 210 220 250 260 270 280 290 pF1KE5 NREDEH--LRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKIKEDYFEKHQQ---EQK . :::. :: .:.::::::: : :::. .:: .. .::. .: .: ::::.:: .:. CCDS45 DMEDEEADLRRAIQLSMQGSSRNISQDMTQTSGTNLTSEELRKRREAYFEKQQQKQQQQQ 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE5 QQQQQSDLPGHSSYLHERPTTSSRAIESDLSDDISE-GTVQAAVDTILEIMRKNLKIKGE :::::.:: :.::. :::.::: :. :::.: .:: .:::: :: .:..:: .:. CCDS45 QQQQQGDLSGQSSHPCERPATSSGALGSDLGDAMSEEDMLQAAVTMSLETVRNDLKTEGK 290 300 310 320 330 340 pF1KE5 K : CCDS45 K >>CCDS73680.1 ATXN3 gene_id:4287|Hs108|chr14 (291 aa) initn: 965 init1: 845 opt: 1149 Z-score: 1035.6 bits: 199.9 E(32554): 2.3e-51 Smith-Waterman score: 1149; 64.1% identity (82.9% similar) in 287 aa overlap (75-355:5-291) 50 60 70 80 90 100 pF1KE5 RMRMAEGGVTSEEYLAFLQQPSENMDDTGFFSIQVISNALKFWGLEIIHFNNPEYQKLGI : .::::::: ::::.: ::.::::.: : CCDS73 MESIFHEKVISNALKVWGLELILFNSPEYQRLRI 10 20 30 110 120 130 140 150 160 pF1KE5 DPINERSFICNYKQHWFTIRKFGKHWFNLNSLLAGPELISDTCLANFLARLQQQAYSVFV :::::::::::::.::::.::.::.::::::::.:::::::: :: :::.:::..::.:: CCDS73 DPINERSFICNYKEHWFTVRKLGKQWFNLNSLLTGPELISDTYLALFLAQLQQEGYSIFV 40 50 60 70 80 90 170 180 190 200 210 220 pF1KE5 VKGDLPDCEADQLLQIISVEEMDTPKLNGKKLVKQKEHRVYKTVLEKVSEESDESGTSDQ :::::::::::::::.: :..: ::: :..:.. ::.::.:: ::.: : .: :: :. CCDS73 VKGDLPDCEADQLLQMIRVQQMHRPKLIGEELAQLKEQRVHKTDLERVLEANDGSGMLDE 100 110 120 130 140 150 230 240 250 260 270 280 pF1KE5 DEEDFQRALELSRQETNREDEH--LRSTIELSMQGSSGNTSQDLPKTSCVTPASEQPKKI ::::.:::: ::::: . :::. :: .:.::::::: : :::. .:: .. .::. .: CCDS73 DEEDLQRALALSRQEIDMEDEEADLRRAIQLSMQGSSRNISQDMTQTSGTNLTSEELRKR 160 170 180 190 200 210 290 300 310 320 330 pF1KE5 KEDYFEKHQQ---EQKQQQQQSDLPGHSSYLHERPTTSSRAIESDLSDDISE-GTVQAAV .: ::::.:: .:.:::::.:: :.::. :::.::: :. :::.: .:: .:::: CCDS73 REAYFEKQQQKQQQQQQQQQQGDLSGQSSHPCERPATSSGALGSDLGDAMSEEDMLQAAV 220 230 240 250 260 270 340 350 pF1KE5 DTILEIMRKNLKIKGEK :: .:..:: .:.: CCDS73 TMSLETVRNDLKTEGKK 280 290 >>CCDS53908.1 ATXN3 gene_id:4287|Hs108|chr14 (182 aa) initn: 375 init1: 255 opt: 556 Z-score: 511.9 bits: 102.3 E(32554): 3.4e-22 Smith-Waterman score: 556; 54.4% identity (76.9% similar) in 182 aa overlap (180-355:1-182) 150 160 170 180 190 200 pF1KE5 NFLARLQQQAYSVFVVKGDLPDCEADQLLQIISVEEMDTPKLNGKKLVKQKEHRVYKTVL .: :..: ::: :..:.. ::.::.:: : CCDS53 MIRVQQMHRPKLIGEELAQLKEQRVHKTDL 10 20 30 210 220 230 240 250 260 pF1KE5 EKVSEESDESGTSDQDEEDFQRALELSRQETNREDEH--LRSTIELSMQGSSGNTSQDLP :.: : .: :: :.::::.:::: ::::: . :::. :: .:.::::::: : :::. CCDS53 ERVLEANDGSGMLDEDEEDLQRALALSRQEIDMEDEEADLRRAIQLSMQGSSRNISQDMT 40 50 60 70 80 90 270 280 290 300 310 320 pF1KE5 KTSCVTPASEQPKKIKEDYFEKHQQ---EQKQQQQQSDLPGHSSYLHERPTTSSRAIESD .:: .. .::. .: .: ::::.:: .:.:::::.:: :.::. :::.::: :. :: CCDS53 QTSGTNLTSEELRKRREAYFEKQQQKQQQQQQQQQQGDLSGQSSHPCERPATSSGALGSD 100 110 120 130 140 150 330 340 350 pF1KE5 LSDDISE-GTVQAAVDTILEIMRKNLKIKGEK :.: .:: .:::: :: .:..:: .:.: CCDS53 LGDAMSEEDMLQAAVTMSLETVRNDLKTEGKK 160 170 180 355 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 02:02:04 2016 done: Tue Nov 8 02:02:04 2016 Total Scan time: 2.510 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]