FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1572, 441 aa
1>>>pF1KSDA1572 441 - 441 aa - 441 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.4727+/-0.00131; mu= 2.8543+/- 0.076
mean_var=267.2253+/-57.515, 0's: 0 Z-trim(108.5): 864 B-trim: 415 in 1/50
Lambda= 0.078458
statistics sampled from 9288 (10277) to 9288 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.672), E-opt: 0.2 (0.316), width: 16
Scan time: 3.130
The best scores are: opt bits E(32554)
CCDS6847.1 ZBTB26 gene_id:57684|Hs108|chr9 ( 441) 3022 356.0 4.4e-98
CCDS6846.1 ZBTB6 gene_id:10773|Hs108|chr9 ( 424) 672 89.9 5.1e-18
CCDS4727.1 ZBTB12 gene_id:221527|Hs108|chr6 ( 459) 472 67.3 3.5e-11
>>CCDS6847.1 ZBTB26 gene_id:57684|Hs108|chr9 (441 aa)
initn: 3022 init1: 3022 opt: 3022 Z-score: 1874.3 bits: 356.0 E(32554): 4.4e-98
Smith-Waterman score: 3022; 100.0% identity (100.0% similar) in 441 aa overlap (1-441:1-441)
10 20 30 40 50 60
pF1KSD MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD QALWKFIKPKQPMDSKEGCEPQSASPQSKEQQGDARGSPKQDSPCIHPSEDSMDMEDSDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 QALWKFIKPKQPMDSKEGCEPQSASPQSKEQQGDARGSPKQDSPCIHPSEDSMDMEDSDI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD QIVKVESIGDVSEVRSKKDQNQFISSEPTALHSSEPQHSLINSTVENRVSEIEQNHLHNY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 QIVKVESIGDVSEVRSKKDQNQFISSEPTALHSSEPQHSLINSTVENRVSEIEQNHLHNY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD ALSYTGSDNIIMASKDVFGPNIRGVDKGLQWHHQCPKCTRVFRHLENYANHLKMHKLFMC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 ALSYTGSDNIIMASKDVFGPNIRGVDKGLQWHHQCPKCTRVFRHLENYANHLKMHKLFMC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD LLCGKTFTQKGNLHRHMRVHAGIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCNYCD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 LLCGKTFTQKGNLHRHMRVHAGIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCNYCD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD MVFAHKPVLRKHLKQLHGKNSFDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDATQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS68 MVFAHKPVLRKHLKQLHGKNSFDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDATQV
370 380 390 400 410 420
430 440
pF1KSD LDAGKLAQAVLNLRNDSTCVN
:::::::::::::::::::::
CCDS68 LDAGKLAQAVLNLRNDSTCVN
430 440
>>CCDS6846.1 ZBTB6 gene_id:10773|Hs108|chr9 (424 aa)
initn: 1391 init1: 570 opt: 672 Z-score: 437.0 bits: 89.9 E(32554): 5.1e-18
Smith-Waterman score: 1178; 46.0% identity (70.0% similar) in 420 aa overlap (1-381:1-409)
10 20 30 40 50 60
pF1KSD MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD
:. .::.:::.::. :: .::::: ::..: ::::.. :.: : ::::...:: : :.::
CCDS68 MAAESDVLHFQFEQQGDVVLQKMNLLRQQNLFCDVSIYINDTEFQGHKVILAACSTFMRD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT
::::..:..:.:.::::.::::.::::::.:.:: . ::..::::::.::: ::::.::
CCDS68 QFLLTQSKHVRITILQSAEVGRKLLLSCYTGALEVKRKELLKYLTAASYLQMVHIVEKCT
70 80 90 100 110 120
130 140 150
pF1KSD QALWKFIKPKQPM----------------------DSKEGCE--------PQSASPQSKE
.:: :... : .: . :: : . . . ::
CCDS68 EALSKYLEIDLSMKNNNQHTDLCQSSDPDVKNEDENSDKDCEIIEISEDSPVNIDFHVKE
130 140 150 160 170 180
160 170 180 190 200
pF1KSD QQGDARGSP-----KQDSPCIHPSEDSMDM--EDSDIQIVKVESIGDVSEVRSKKDQ-NQ
....: : .. . : ...:. .:..: :..:::: : . .. : .:
CCDS68 EESNALQSTVESLTSERKEMKSPELSTVDIGFKDNEICILHVESI---STAGVENGQFSQ
190 200 210 220 230
210 220 230 240 250 260
pF1KSD FISSEPTALHSSEPQHSLINSTVENRVSEIEQNHLHN-YALSYTGSDNIIMASKDVFGPN
.: .... :: ::::::::::.::.:. :. .. . . :: . . .
CCDS68 PCTSSKASMYFSETQHSLINSTVESRVAEVPGNQDQGLFCENTEGSYGTV--------SE
240 250 260 270 280
270 280 290 300 310 320
pF1KSD IRGVDKGLQWHHQCPKCTRVFRHLENYANHLKMHKLFMCLLCGKTFTQKGNLHRHMRVHA
:.....: . .::::.: : : :.::: ::::::::.:: :::::::: ::.::.: :
CCDS68 IQNLEEGYSLRHQCPRCPRGFLHVENYLRHLKMHKLFLCLQCGKTFTQKKNLNRHIRGHM
290 300 310 320 330 340
330 340 350 360 370 380
pF1KSD GIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCNYCDMVFAHKPVLRKHLKQLHGKNS
::.:::: .: :::. : .::::::.::::.:.::. ::: : :: .:.::: ..::..:
CCDS68 GIRPFQCTVCLKTFTAKSTLQDHLNIHSGDRPYKCHCCDMDFKHKSALKKHLTSVHGRSS
350 360 370 380 390 400
390 400 410 420 430 440
pF1KSD FDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDATQVLDAGKLAQAVLNLRNDSTCVN
CCDS68 GEKLSRPDLKRQSLL
410 420
>>CCDS4727.1 ZBTB12 gene_id:221527|Hs108|chr6 (459 aa)
initn: 1134 init1: 455 opt: 472 Z-score: 314.2 bits: 67.3 E(32554): 3.5e-11
Smith-Waterman score: 871; 36.0% identity (62.0% similar) in 458 aa overlap (1-395:1-456)
10 20 30 40 50 60
pF1KSD MSERSDLLHFKFENYGDSMLQKMNKLREENKFCDVTVLIDDIEVQGHKIVFAAGSPFLRD
:. ..:.:.. .. . :..::.:: :..:::::.. :... .:::...:: ::::::
CCDS47 MASGVEVLRFQLPGHEAATLRNMNQLRAEERFCDVTIVADSLKFRGHKVILAACSPFLRD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD QFLLNDSREVKISILQSSEVGRQLLLSCYSGVLEFPEMELVNYLTAASFLQMSHIVERCT
::::: : :...:...:... .::::::.:.::: ..::::::::.::: :.::.:
CCDS47 QFLLNPSSELQVSLMHSARIVADLLLSCYTGALEFAVRDIVNYLTAASYLQMEHVVEKCR
70 80 90 100 110 120
130 140 150 160
pF1KSD QALWKFIKPKQPMDSKEGCEP----------QSASPQSKEQQGDARGSPKQD--SPCIHP
.:: .::.:: . ...: .: : .. . . : : ..:
CCDS47 NALSQFIEPKIGL-KEDGVSEASLVSSISATKSLLPPARTPKPAPKPPPPPPLPPPLLRP
130 140 150 160 170
170 180 190 200
pF1KSD ----------------SEDSMDMED-SDIQIVKVESIGDVSEVRSKKDQNQ--------F
:: . :: ::: :::::: .:.. : : .
CCDS47 VKLEFPLDEDLELKAEEEDEDEDEDVSDICIVKVESALEVAH-RLKPPGGLGGGLGIGGS
180 190 200 210 220 230
210 220 230 240 250
pF1KSD ISSEPTAL-HSSEPQHSLI--NSTVENRVSEIEQNHLHNYALSYTGSDNI----------
.... : .:: : .. ...:. : :. . .. : : ..
CCDS47 VGGHLGELAQSSVPPSTVAPPQGVVKACYSLSEDAEGEGLLLIPGGRASVGATSGLVEAA
240 250 260 270 280 290
260 270 280 290
pF1KSD --IMASKDV---------FGPNIRGVDKGLQWHH-QCPKCTRVFRHLENYANHLK-MHKL
::.. . :: : . : .. .: :: .::. .:. . :.. .: .
CCDS47 AVAMAARGAGGSLGAGGSRGPLPGGFSGGNPLKNIKCTKCPEVFQGVEKLVFHMRAQHFI
300 310 320 330 340 350
300 310 320 330 340 350
pF1KSD FMCLLCGKTFTQKGNLHRHMRVHAGIKPFQCKICGKTFSQKCSLQDHLNLHSGDKPHKCN
::: ::: :....::.::: :: :.: .: :::: :.:: .:.:::::::: .:..:.
CCDS47 FMCPRCGKQFNHSSNLNRHMNVHRGVKSHSCGICGKCFTQKSTLHDHLNLHSGARPYRCS
360 370 380 390 400 410
360 370 380 390 400 410
pF1KSD YCDMVFAHKPVLRKHLKQLHGKNSFDNANERNVQDLTVDFDSFACTTVTDSKGCQPQPDA
:::. :::::..:.:::. :::.. .:. : .: ...:
CCDS47 YCDVRFAHKPAIRRHLKEQHGKTTAENVLEASVAEINVLIR
420 430 440 450
420 430 440
pF1KSD TQVLDAGKLAQAVLNLRNDSTCVN
441 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:41:01 2016 done: Thu Nov 3 06:41:02 2016
Total Scan time: 3.130 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]