FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4167, 619 aa
1>>>pF1KE4167 619 - 619 aa - 619 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.1591+/-0.00102; mu= -1.0687+/- 0.061
mean_var=367.5162+/-76.877, 0's: 0 Z-trim(116.5): 877 B-trim: 826 in 1/51
Lambda= 0.066902
statistics sampled from 16095 (17086) to 16095 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.805), E-opt: 0.2 (0.525), width: 16
Scan time: 4.500
The best scores are: opt bits E(32554)
CCDS32830.1 ZBTB7C gene_id:201501|Hs108|chr18 ( 619) 4339 432.9 6e-121
CCDS12119.1 ZBTB7A gene_id:51341|Hs108|chr19 ( 584) 802 91.5 3.4e-18
CCDS1081.1 ZBTB7B gene_id:51043|Hs108|chr1 ( 539) 726 84.1 5.2e-16
CCDS58030.1 ZBTB7B gene_id:51043|Hs108|chr1 ( 573) 726 84.1 5.4e-16
>>CCDS32830.1 ZBTB7C gene_id:201501|Hs108|chr18 (619 aa)
initn: 4339 init1: 4339 opt: 4339 Z-score: 2284.9 bits: 432.9 E(32554): 6e-121
Smith-Waterman score: 4339; 100.0% identity (100.0% similar) in 619 aa overlap (1-619:1-619)
10 20 30 40 50 60
pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 KLFTAGTLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KLFTAGTLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 NVCLEIMEPGGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENLPDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 NVCLEIMEPGGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENLPDP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 QDISCHQSPSKTDHLTEKAYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLLRENLYPKAN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 QDISCHQSPSKTDHLTEKAYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLLRENLYPKAN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 IPDRRPSLSPFAPDFFPHLWPGDFGAFAQLPEQPMDSGPLDLVIKNRKIKEEEKEELPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 IPDRRPSLSPFAPDFFPHLWPGDFGAFAQLPEQPMDSGPLDLVIKNRKIKEEEKEELPPP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 PPPPFPNDFFKDMFPDLPGGPLGPIKAENDYGAYLNFLSATHLGGLFPPWPLVEERKLKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 PPPPFPNDFFKDMFPDLPGGPLGPIKAENDYGAYLNFLSATHLGGLFPPWPLVEERKLKP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 KASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCTICEVRFTRQDKLKIHMRKHTGERPY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 KASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCTICEVRFTRQDKLKIHMRKHTGERPY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE4 LCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYKSFTRSDHLHRHIKRQSCRMARPRRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 LCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYKSFTRSDHLHRHIKRQSCRMARPRRG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE4 RKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVGGHLGGAAVCLPGPSPAKHFLAAPKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVGGHLGGAAVCLPGPSPAKHFLAAPKG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE4 ALSLQELERQFEETQMKLFGRAQLEAERNAGGLLAFALAENVAAARPYFPLPDPWAAGLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ALSLQELERQFEETQMKLFGRAQLEAERNAGGLLAFALAENVAAARPYFPLPDPWAAGLA
550 560 570 580 590 600
610
pF1KE4 GLPGLAGLNHVASMSEANN
:::::::::::::::::::
CCDS32 GLPGLAGLNHVASMSEANN
610
>>CCDS12119.1 ZBTB7A gene_id:51341|Hs108|chr19 (584 aa)
initn: 1322 init1: 790 opt: 802 Z-score: 440.2 bits: 91.5 E(32554): 3.4e-18
Smith-Waterman score: 1249; 41.3% identity (64.3% similar) in 535 aa overlap (1-510:1-520)
10 20 30 40 50 60
pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK
::. .: ::::::.:::..: .::::: .::::::...:. .:. ::::::::::.:::
CCDS12 MAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 KLFTAGTLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIV
::::.:....: :::::::. :::.:...::::.:::....:: ::.:::.::: .
CCDS12 KLFTSGAVVDQQNVYEIDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVS
70 80 90 100 110 120
130 140 150 160 170
pF1KE4 NVCLEIMEP---GGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENL
.:: .... ..:.: . . : :. :. . .: : ... .. :
CCDS12 HVCADLLDRQILAADAGADAGQLDLVDQIDQRNLLRAKEYLEFFQSNPMNSLPPAAAAAA
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE4 PDPQDISCHQSPSKTDHLTEK------AYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLL
. . : . : : : . . : . : :.. : . :.
CCDS12 ASFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERPPTGD-GDEGDS
190 200 210 220 230
240 250 260 270 280
pF1KE4 RENLYPKANIPDRRPSLSPFAPDFFP-------HLWPGDFGAFAQLPEQPMDSGPLDLVI
.:.:. . . :. . : : : : : :.: : . : .
CCDS12 NPGLWPERD--EDAPTGGLFPPPVAPPAATQNGHYGRGGEEEAASLSEAAPEPGDSPGFL
240 250 260 270 280 290
290 300 310 320 330
pF1KE4 KNRKIKEEEKEELPPPPPPPFP-NDFFKDMFPDL--PGGPLGPIKAE---NDYGA---YL
.. : :. : . . ....:. .. :. : : .: :. ::
CCDS12 SG----AAEGEDGDGPDVDGLAASTLLQQMMSSVGRAGAAAGDSDEESRADDKGVMDYYL
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE4 NFLSATHLGGLFPPWPLVEERKLKPKASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCT
...:..: : ..: : :.:.. :: :.::::.:::.::::::::.::::::::: :.
CCDS12 KYFSGAHDGDVYPAWSQKVEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECN
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE4 ICEVRFTRQDKLKIHMRKHTGERPYLCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYK
::.::::::::::.::::::::.:::: .:.: :.::::::::::.:::.:::::. : :
CCDS12 ICKVRFTRQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCK
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE4 SFTRSDHLHRHIKRQSCRMARPRRGRKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVG
.:.::::::::.:...: . :::::: . :. :.: :. .: . : :
CCDS12 TFVRSDHLHRHLKKDGCNGVPSRRGRKPRV-RG-------GAPDPSPGATATPGAPAQPS
480 490 500 510 520
520 530 540 550 560 570
pF1KE4 GHLGGAAVCLPGPSPAKHFLAAPKGALSLQELERQFEETQMKLFGRAQLEAERNAGGLLA
CCDS12 SPDARRNGQEKHFKDEDEDEDVASPDGLGRLNVAGAGGGGDSGGGPGAATDGNFTAGLA
530 540 550 560 570 580
>>CCDS1081.1 ZBTB7B gene_id:51043|Hs108|chr1 (539 aa)
initn: 1277 init1: 678 opt: 726 Z-score: 401.0 bits: 84.1 E(32554): 5.2e-16
Smith-Waterman score: 1182; 41.7% identity (61.0% similar) in 533 aa overlap (1-518:1-491)
10 20 30 40 50 60
pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK
:.. :.:::::::.::::.: :::::. : :::. . .: ::::::.::::::.:::
CCDS10 MGSPEDDLIGIPFPDHSSELLSCLNEQRQLGHLCDLTIRTQGLEYRTHRAVLAACSHYFK
10 20 30 40 50 60
70 80 90 100
pF1KE4 KLFTAG--------------TLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKH
:::: : : .. : :.::: ::::.:.::::::.::: ...:.
CCDS10 KLFTEGGGGAVMGAGGSGTATGGAGAGVCELDFVGPEALGALLEFAYTATLTTSSANMPA
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE4 ILNAARMLEIQCIVNVCLEIMEPGGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDD
.:.:::.::: :.. .:.::.. :.: : . ..:: .. .. : .
CCDS10 VLQAARLLEIPCVIAACMEILQ--GSGLEAPSPDEDDCERA---RQYLEAFATATASGVP
130 140 150 160 170
170 180 190 200 210 220
pF1KE4 DTEDFADQENLPDPQDISCHQSPSKTDHLTEKAYSDTPRDFPDSFQAGSPGHLGVIRDFS
. :: : :: : : .... : :: . ... .:: : . .
CCDS10 NGEDSPPQVPLPPPP-------PPPPRPVARR--SRKPRKAFLQTKGARANHL-VPEVPT
180 190 200 210 220
230 240 250 260 270 280
pF1KE4 IESLLRENLYPKANIPDRRPSLSPFAPDFFPHLWPGDFGAFAQLPEQPMDSGPLDLVIKN
. . . : . .. : : . .: . :. :. :: :.. : .
CCDS10 VPA--HPLTYEEEEVAGRVGSSGGSGPG---DSYSPPTGT-ASPPEGPQSYEPYE-----
230 240 250 260 270
290 300 310 320 330 340
pF1KE4 RKIKEEEKEELPPPPPPPFPNDFFKDMFPDLPGGPLGPIKAENDYGAYLNFLSATHLG-G
:::.::: :: . . . :. :. : . : :::. : .:. :
CCDS10 ---GEEEEEELVYPPAYGLAQGGGPPLSPEELGSDEDAI--DPDLMAYLSSLHQDNLAPG
280 290 300 310 320
350 360 370 380 390 400
pF1KE4 LFPPWPLVEERKLKPKASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCTICEVRFTRQD
: :: :: . . :.::.:::.: :::::::::::::::::. : .: :::::.:
CCDS10 LDSQDKLV--RKRRSQMPQECPVCHKIIHGAGKLPRHMRTHTGEKPFACEVCGVRFTRND
330 340 350 360 370 380
410 420 430 440 450 460
pF1KE4 KLKIHMRKHTGERPYLCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYKSFTRSDHLHR
::::::::::::::: : :: :.:.:.:::::::..::: :::.:..:.:.:.. :::.:
CCDS10 KLKIHMRKHTGERPYSCPHCPARFLHSYDLKNHMHLHTGDRPYECHLCHKAFAKEDHLQR
390 400 410 420 430 440
470 480 490 500 510 520
pF1KE4 HIKRQSCRMARPRRGRKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVGGHLGGAAVCL
:.: :.: .: :: :: : : : :. :: . : .: .:::
CCDS10 HLKGQNCLEVRTRRRRKDDA--------PPHYPPPSTAA-ASPAGLDLSNGHLDTFRLSL
450 460 470 480 490
530 540 550 560 570 580
pF1KE4 PGPSPAKHFLAAPKGALSLQELERQFEETQMKLFGRAQLEAERNAGGLLAFALAENVAAA
CCDS10 ARFWEQSAPTGPPVSTPGPPDDDEEEGAPTTPQAEGAMESS
500 510 520 530
>>CCDS58030.1 ZBTB7B gene_id:51043|Hs108|chr1 (573 aa)
initn: 1277 init1: 678 opt: 726 Z-score: 400.6 bits: 84.1 E(32554): 5.4e-16
Smith-Waterman score: 1182; 41.7% identity (61.0% similar) in 533 aa overlap (1-518:35-525)
10 20 30
pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHD
:.. :.:::::::.::::.: :::::.
CCDS58 GPHPPSPQAAAPGEAWPGPSQAPWQSLEEKMGSPEDDLIGIPFPDHSSELLSCLNEQRQL
10 20 30 40 50 60
40 50 60 70
pF1KE4 GLLCDVLLVVQEQEYRTHRSVLAACSKYFKKLFTAG--------------TLASQPYVYE
: :::. . .: ::::::.::::::.::::::: : : .. : :
CCDS58 GHLCDLTIRTQGLEYRTHRAVLAACSHYFKKLFTEGGGGAVMGAGGSGTATGGAGAGVCE
70 80 90 100 110 120
80 90 100 110 120 130
pF1KE4 IDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIVNVCLEIMEPGGDGGEE
.::: ::::.:.::::::.::: ...:. .:.:::.::: :.. .:.::.. :.: :
CCDS58 LDFVGPEALGALLEFAYTATLTTSSANMPAVLQAARLLEIPCVIAACMEILQ--GSGLEA
130 140 150 160 170 180
140 150 160 170 180 190
pF1KE4 DDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENLPDPQDISCHQSPSKTDHLT
. ..:: .. .. : . . :: : :: : : ..
CCDS58 PSPDEDDCERA---RQYLEAFATATASGVPNGEDSPPQVPLPPPP-------PPPPRPVA
190 200 210 220 230
200 210 220 230 240 250
pF1KE4 EKAYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLLRENLYPKANIPDRRPSLSPFAPDFF
.. : :: . ... .:: : . .. . . : . .. : : . .:
CCDS58 RR--SRKPRKAFLQTKGARANHL-VPEVPTVPA--HPLTYEEEEVAGRVGSSGGSGPG--
240 250 260 270 280
260 270 280 290 300 310
pF1KE4 PHLWPGDFGAFAQLPEQPMDSGPLDLVIKNRKIKEEEKEELPPPPPPPFPNDFFKDMFPD
. :. :. :: :.. : . :::.::: :: . . . :.
CCDS58 -DSYSPPTGT-ASPPEGPQSYEPYE--------GEEEEEELVYPPAYGLAQGGGPPLSPE
290 300 310 320 330
320 330 340 350 360 370
pF1KE4 LPGGPLGPIKAENDYGAYLNFLSATHLG-GLFPPWPLVEERKLKPKASQQCPICHKVIMG
:. : . : :::. : .:. :: :: :: . . :.::.:::.: :
CCDS58 ELGSDEDAI--DPDLMAYLSSLHQDNLAPGLDSQDKLV--RKRRSQMPQECPVCHKIIHG
340 350 360 370 380 390
380 390 400 410 420 430
pF1KE4 AGKLPRHMRTHTGEKPYMCTICEVRFTRQDKLKIHMRKHTGERPYLCIHCNAKFVHNYDL
::::::::::::::::. : .: :::::.:::::::::::::::: : :: :.:.:.:::
CCDS58 AGKLPRHMRTHTGEKPFACEVCGVRFTRNDKLKIHMRKHTGERPYSCPHCPARFLHSYDL
400 410 420 430 440 450
440 450 460 470 480 490
pF1KE4 KNHMRIHTGVRPYQCEFCYKSFTRSDHLHRHIKRQSCRMARPRRGRKPAAWRAASLLFGP
::::..::: :::.:..:.:.:.. :::.::.: :.: .: :: :: : :
CCDS58 KNHMHLHTGDRPYECHLCHKAFAKEDHLQRHLKGQNCLEVRTRRRRKDDA--------PP
460 470 480 490 500
500 510 520 530 540 550
pF1KE4 GGPAPDKAAFVMPPALGEVGGHLGGAAVCLPGPSPAKHFLAAPKGALSLQELERQFEETQ
: :. :: . : .: .:::
CCDS58 HYPPPSTAA-ASPAGLDLSNGHLDTFRLSLARFWEQSAPTGPPVSTPGPPDDDEEEGAPT
510 520 530 540 550 560
619 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 01:45:29 2016 done: Thu Nov 3 01:45:30 2016
Total Scan time: 4.500 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]