FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB7056, 584 aa 1>>>pF1KB7056 584 - 584 aa - 584 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.9008+/-0.000952; mu= 5.3800+/- 0.057 mean_var=288.9508+/-60.061, 0's: 0 Z-trim(115.6): 928 B-trim: 0 in 0/52 Lambda= 0.075451 statistics sampled from 15108 (16139) to 15108 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.787), E-opt: 0.2 (0.496), width: 16 Scan time: 3.290 The best scores are: opt bits E(32554) CCDS12119.1 ZBTB7A gene_id:51341|Hs108|chr19 ( 584) 4022 451.3 1.6e-126 CCDS32830.1 ZBTB7C gene_id:201501|Hs108|chr18 ( 619) 802 100.8 5.4e-21 CCDS1081.1 ZBTB7B gene_id:51043|Hs108|chr1 ( 539) 751 95.2 2.3e-19 CCDS58030.1 ZBTB7B gene_id:51043|Hs108|chr1 ( 573) 751 95.2 2.4e-19 >>CCDS12119.1 ZBTB7A gene_id:51341|Hs108|chr19 (584 aa) initn: 4022 init1: 4022 opt: 4022 Z-score: 2385.0 bits: 451.3 E(32554): 1.6e-126 Smith-Waterman score: 4022; 100.0% identity (100.0% similar) in 584 aa overlap (1-584:1-584) 10 20 30 40 50 60 pF1KB7 MAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 KLFTSGAVVDQQNVYEIDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 KLFTSGAVVDQQNVYEIDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 HVCADLLDRQILAADAGADAGQLDLVDQIDQRNLLRAKEYLEFFQSNPMNSLPPAAAAAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 HVCADLLDRQILAADAGADAGQLDLVDQIDQRNLLRAKEYLEFFQSNPMNSLPPAAAAAA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB7 ASFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERPPTGDGDEGDSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 ASFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERPPTGDGDEGDSN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB7 PGLWPERDEDAPTGGLFPPPVAPPAATQNGHYGRGGEEEAASLSEAAPEPGDSPGFLSGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 PGLWPERDEDAPTGGLFPPPVAPPAATQNGHYGRGGEEEAASLSEAAPEPGDSPGFLSGA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB7 AEGEDGDGPDVDGLAASTLLQQMMSSVGRAGAAAGDSDEESRADDKGVMDYYLKYFSGAH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AEGEDGDGPDVDGLAASTLLQQMMSSVGRAGAAAGDSDEESRADDKGVMDYYLKYFSGAH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB7 DGDVYPAWSQKVEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECNICKVRFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 DGDVYPAWSQKVEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECNICKVRFT 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 RQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCKTFVRSDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 RQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCKTFVRSDH 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 LHRHLKKDGCNGVPSRRGRKPRVRGGAPDPSPGATATPGAPAQPSSPDARRNGQEKHFKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LHRHLKKDGCNGVPSRRGRKPRVRGGAPDPSPGATATPGAPAQPSSPDARRNGQEKHFKD 490 500 510 520 530 540 550 560 570 580 pF1KB7 EDEDEDVASPDGLGRLNVAGAGGGGDSGGGPGAATDGNFTAGLA :::::::::::::::::::::::::::::::::::::::::::: CCDS12 EDEDEDVASPDGLGRLNVAGAGGGGDSGGGPGAATDGNFTAGLA 550 560 570 580 >>CCDS32830.1 ZBTB7C gene_id:201501|Hs108|chr18 (619 aa) initn: 1322 init1: 790 opt: 802 Z-score: 490.5 bits: 100.8 E(32554): 5.4e-21 Smith-Waterman score: 1249; 41.3% identity (64.3% similar) in 535 aa overlap (1-520:1-510) 10 20 30 40 50 60 pF1KB7 MAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFK ::. .: ::::::.:::..: .::::: .::::::...:. .:. ::::::::::.::: CCDS32 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB7 KLFTSGAVVDQQNVYEIDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVS ::::.:....: :::::::. :::.:...::::.:::....:: ::.:::.::: . CCDS32 KLFTAGTLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB7 HVCADLLDRQILAADAGADAGQLDLVDQIDQRNLLRAKEYLEFFQSNPMNSLPPAAAAAA .:: .... ..:.: . . : :. :. . .: : ... .. : CCDS32 NVCLEIMEP---GGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENL 130 140 150 160 170 190 200 210 220 230 pF1KB7 ASFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERPPTGDGD-EGDS . . : . : : : . . : . : :.. : . :. CCDS32 PDPQDISCHQSPSKTDHLTEK------AYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB7 NPGLWPERD--EDAPTGGLFPPPVAPPAATQNGHYGRGGEEEAASLSEAAPEPGDSPGFL .:.:. . . :. . : : : : : :.: : . : . CCDS32 RENLYPKANIPDRRPSLSPFAPDFFP-------HLWPGDFGAFAQLPEQPMDSGPLDLVI 240 250 260 270 280 300 310 320 330 340 350 pF1KB7 SG----AAEGEDGDGPDVDGLAASTLLQQMMSSVGRAGAAAGDSDEESRADDKGVMDYYL .. : :. : . . ....:. .. :. : : .: :. :: CCDS32 KNRKIKEEEKEELPPPPPPPFP-NDFFKDMFPDL--PGGPLGPIKAE---NDYGA---YL 290 300 310 320 330 360 370 380 390 400 410 pF1KB7 KYFSGAHDGDVYPAWSQKVEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECN ...:..: : ..: : :.:.. :: :.::::.:::.::::::::.::::::::: :. CCDS32 NFLSATHLGGLFPPWPLVEERKLKPKASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCT 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB7 ICKVRFTRQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCK ::.::::::::::.::::::::.:::: .:.: :.::::::::::.:::.:::::. : : CCDS32 ICEVRFTRQDKLKIHMRKHTGERPYLCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYK 400 410 420 430 440 450 480 490 500 510 520 pF1KB7 TFVRSDHLHRHLKKDGCNGVPSRRGRKPRV-RG-------GAPDPSPGATATPGAPAQPS .:.::::::::.:...: . :::::: . :. :.: :. .: . : : CCDS32 SFTRSDHLHRHIKRQSCRMARPRRGRKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVG 460 470 480 490 500 510 530 540 550 560 570 580 pF1KB7 SPDARRNGQEKHFKDEDEDEDVASPDGLGRLNVAGAGGGGDSGGGPGAATDGNFTAGLA CCDS32 GHLGGAAVCLPGPSPAKHFLAAPKGALSLQELERQFEETQMKLFGRAQLEAERNAGGLLA 520 530 540 550 560 570 >>CCDS1081.1 ZBTB7B gene_id:51043|Hs108|chr1 (539 aa) initn: 1448 init1: 627 opt: 751 Z-score: 461.2 bits: 95.2 E(32554): 2.3e-19 Smith-Waterman score: 1095; 40.0% identity (59.8% similar) in 540 aa overlap (1-519:1-483) 10 20 30 40 50 60 pF1KB7 MAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFK :.. : ::::::::::..:: ::::: : :::..: ..: :. :::.::::::.::: CCDS10 MGSPEDDLIGIPFPDHSSELLSCLNEQRQLGHLCDLTIRTQGLEYRTHRAVLAACSHYFK 10 20 30 40 50 60 70 80 90 100 pF1KB7 KLFT---SGAVVDQ-----------QNVYEIDFVSAEALTALMDFAYTATLTVSTANVGD :::: .:::. .: :.:::. ::: ::..::::::::.:.::. CCDS10 KLFTEGGGGAVMGAGGSGTATGGAGAGVCELDFVGPEALGALLEFAYTATLTTSSANMPA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB7 ILSAARLLEIPAVSHVCADLLDRQILAADAGADAGQLDLVDQIDQRNLLRAKEYLEFFQS .:.:::::::: : .: ..:. . : : . :. . ::..::: : CCDS10 VLQAARLLEIPCVIAACMEILQGSGLEAPSP------------DEDDCERARQYLEAF-- 130 140 150 160 170 180 190 200 210 220 pF1KB7 NPMNSLPPAAAAAAASFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPA :.:.:.. : . :. .. : :: CCDS10 ---------ATATASGVP--------NGEDSPPQV--------------------PLPPP 170 180 230 240 250 260 270 280 pF1KB7 ERPPTGDGDEGDSNPGLWPERDEDAPTGGLFPPPVAPPAATQNGHYGRGGEEEAASL--S :: . . .: : : : ..: . : .: :::.:. : CCDS10 PPPPPRPVARRSRKP-----RKAFLQTKGARANHLVPEVPTVPAHPLTYEEEEVAGRVGS 190 200 210 220 230 240 290 300 310 320 330 340 pF1KB7 EAAPEPGDSPGFLSGAA---EGEDGDGPDVDGLAASTLLQQMMSSVGRAGAAAGDSDEES .. :::: . .:.: :: .. : :. .....:. : :: CCDS10 SGGSGPGDSYSPPTGTASPPEGPQSYEPYEGEEEEEELVYPPAYGLAQGGGPPL-SPEEL 250 260 270 280 290 300 350 360 370 380 390 pF1KB7 RADDKGVMDYYLKYFSGAHDGDVYPAW-SQ-KVEKKIRAKAFQKCPICEKVIQGAGKLPR .:. .. . :.:. :. .. :. :: :. .: :.. :.::.:.:.:.::::::: CCDS10 GSDEDAIDPDLMAYLSSLHQDNLAPGLDSQDKLVRKRRSQMPQECPVCHKIIHGAGKLPR 310 320 330 340 350 360 400 410 420 430 440 450 pF1KB7 HIRTHTGEKPYECNICKVRFTRQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRV :.::::::::. :..: :::::.::::.::::::::.:: : .: : : :.:::::::.. CCDS10 HMRTHTGEKPFACEVCGVRFTRNDKLKIHMRKHTGERPYSCPHCPARFLHSYDLKNHMHL 370 380 390 400 410 420 460 470 480 490 500 510 pF1KB7 HTGLRPYQCDSCCKTFVRSDHLHRHLKKDGCNGVPSRRGRKPRVRGGAPDPSPGATATPG ::: :::.: : :.:.. :::.:::: ..: : .:: :: . : :: .:.. : CCDS10 HTGDRPYECHLCHKAFAKEDHLQRHLKGQNCLEVRTRRRRKDDAPPHYPPPSTAAASPAG 430 440 450 460 470 480 520 530 540 550 560 570 pF1KB7 APAQPSSPDARRNGQEKHFKDEDEDEDVASPDGLGRLNVAGAGGGGDSGGGPGAATDGNF CCDS10 LDLSNGHLDTFRLSLARFWEQSAPTGPPVSTPGPPDDDEEEGAPTTPQAEGAMESS 490 500 510 520 530 >>CCDS58030.1 ZBTB7B gene_id:51043|Hs108|chr1 (573 aa) initn: 1435 init1: 627 opt: 751 Z-score: 460.9 bits: 95.2 E(32554): 2.4e-19 Smith-Waterman score: 1095; 40.0% identity (59.8% similar) in 540 aa overlap (1-519:35-517) 10 20 30 pF1KB7 MAGGVDGPIGIPFPDHSSDILSGLNEQRTQ :.. : ::::::::::..:: ::::: CCDS58 GPHPPSPQAAAPGEAWPGPSQAPWQSLEEKMGSPEDDLIGIPFPDHSSELLSCLNEQRQL 10 20 30 40 50 60 40 50 60 70 pF1KB7 GLLCDVVILVEGREFPTHRSVLAACSQYFKKLFT---SGAVVDQ-----------QNVYE : :::..: ..: :. :::.::::::.::::::: .:::. .: : CCDS58 GHLCDLTIRTQGLEYRTHRAVLAACSHYFKKLFTEGGGGAVMGAGGSGTATGGAGAGVCE 70 80 90 100 110 120 80 90 100 110 120 130 pF1KB7 IDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVSHVCADLLDRQILAADA .:::. ::: ::..::::::::.:.::. .:.:::::::: : .: ..:. . : : . CCDS58 LDFVGPEALGALLEFAYTATLTTSSANMPAVLQAARLLEIPCVIAACMEILQGSGLEAPS 130 140 150 160 170 180 140 150 160 170 180 190 pF1KB7 GADAGQLDLVDQIDQRNLLRAKEYLEFFQSNPMNSLPPAAAAAAASFPWSAFGASDDDLD :. . ::..::: : :.:.:.. : . : CCDS58 P------------DEDDCERARQYLEAF-----------ATATASGVP--------NGED 190 200 210 200 210 220 230 240 250 pF1KB7 ATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERPPTGDGDEGDSNPGLWPERDEDAPTGGL . .. : :: :: . . .: : : : CCDS58 SPPQV--------------------PLPPPPPPPPRPVARRSRKP-----RKAFLQTKGA 220 230 240 260 270 280 290 300 310 pF1KB7 FPPPVAPPAATQNGHYGRGGEEEAASL--SEAAPEPGDSPGFLSGAA---EGEDGDGPDV ..: . : .: :::.:. : .. :::: . .:.: :: .. : CCDS58 RANHLVPEVPTVPAHPLTYEEEEVAGRVGSSGGSGPGDSYSPPTGTASPPEGPQSYEPYE 250 260 270 280 290 300 320 330 340 350 360 370 pF1KB7 DGLAASTLLQQMMSSVGRAGAAAGDSDEESRADDKGVMDYYLKYFSGAHDGDVYPAW-SQ :. .....:. : :: .:. .. . :.:. :. .. :. :: CCDS58 GEEEEEELVYPPAYGLAQGGGPPL-SPEELGSDEDAIDPDLMAYLSSLHQDNLAPGLDSQ 310 320 330 340 350 360 380 390 400 410 420 pF1KB7 -KVEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECNICKVRFTRQDKLKVHM :. .: :.. :.::.:.:.:.::::::::.::::::::. :..: :::::.::::.:: CCDS58 DKLVRKRRSQMPQECPVCHKIIHGAGKLPRHMRTHTGEKPFACEVCGVRFTRNDKLKIHM 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB7 RKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCKTFVRSDHLHRHLKKDG ::::::.:: : .: : : :.:::::::..::: :::.: : :.:.. :::.:::: .. CCDS58 RKHTGERPYSCPHCPARFLHSYDLKNHMHLHTGDRPYECHLCHKAFAKEDHLQRHLKGQN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB7 CNGVPSRRGRKPRVRGGAPDPSPGATATPGAPAQPSSPDARRNGQEKHFKDEDEDEDVAS : : .:: :: . : :: .:.. : CCDS58 CLEVRTRRRRKDDAPPHYPPPSTAAASPAGLDLSNGHLDTFRLSLARFWEQSAPTGPPVS 490 500 510 520 530 540 584 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 13:33:00 2016 done: Sun Nov 6 13:33:00 2016 Total Scan time: 3.290 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]