FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4167, 619 aa 1>>>pF1KE4167 619 - 619 aa - 619 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.1591+/-0.00102; mu= -1.0687+/- 0.061 mean_var=367.5162+/-76.877, 0's: 0 Z-trim(116.5): 877 B-trim: 826 in 1/51 Lambda= 0.066902 statistics sampled from 16095 (17086) to 16095 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.805), E-opt: 0.2 (0.525), width: 16 Scan time: 4.500 The best scores are: opt bits E(32554) CCDS32830.1 ZBTB7C gene_id:201501|Hs108|chr18 ( 619) 4339 432.9 6e-121 CCDS12119.1 ZBTB7A gene_id:51341|Hs108|chr19 ( 584) 802 91.5 3.4e-18 CCDS1081.1 ZBTB7B gene_id:51043|Hs108|chr1 ( 539) 726 84.1 5.2e-16 CCDS58030.1 ZBTB7B gene_id:51043|Hs108|chr1 ( 573) 726 84.1 5.4e-16 >>CCDS32830.1 ZBTB7C gene_id:201501|Hs108|chr18 (619 aa) initn: 4339 init1: 4339 opt: 4339 Z-score: 2284.9 bits: 432.9 E(32554): 6e-121 Smith-Waterman score: 4339; 100.0% identity (100.0% similar) in 619 aa overlap (1-619:1-619) 10 20 30 40 50 60 pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 KLFTAGTLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KLFTAGTLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 NVCLEIMEPGGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENLPDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 NVCLEIMEPGGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENLPDP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 QDISCHQSPSKTDHLTEKAYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLLRENLYPKAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QDISCHQSPSKTDHLTEKAYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLLRENLYPKAN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 IPDRRPSLSPFAPDFFPHLWPGDFGAFAQLPEQPMDSGPLDLVIKNRKIKEEEKEELPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IPDRRPSLSPFAPDFFPHLWPGDFGAFAQLPEQPMDSGPLDLVIKNRKIKEEEKEELPPP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PPPPFPNDFFKDMFPDLPGGPLGPIKAENDYGAYLNFLSATHLGGLFPPWPLVEERKLKP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PPPPFPNDFFKDMFPDLPGGPLGPIKAENDYGAYLNFLSATHLGGLFPPWPLVEERKLKP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 KASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCTICEVRFTRQDKLKIHMRKHTGERPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 KASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCTICEVRFTRQDKLKIHMRKHTGERPY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 LCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYKSFTRSDHLHRHIKRQSCRMARPRRG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYKSFTRSDHLHRHIKRQSCRMARPRRG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 RKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVGGHLGGAAVCLPGPSPAKHFLAAPKG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVGGHLGGAAVCLPGPSPAKHFLAAPKG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 ALSLQELERQFEETQMKLFGRAQLEAERNAGGLLAFALAENVAAARPYFPLPDPWAAGLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ALSLQELERQFEETQMKLFGRAQLEAERNAGGLLAFALAENVAAARPYFPLPDPWAAGLA 550 560 570 580 590 600 610 pF1KE4 GLPGLAGLNHVASMSEANN ::::::::::::::::::: CCDS32 GLPGLAGLNHVASMSEANN 610 >>CCDS12119.1 ZBTB7A gene_id:51341|Hs108|chr19 (584 aa) initn: 1322 init1: 790 opt: 802 Z-score: 440.2 bits: 91.5 E(32554): 3.4e-18 Smith-Waterman score: 1249; 41.3% identity (64.3% similar) in 535 aa overlap (1-510:1-520) 10 20 30 40 50 60 pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK ::. .: ::::::.:::..: .::::: .::::::...:. .:. ::::::::::.::: CCDS12 MAGGVDGPIGIPFPDHSSDILSGLNEQRTQGLLCDVVILVEGREFPTHRSVLAACSQYFK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 KLFTAGTLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIV ::::.:....: :::::::. :::.:...::::.:::....:: ::.:::.::: . CCDS12 KLFTSGAVVDQQNVYEIDFVSAEALTALMDFAYTATLTVSTANVGDILSAARLLEIPAVS 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 NVCLEIMEP---GGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENL .:: .... ..:.: . . : :. :. . .: : ... .. : CCDS12 HVCADLLDRQILAADAGADAGQLDLVDQIDQRNLLRAKEYLEFFQSNPMNSLPPAAAAAA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 PDPQDISCHQSPSKTDHLTEK------AYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLL . . : . : : : . . : . : :.. : . :. CCDS12 ASFPWSAFGASDDDLDATKEAVAAAVAAVAAGDCNGLDFYGPGPPAERPPTGD-GDEGDS 190 200 210 220 230 240 250 260 270 280 pF1KE4 RENLYPKANIPDRRPSLSPFAPDFFP-------HLWPGDFGAFAQLPEQPMDSGPLDLVI .:.:. . . :. . : : : : : :.: : . : . CCDS12 NPGLWPERD--EDAPTGGLFPPPVAPPAATQNGHYGRGGEEEAASLSEAAPEPGDSPGFL 240 250 260 270 280 290 290 300 310 320 330 pF1KE4 KNRKIKEEEKEELPPPPPPPFP-NDFFKDMFPDL--PGGPLGPIKAE---NDYGA---YL .. : :. : . . ....:. .. :. : : .: :. :: CCDS12 SG----AAEGEDGDGPDVDGLAASTLLQQMMSSVGRAGAAAGDSDEESRADDKGVMDYYL 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE4 NFLSATHLGGLFPPWPLVEERKLKPKASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCT ...:..: : ..: : :.:.. :: :.::::.:::.::::::::.::::::::: :. CCDS12 KYFSGAHDGDVYPAWSQKVEKKIRAKAFQKCPICEKVIQGAGKLPRHIRTHTGEKPYECN 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE4 ICEVRFTRQDKLKIHMRKHTGERPYLCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYK ::.::::::::::.::::::::.:::: .:.: :.::::::::::.:::.:::::. : : CCDS12 ICKVRFTRQDKLKVHMRKHTGEKPYLCQQCGAAFAHNYDLKNHMRVHTGLRPYQCDSCCK 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE4 SFTRSDHLHRHIKRQSCRMARPRRGRKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVG .:.::::::::.:...: . :::::: . :. :.: :. .: . : : CCDS12 TFVRSDHLHRHLKKDGCNGVPSRRGRKPRV-RG-------GAPDPSPGATATPGAPAQPS 480 490 500 510 520 520 530 540 550 560 570 pF1KE4 GHLGGAAVCLPGPSPAKHFLAAPKGALSLQELERQFEETQMKLFGRAQLEAERNAGGLLA CCDS12 SPDARRNGQEKHFKDEDEDEDVASPDGLGRLNVAGAGGGGDSGGGPGAATDGNFTAGLA 530 540 550 560 570 580 >>CCDS1081.1 ZBTB7B gene_id:51043|Hs108|chr1 (539 aa) initn: 1277 init1: 678 opt: 726 Z-score: 401.0 bits: 84.1 E(32554): 5.2e-16 Smith-Waterman score: 1182; 41.7% identity (61.0% similar) in 533 aa overlap (1-518:1-491) 10 20 30 40 50 60 pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHDGLLCDVLLVVQEQEYRTHRSVLAACSKYFK :.. :.:::::::.::::.: :::::. : :::. . .: ::::::.::::::.::: CCDS10 MGSPEDDLIGIPFPDHSSELLSCLNEQRQLGHLCDLTIRTQGLEYRTHRAVLAACSHYFK 10 20 30 40 50 60 70 80 90 100 pF1KE4 KLFTAG--------------TLASQPYVYEIDFVQPEALAAILEFAYTSTLTITAGNVKH :::: : : .. : :.::: ::::.:.::::::.::: ...:. CCDS10 KLFTEGGGGAVMGAGGSGTATGGAGAGVCELDFVGPEALGALLEFAYTATLTTSSANMPA 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE4 ILNAARMLEIQCIVNVCLEIMEPGGDGGEEDDKEDDDDDEDDDDEEDEEEEEEEEEDDDD .:.:::.::: :.. .:.::.. :.: : . ..:: .. .. : . CCDS10 VLQAARLLEIPCVIAACMEILQ--GSGLEAPSPDEDDCERA---RQYLEAFATATASGVP 130 140 150 160 170 170 180 190 200 210 220 pF1KE4 DTEDFADQENLPDPQDISCHQSPSKTDHLTEKAYSDTPRDFPDSFQAGSPGHLGVIRDFS . :: : :: : : .... : :: . ... .:: : . . CCDS10 NGEDSPPQVPLPPPP-------PPPPRPVARR--SRKPRKAFLQTKGARANHL-VPEVPT 180 190 200 210 220 230 240 250 260 270 280 pF1KE4 IESLLRENLYPKANIPDRRPSLSPFAPDFFPHLWPGDFGAFAQLPEQPMDSGPLDLVIKN . . . : . .. : : . .: . :. :. :: :.. : . CCDS10 VPA--HPLTYEEEEVAGRVGSSGGSGPG---DSYSPPTGT-ASPPEGPQSYEPYE----- 230 240 250 260 270 290 300 310 320 330 340 pF1KE4 RKIKEEEKEELPPPPPPPFPNDFFKDMFPDLPGGPLGPIKAENDYGAYLNFLSATHLG-G :::.::: :: . . . :. :. : . : :::. : .:. : CCDS10 ---GEEEEEELVYPPAYGLAQGGGPPLSPEELGSDEDAI--DPDLMAYLSSLHQDNLAPG 280 290 300 310 320 350 360 370 380 390 400 pF1KE4 LFPPWPLVEERKLKPKASQQCPICHKVIMGAGKLPRHMRTHTGEKPYMCTICEVRFTRQD : :: :: . . :.::.:::.: :::::::::::::::::. : .: :::::.: CCDS10 LDSQDKLV--RKRRSQMPQECPVCHKIIHGAGKLPRHMRTHTGEKPFACEVCGVRFTRND 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE4 KLKIHMRKHTGERPYLCIHCNAKFVHNYDLKNHMRIHTGVRPYQCEFCYKSFTRSDHLHR ::::::::::::::: : :: :.:.:.:::::::..::: :::.:..:.:.:.. :::.: CCDS10 KLKIHMRKHTGERPYSCPHCPARFLHSYDLKNHMHLHTGDRPYECHLCHKAFAKEDHLQR 390 400 410 420 430 440 470 480 490 500 510 520 pF1KE4 HIKRQSCRMARPRRGRKPAAWRAASLLFGPGGPAPDKAAFVMPPALGEVGGHLGGAAVCL :.: :.: .: :: :: : : : :. :: . : .: .::: CCDS10 HLKGQNCLEVRTRRRRKDDA--------PPHYPPPSTAA-ASPAGLDLSNGHLDTFRLSL 450 460 470 480 490 530 540 550 560 570 580 pF1KE4 PGPSPAKHFLAAPKGALSLQELERQFEETQMKLFGRAQLEAERNAGGLLAFALAENVAAA CCDS10 ARFWEQSAPTGPPVSTPGPPDDDEEEGAPTTPQAEGAMESS 500 510 520 530 >>CCDS58030.1 ZBTB7B gene_id:51043|Hs108|chr1 (573 aa) initn: 1277 init1: 678 opt: 726 Z-score: 400.6 bits: 84.1 E(32554): 5.4e-16 Smith-Waterman score: 1182; 41.7% identity (61.0% similar) in 533 aa overlap (1-518:35-525) 10 20 30 pF1KE4 MANDIDELIGIPFPNHSSEVLCSLNEQRHD :.. :.:::::::.::::.: :::::. CCDS58 GPHPPSPQAAAPGEAWPGPSQAPWQSLEEKMGSPEDDLIGIPFPDHSSELLSCLNEQRQL 10 20 30 40 50 60 40 50 60 70 pF1KE4 GLLCDVLLVVQEQEYRTHRSVLAACSKYFKKLFTAG--------------TLASQPYVYE : :::. . .: ::::::.::::::.::::::: : : .. : : CCDS58 GHLCDLTIRTQGLEYRTHRAVLAACSHYFKKLFTEGGGGAVMGAGGSGTATGGAGAGVCE 70 80 90 100 110 120 80 90 100 110 120 130 pF1KE4 IDFVQPEALAAILEFAYTSTLTITAGNVKHILNAARMLEIQCIVNVCLEIMEPGGDGGEE .::: ::::.:.::::::.::: ...:. .:.:::.::: :.. .:.::.. :.: : CCDS58 LDFVGPEALGALLEFAYTATLTTSSANMPAVLQAARLLEIPCVIAACMEILQ--GSGLEA 130 140 150 160 170 180 140 150 160 170 180 190 pF1KE4 DDKEDDDDDEDDDDEEDEEEEEEEEEDDDDDTEDFADQENLPDPQDISCHQSPSKTDHLT . ..:: .. .. : . . :: : :: : : .. CCDS58 PSPDEDDCERA---RQYLEAFATATASGVPNGEDSPPQVPLPPPP-------PPPPRPVA 190 200 210 220 230 200 210 220 230 240 250 pF1KE4 EKAYSDTPRDFPDSFQAGSPGHLGVIRDFSIESLLRENLYPKANIPDRRPSLSPFAPDFF .. : :: . ... .:: : . .. . . : . .. : : . .: CCDS58 RR--SRKPRKAFLQTKGARANHL-VPEVPTVPA--HPLTYEEEEVAGRVGSSGGSGPG-- 240 250 260 270 280 260 270 280 290 300 310 pF1KE4 PHLWPGDFGAFAQLPEQPMDSGPLDLVIKNRKIKEEEKEELPPPPPPPFPNDFFKDMFPD . :. :. :: :.. : . :::.::: :: . . . :. CCDS58 -DSYSPPTGT-ASPPEGPQSYEPYE--------GEEEEEELVYPPAYGLAQGGGPPLSPE 290 300 310 320 330 320 330 340 350 360 370 pF1KE4 LPGGPLGPIKAENDYGAYLNFLSATHLG-GLFPPWPLVEERKLKPKASQQCPICHKVIMG :. : . : :::. : .:. :: :: :: . . :.::.:::.: : CCDS58 ELGSDEDAI--DPDLMAYLSSLHQDNLAPGLDSQDKLV--RKRRSQMPQECPVCHKIIHG 340 350 360 370 380 390 380 390 400 410 420 430 pF1KE4 AGKLPRHMRTHTGEKPYMCTICEVRFTRQDKLKIHMRKHTGERPYLCIHCNAKFVHNYDL ::::::::::::::::. : .: :::::.:::::::::::::::: : :: :.:.:.::: CCDS58 AGKLPRHMRTHTGEKPFACEVCGVRFTRNDKLKIHMRKHTGERPYSCPHCPARFLHSYDL 400 410 420 430 440 450 440 450 460 470 480 490 pF1KE4 KNHMRIHTGVRPYQCEFCYKSFTRSDHLHRHIKRQSCRMARPRRGRKPAAWRAASLLFGP ::::..::: :::.:..:.:.:.. :::.::.: :.: .: :: :: : : CCDS58 KNHMHLHTGDRPYECHLCHKAFAKEDHLQRHLKGQNCLEVRTRRRRKDDA--------PP 460 470 480 490 500 500 510 520 530 540 550 pF1KE4 GGPAPDKAAFVMPPALGEVGGHLGGAAVCLPGPSPAKHFLAAPKGALSLQELERQFEETQ : :. :: . : .: .::: CCDS58 HYPPPSTAA-ASPAGLDLSNGHLDTFRLSLARFWEQSAPTGPPVSTPGPPDDDEEEGAPT 510 520 530 540 550 560 619 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 01:45:29 2016 done: Thu Nov 3 01:45:30 2016 Total Scan time: 4.500 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]