FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1064, 1303 aa
1>>>pF1KSDA1064 1303 - 1303 aa - 1303 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 13.1823+/-0.0012; mu= -7.0888+/- 0.073
mean_var=636.1825+/-131.396, 0's: 0 Z-trim(118.1): 86 B-trim: 523 in 2/53
Lambda= 0.050849
statistics sampled from 18855 (18939) to 18855 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.808), E-opt: 0.2 (0.582), width: 16
Scan time: 7.170
The best scores are: opt bits E(32554)
CCDS42582.1 ZC3H4 gene_id:23211|Hs108|chr19 (1303) 9296 697.8 4.7e-200
CCDS46393.1 ZC3H6 gene_id:376940|Hs108|chr2 (1189) 1074 94.6 1.6e-18
>>CCDS42582.1 ZC3H4 gene_id:23211|Hs108|chr19 (1303 aa)
initn: 9296 init1: 9296 opt: 9296 Z-score: 3705.1 bits: 697.8 E(32554): 4.7e-200
Smith-Waterman score: 9296; 100.0% identity (100.0% similar) in 1303 aa overlap (1-1303:1-1303)
10 20 30 40 50 60
pF1KSD MEAAPGTPPPPPSESPPPPSPPPPSTPSPPPCSPDARPATPHLLHHRLPLPDDREDGELE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MEAAPGTPPPPPSESPPPPSPPPPSTPSPPPCSPDARPATPHLLHHRLPLPDDREDGELE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD EGELEDDGAEETQDTSGGPERSRKEKGEKHHSDSDEEKSHRRLKRKRKKEREKEKRRSKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EGELEDDGAEETQDTSGGPERSRKEKGEKHHSDSDEEKSHRRLKRKRKKEREKEKRRSKK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD RRKSKHKRHASSSDDFSDFSDDSDFSPSEKGHRKYREYSPPYAPSHQQYPPSHATPLPKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RRKSKHKRHASSSDDFSDFSDDSDFSPSEKGHRKYREYSPPYAPSHQQYPPSHATPLPKK
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD AYSKMDSKSYGMYEDYENEQYGEYEGDEEEDMGKEDYDDFTKELNQYRRAKEGSSRGRGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 AYSKMDSKSYGMYEDYENEQYGEYEGDEEEDMGKEDYDDFTKELNQYRRAKEGSSRGRGS
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD RGRGRGYRGRGSRGGSRGRGMGRGSRGRGRGSMGGDHPEDEEDFYEEEMDYGESEEPMGD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RGRGRGYRGRGSRGGSRGRGMGRGSRGRGRGSMGGDHPEDEEDFYEEEMDYGESEEPMGD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD DDYDEYSKELNQYRRSKDSRGRGLSRGRGRGSRGRGKGMGRGRGRGGSRGGMNKGGMNDD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 DDYDEYSKELNQYRRSKDSRGRGLSRGRGRGSRGRGKGMGRGRGRGGSRGGMNKGGMNDD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD EDFYDEDMGDGGGGSYRSRDHDKPHQQSDKKGKVICKYFVEGRCTWGDHCNFSHDIELPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EDFYDEDMGDGGGGSYRSRDHDKPHQQSDKKGKVICKYFVEGRCTWGDHCNFSHDIELPK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD KRELCKFYITGFCARAENCPYMHGDFPCKLYHTTGNCINGDDCMFSHDPLTEETRELLDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 KRELCKFYITGFCARAENCPYMHGDFPCKLYHTTGNCINGDDCMFSHDPLTEETRELLDK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MLADDAEAGAEDEKEVEELKKQGINPLPKPPPGVGLLPTPPRPPGPQAPTSPNGRPMQGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 MLADDAEAGAEDEKEVEELKKQGINPLPKPPPGVGLLPTPPRPPGPQAPTSPNGRPMQGG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD PPPPPPPPPPPPGPPQMPMPVHEPLSPQQLQQQDMYNKKIPSLFEIVVRPTGQLAEKLGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PPPPPPPPPPPPGPPQMPMPVHEPLSPQQLQQQDMYNKKIPSLFEIVVRPTGQLAEKLGV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD RFPGPGGPPGPMGPGPNMGPPGPMGGPMHPDMHPDMHPDMHPDMHADMHADMPMGPGMNP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RFPGPGGPPGPMGPGPNMGPPGPMGGPMHPDMHPDMHPDMHPDMHADMHADMPMGPGMNP
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD GPPMGPGGPPMMPYGPGDSPHSGMMPPIPPAQNFYENFYQQQEGMEMEPGLLGDAEDYGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 GPPMGPGGPPMMPYGPGDSPHSGMMPPIPPAQNFYENFYQQQEGMEMEPGLLGDAEDYGH
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD YEELPGEPGEHLFPEHPLEPDSFSEGGPPGRPKPGAGVPDFLPSAQRALYLRIQQKQQEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 YEELPGEPGEHLFPEHPLEPDSFSEGGPPGRPKPGAGVPDFLPSAQRALYLRIQQKQQEE
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD EERARRLAESSKQDRENEEGDTGNWYSSDEDEGGSSVTSILKTLRQQTSSRPPASVGELS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 EERARRLAESSKQDRENEEGDTGNWYSSDEDEGGSSVTSILKTLRQQTSSRPPASVGELS
790 800 810 820 830 840
850 860 870 880 890 900
pF1KSD SSGLGDPRLQKGHPTGSRLADPRLSRDPRLTRHVEASGGSGPGDSGPSDPRLARALPTSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SSGLGDPRLQKGHPTGSRLADPRLSRDPRLTRHVEASGGSGPGDSGPSDPRLARALPTSK
850 860 870 880 890 900
910 920 930 940 950 960
pF1KSD PEGSLHSSPVGPSSSKGSGPPPTEEEEGERALREKAVNIPLDPLPGHPLRDPRSQLQQFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PEGSLHSSPVGPSSSKGSGPPPTEEEEGERALREKAVNIPLDPLPGHPLRDPRSQLQQFS
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KSD HIKKDVTLSKPSFARTVLWNPEDLIPLPIPKQDAVPPVPAALQSMPTLDPRLHRAATAGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 HIKKDVTLSKPSFARTVLWNPEDLIPLPIPKQDAVPPVPAALQSMPTLDPRLHRAATAGP
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KSD PNARQRPGASTDSSTQGANLPDFELLSRILKTVNATGSSAAPGSSDKPSDPRVRKAPTDP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 PNARQRPGASTDSSTQGANLPDFELLSRILKTVNATGSSAAPGSSDKPSDPRVRKAPTDP
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KSD RLQKPTDSTASSRAAKPGPAEAPSPTASPSGDASPPATAPYDPRVLAAGGLGQGGGGGQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 RLQKPTDSTASSRAAKPGPAEAPSPTASPSGDASPPATAPYDPRVLAAGGLGQGGGGGQS
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KSD SVLSGISLYDPRTPNAGGKATEPAADTGAQPKGAEGNGKSSASKAKEPPFVRKSALEQPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 SVLSGISLYDPRTPNAGGKATEPAADTGAQPKGAEGNGKSSASKAKEPPFVRKSALEQPE
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KSD TGKAGADGGTPTDRYNSYNRPRPKAAAAPAATTATPPPEGAPPQPGVHNLPVPTLFGTVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS42 TGKAGADGGTPTDRYNSYNRPRPKAAAAPAATTATPPPEGAPPQPGVHNLPVPTLFGTVK
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300
pF1KSD QTPKTGSGSPFAGNSPAREGEQDAASLKDVFKGFDPTASPFCQ
:::::::::::::::::::::::::::::::::::::::::::
CCDS42 QTPKTGSGSPFAGNSPAREGEQDAASLKDVFKGFDPTASPFCQ
1270 1280 1290 1300
>>CCDS46393.1 ZC3H6 gene_id:376940|Hs108|chr2 (1189 aa)
initn: 1776 init1: 680 opt: 1074 Z-score: 445.8 bits: 94.6 E(32554): 1.6e-18
Smith-Waterman score: 2113; 34.8% identity (57.4% similar) in 1339 aa overlap (53-1302:10-1189)
30 40 50 60 70 80
pF1KSD PPSTPSPPPCSPDARPATPHLLHHRLPLPDDREDGELEEGELEDDGAEETQDTSGGPERS
::::::::.::..: : :: : :.
CCDS46 MTDSEHAGHDREDGELEDGEIDDAGFEEIQ------EKE
10 20 30
90 100 110 120 130 140
pF1KSD RKEKGEKHHSDSDEEKSHRRLKRKRKKEREKEKRRSKKRRKSKHKRHASSSDDFSDFSDD
::. ::..: ::..:. ..:.::::::.: ::.:.. :::... :::: ::.: :
CCDS46 AKEN-EKQKS----EKAYRKSRKKHKKEREKKK--SKRRKREKHKHNSPSSDDSSDYSLD
40 50 60 70 80
150 160 170 180 190
pF1KSD SDFSPSEKGHRK----YREYSPPYAPSHQQYPPSHATPLPKKAYSKMDSKSYGMYEDYEN
:: .:..:.: ::.:. :.. .. . :. : . .:. :: : : : .
CCDS46 SDVEHTESSHKKRTGFYRDYDIPFT-QRGHISGSYITSKKGQHNKKFKSKEYDEYSTYSD
90 100 110 120 130 140
200 210 220 230 240 250
pF1KSD EQYGEYEGDEEEDMGKEDYDDFTKELNQYRRAKEGSSRGRGSRGRGRGYRGRGSRGGSRG
...:.: :. ..:.: .::...:.:::.::: :. . :: : .
CCDS46 DNFGNYSDDNFGNYGQETEEDFANQLKQYRQAKETSNIALGS---------------SFS
150 160 170 180 190
260 270 280 290 300 310
pF1KSD RGMGRGSRGRGRGSMGGDHPEDEEDFYEEEMDYGESEEPMGDDDYDEYSKELNQYRRSKD
. :. .: .: ... .
CCDS46 KESGKKQRMKG-------------------------------------------VQQGIE
200
320 330 340 350 360 370
pF1KSD SRGRGLSRGRGRGSRGRGKGMGRGRGRGGSRGGMNKGGMNDDEDFYDEDMGDGGGGSYRS
.: .... ::::: . : :: :: . : : ...:: . :.. : ...
CCDS46 QRVKSFNVGRGRGLPKKIKRKERG-GR--TNKGPNVFSVSDDFQEYNKP-----GKKWKV
210 220 230 240 250
380 390 400 410 420 430
pF1KSD RDHDKPHQQS-DKKGKVICKYFVEGRCTWGDHCNFSHDIELPKKRELCKFYITGFCARAE
.. .:.. ..::: :::::.:::: ::.:.:.:: :: :..:.::::. :.:...:
CCDS46 MTQEFINQHTVEHKGKQICKYFLEGRCIKGDQCKFDHDAELEKRKEICKFYLQGYCTKGE
260 270 280 290 300 310
440 450 460 470 480 490
pF1KSD NCPYMHGDFPCKLYHTTGNCINGDDCMFSHDPLTEETRELLDKMLADDAEAGAEDEKEVE
:: :::..::::.::. ..: .::.: :::: ::.::..::::.: : : :::.:.:
CCDS46 NCIYMHNEFPCKFYHSGAKCYQGDNCKFSHDDLTKETKKLLDKVLNTDEELINEDERELE
320 330 340 350 360 370
500 510 520 530 540 550
pF1KSD ELKKQGINPLPKPPPGVGLLPTPPRPPGPQAPTSPNGRPMQGGPPPPPPPPPPPPGPPQM
::.:.::.::::::::::::::::.
CCDS46 ELRKRGITPLPKPPPGVGLLPTPPEH----------------------------------
380 390 400
560 570 580 590 600 610
pF1KSD PMPVHEPLSPQQLQQQDMYNKKIPSLFEIVVRPTGQLAEKLGVRFPG---PGGPPGPMGP
.: .: . : . .: . .::::::::::.:: .::.:.: . :. ..::::.
CCDS46 -FPFSDPEDDFQTDFSDDF-RKIPSLFEIVVKPTVDLAHKIGRKPPAFYTSASPPGPQFQ
410 420 430 440 450 460
620 630 640 650 660
pF1KSD GPNMGP---------PGPMGGPMHPDMH--PDMHPDMHPDMH---ADMHADMPMGPGMNP
: . : ::: :: . : : ::: : : . .:..: . :
CCDS46 GSSPHPQHIYSSGSSPGP--GPNMSQGHSSPVMHPG-SPGHHPCAGPPGLPVPQSPPLPP
470 480 490 500 510 520
670 680 690 700
pF1KSD GPP--MGPGGP------P---MMPYGPGDSPHSGMMP----PIPPAQNFYE-NFYQQQEG
::: .:: . : . : . : . :: .: .: .. . :::. :
CCDS46 GPPEIVGPQNQAGVLVQPDTSLTPPSMGGAYHSPGFPGHVMKVPRENHCSPGSSYQQSPG
530 540 550 560 570 580
710 720 730 740
pF1KSD -MEMEPG---LLGDAEDYGHYE--------ELPGEPGEHL----FPEH--PLEPDSFSEG
:... . : . :: : .: . :.. :. . : .. :. :: ..:
CCDS46 EMQLNTNYESLQNPAEFYDNYYAQHSIHNFQPPNNSGDGMWHGEFAQQQPPVVQDSPNHG
590 600 610 620 630 640
750 760 770 780 790
pF1KSD -GPPGRP-KPGAG---VPDFLPSAQRALYLRIQQKQQEEEERARRLAESSKQDRE--NEE
: : . : : :: .::..::::..:. :. ::.::.. :.. : .::
CCDS46 SGSDGSSTRTGHGPLPVPGLLPAVQRALFVRLTQRYQEDEEQT-----STQPHRAPSKEE
650 660 670 680 690
800 810 820 830 840 850
pF1KSD GDTGNWYSSDEDEGGSSVTSILKTLRQQTSS----RPPASVGELSSSGLGDPRLQKGHPT
:: :::::.:.: :::: ::::::..:: . . :.. :::. :::: : .
CCDS46 DDTVNWYSSSEEEEGSSVKSILKTLQKQTETLRNQQQPST--ELSTP--TDPRLAKEKSK
700 710 720 730 740 750
860 870 880 890 900
pF1KSD GSRLADPRLSRDPRLTRHVEASGGSGPGDSGPS-DPRLARALPTSKPEGS-------LHS
:....:::: :: . .. . :.: : . ::: :. ... .: ::
CCDS46 GNQVVDPRLRTIPR--QDIRKPSESAPLDLRLAWDPRKLRGNGSGHIGSSVGGAKFDLHH
760 770 780 790 800
910 920 930 940 950 960
pF1KSD SPVGPSSSKGSGPPPTEEEEGERALREKAVNIPLDPLPGHPLRDPRSQLQQFSHIKKDVT
. .: . .. : ..:. :: ::::: :::: :: :.::::::.:::::: :.:
CCDS46 ANAGTNVKHKRGD--DDDEDTERELREKAFLIPLDASPGIMLQDPRSQLRQFSHIKMDIT
810 820 830 840 850 860
970 980 990 1000 1010 1020
pF1KSD LSKPSFARTVLWNPEDLIPLPIPKQDAVPPVPAALQSMPTL--DPRLHRAATAGPPNARQ
:.::.::. ..: ::::.:.:.:: : :: . .: : : ::.: .. . .:
CCDS46 LTKPNFAKHIVWAPEDLLPVPLPKPD---PVSSINLPLPPLIADQRLNRLWNT-KSDLHQ
870 880 890 900 910 920
1030 1040 1050 1060 1070 1080
pF1KSD RPGASTDSSTQGANLPDFELLSRILKTVNATGSSAAPGSS--DKPSDPRVRKAPTDPRLQ
. . . :.. . . . . .. ::.: :. .: :::... :. :
CCDS46 NTVSIDPKLAAKAKINTTNREGYLEQFGDSHGSGAKLGDPRLQKNFDPRLHRLPNTESHQ
930 940 950 960 970 980
1090 1100 1110 1120 1130 1140
pF1KSD KPTDSTASSRAAKPGPAEAPS---PTASPSGDASPPATAPYDPRVLAAGGLGQGGGGGQS
.. .:..: : :. :... ..... : :: :.. ...:: : . .
CCDS46 VVMKDSHASKGAPHLPRSNPGSSQPSGAGTSNSGSGALPPYAPKLSSSAGLPLGTS---T
990 1000 1010 1020 1030 1040
1150 1160 1170 1180 1190 1200
pF1KSD SVLSGISLYDPRTPNAGGKATEPAADTGAQPKGAEGNGKSSASKAKEPPFVRKSALEQPE
:::::::::::: .... . .:..: . :. . .: ..: :: .. : :
CCDS46 SVLSGISLYDPRDHGSSSTSELATASSGENSKNQKKSGGLKSSDKTEPS-PGEAILPQKP
1050 1060 1070 1080 1090
1210 1220 1230 1240 1250 1260
pF1KSD TGKAGADGGTPTDRYNSYNRPRPKAAAAPAATTATPPPEGAPPQPGVHNLPVPTLFGTVK
. ..:. :.: :.: . : : :.::.::: .: : ..
CCDS46 SPNVGVTLEGPAD---------PQADV--------PRSSGKVQVPAVHSLPVQALTGLIR
1100 1110 1120 1130 1140
1270 1280 1290 1300
pF1KSD -------QTPKTGSGSPFAGNSPAREGEQDAASLKDVFKGFDPTASPFCQ
:. . :.::: :.:.:: : :::.::: :::::::::
CCDS46 PQYSDPRQARQPGQGSPTPDNDPGRE--TDDKSLKEVFKTFDPTASPFC
1150 1160 1170 1180
1303 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 19:00:00 2016 done: Thu Nov 3 19:00:01 2016
Total Scan time: 7.170 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]