FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KA0395, 956 aa 1>>>pF1KA0395 956 - 956 aa - 956 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.8796+/-0.00101; mu= 11.4419+/- 0.062 mean_var=189.2999+/-39.497, 0's: 0 Z-trim(110.8): 16 B-trim: 491 in 1/51 Lambda= 0.093218 statistics sampled from 11853 (11861) to 11853 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.703), E-opt: 0.2 (0.364), width: 16 Scan time: 4.400 The best scores are: opt bits E(32554) CCDS13315.1 ZHX3 gene_id:23051|Hs108|chr20 ( 956) 6361 868.7 0 CCDS6336.1 ZHX2 gene_id:22882|Hs108|chr8 ( 837) 521 83.3 2.2e-15 CCDS6342.1 ZHX1 gene_id:11244|Hs108|chr8 ( 873) 511 82.0 5.7e-15 >>CCDS13315.1 ZHX3 gene_id:23051|Hs108|chr20 (956 aa) initn: 6361 init1: 6361 opt: 6361 Z-score: 4633.5 bits: 868.7 E(32554): 0 Smith-Waterman score: 6361; 99.9% identity (99.9% similar) in 956 aa overlap (1-956:1-956) 10 20 30 40 50 60 pF1KA0 MASKRKSTTPCMIPVKTVVLQDASMEAQPAETLPEGPQQDLPPEASAASSEAAQNPSSTD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MASKRKSTTPCMIPVKTVVLQDASMEAQPAETLPEGPQQDLPPEASAASSEAAQNPSSTD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KA0 GSTLANGHRSTLDGYLYSCKYCDFRSHDMTQFVGHMNSEHTDFNKDPTFVCSGCSFLAKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GSTLANGHRSTLDGYLYSCKYCDFRSHDMTQFVGHMNSEHTDFNKDPTFVCSGCSFLAKT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KA0 PEGLSLHNATCHSGEASFVWNVAKPDNHVVVEQSIPESTSTPDLAGEPSAEGADGQAEII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PEGLSLHNATCHSGEASFVWNVAKPDNHVVVEQSIPESTSTPDLAGEPSAEGADGQAEII 130 140 150 160 170 180 190 200 210 220 230 240 pF1KA0 ITKTPIMKIMKGKAEAKKIHTLKENVPSQPVGEALPKLSTGEMEVREGDHSFINGAVPVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ITKTPIMKIMKGKAEAKKIHTLKENVPSQPVGEALPKLSTGEMEVREGDHSFINGAVPVS 190 200 210 220 230 240 250 260 270 280 290 300 pF1KA0 QASASSAKNPHAANGPLIGTVPVLPAGIAQFLSLQQQPPVHAQHHVHQPLPTAKALPKVM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QASASSAKNPHAANGPLIGTVPVLPAGIAQFLSLQQQPPVHAQHHVHQPLPTAKALPKVM 250 260 270 280 290 300 310 320 330 340 350 360 pF1KA0 IPLSSIPTYNAAMDSNSFLKNSFHKFPYPTKAELCYLTVVTKYPEEQLKIWFTAQRLKQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IPLSSIPTYNAAMDSNSFLKNSFHKFPYPTKAELCYLTVVTKYPEEQLKIWFTAQRLKQG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KA0 ISWSPEEIEDARKKMFNTVIQSVPQPTITVLNTPLVASAGNVQHLIQAALPGHVVGQPEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ISWSPEEIEDARKKMFNTVIQSVPQPTITVLNTPLVASAGNVQHLIQAALPGHVVGQPEG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KA0 TGGGLLVTQPLMANGLQATSSPLPLTVTSVPKQPGVAPINTVCSNTTSAVKVVNAAQSLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TGGGLLVTQPLMANGLQATSSPLPLTVTSVPKQPGVAPINTVCSNTTSAVKVVNAAQSLL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KA0 TACPSITSQAFLDASIYKNKKSHEQLSALKGSFCRNQFPGQSEVEHLTKVTGLSTREVRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TACPSITSQAFLDASIYKNKKSHEQLSALKGSFCRNQFPGQSEVEHLTKVTGLSTREVRK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KA0 WFSDRRYHCRNLKGSRAMIPGDHSSIIIDSVPEVSFSPSSKVPEVTCIPTTATLATHPSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 WFSDRRYHCRNLKGSRAMIPGDHSSIIIDSVPEVSFSPSSKVPEVTCIPTTATLATHPSA 550 560 570 580 590 600 610 620 630 640 650 660 pF1KA0 KRQSWHQTPDFTPTKYKERAPEQLRALESSFAQNPLPLDEELDRLRSETKMTRREIDSWF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KRQSWHQTPDFTPTKYKERAPEQLRALESSFAQNPLPLDEELDRLRSETKMTRREIDSWF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KA0 SERRKKVNAEETKKAEENASQEEEEAAEDEGGEEDLASELRVSGENGSLEMPSSHILAER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SERRKKVNAEETKKAEENASQEEEEAAEDEGGEEDLASELRVSGENGSLEMPSSHILAER 670 680 690 700 710 720 730 740 750 760 770 780 pF1KA0 KVSPIKINLKNLRVTEANGRNEIPGLGACDPEDDESNKLAEQLPGKVSCKKTAQQRHLLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KVSPIKINLKNLRVTEANGRNEIPGLGACDPEDDESNKLAEQLPGKVSCKKTAQQRHLLR 730 740 750 760 770 780 790 800 810 820 830 840 pF1KA0 QLFVQTQWPSNQDYDSIMAQTGLPRPEVVRWFGDSRYALKNGQLKWYEDYKRGNFPPGLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QLFVQTQWPSNQDYDSIMAQTGLPRPEVVRWFGDSRYALKNGQLKWYEDYKRGNFPPGLL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KA0 VIAPGNRELLQDYYMTHKMLYEEDLQNLCDKTQMSSQQVKQWFAEKMGEETRAVADTGSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VIAPGNRELLQDYYMTHKMLYEEDLQNLCDKTQMSSQQVKQWFAEKMGEETRAVADTGSE 850 860 870 880 890 900 910 920 930 940 950 pF1KA0 DQGPGTTELTAVHKGMGDTYSEVSENSESWEPRVPEASSEPFDTSSPQAGRQLETD :::::: ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DQGPGTGELTAVHKGMGDTYSEVSENSESWEPRVPEASSEPFDTSSPQAGRQLETD 910 920 930 940 950 >>CCDS6336.1 ZHX2 gene_id:22882|Hs108|chr8 (837 aa) initn: 1261 init1: 377 opt: 521 Z-score: 389.7 bits: 83.3 E(32554): 2.2e-15 Smith-Waterman score: 1475; 33.5% identity (59.9% similar) in 965 aa overlap (1-946:1-827) 10 20 30 40 50 pF1KA0 MASKRKSTTPCMIPVKTVVLQDASMEAQPAETLPEG-PQQDLPPEASAASSEAAQNPSST ::::::::::::. .. :: ::. :.. :. : :: :. .. :: : ... . . CCDS63 MASKRKSTTPCMVRTSQVVEQDVPEEVDRAKEKGIGTPQPDVAKDSWAAELENSSKENEV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KA0 -DGSTLANGHRSTLDGYLYSCKYCDFRSHDMTQFVGHMNSEHTDFNKDPTFVCSGCSFLA . ....... . :.: : :::: . ......:. :.. .: . .: .::. :.: . CCDS63 IEVKSMGESQSKKLQGG-YECKYCPYSTQNLNEFTEHVDMQHPNVILNPLYVCAECNFTT 70 80 90 100 110 120 130 140 150 160 170 pF1KA0 KTPEGLSLHNATCHSGEASFVWNVAKPDNHVVVEQSIPESTSTPDLAGEPSAEGADGQAE : ..:: ::. : :::.: .. : .:..:.:::: .. . ... . : :... CCDS63 KKYDSLSDHNSKFHPGEANFKLKLIKRNNQTVLEQSIETTNHVVSITTSGPGTG-DSDSG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA0 IIITKTPIMKIMKGKAEAKKIHTLKENVPSQPVGEALPKLSTGEMEVREGDHSFINGAVP : ..:::::: : ::.::: ::..: : : : .: :: ... .. CCDS63 ISVSKTPIMKPGKPKADAKK-------VPKKPE-EITP-----ENHV-EGTARLVTDTAE 180 190 200 210 220 240 250 260 270 280 290 pF1KA0 VSQASASSAKNPHAANGPLIGTVPVLPAGIAQFLSLQQQPPVHAQHHVHQPLPTAKALPK . . .: : .: :. :.. :. : :. . .:: CCDS63 ILSR---------------LGGVELL-----------QDTLGHVMPSVQLP-PNINLVPK 230 240 250 300 310 320 330 340 350 pF1KA0 VMIPLSSIPTYNAAMDSNSFLKNSFHKFPYPTKAELCYLTVVTKYPEEQLKIWFTAQRLK : .::.. ::.:.:.:. . :::.::::::.::: .::...:.:::...:::..:::: CCDS63 VPVPLNTTK-YNSALDTNATMINSFNKFPYPTQAELSWLTAASKHPEEHIRIWFATQRLK 260 270 280 290 300 310 360 370 380 390 400 410 pF1KA0 QGISWSPEEIEDARKKMFNTVIQSVPQPTITVLNTPLVASAGNVQHLIQAALPGHVVGQP .::::::::.:.::::::: .::::: :::::: . : : . .: ..:.::: ...:: CCDS63 HGISWSPEEVEEARKKMFNGTIQSVP-PTITVLPAQL-APTKVTQPILQTALPCQILGQT 320 330 340 350 360 370 420 430 440 450 460 470 pF1KA0 EGTGGGLLVTQPLMANGLQATSSPLPLTVTSVPKQPGVAPINTVCSNTTSAVKVVNAAQS .:..:: . ... .. ::. :.:..: .. :. : ... : . :: CCDS63 -----SLVLTQ-VTSGSTTVSCSPITLAVAGVTNHGQKRPL--VTPQAAPEPKRPHIAQ- 380 390 400 410 420 480 490 500 510 520 530 pF1KA0 LLTACPSITSQAFLDASIYKNKKSHEQLSALKGSFCRNQFPGQSEVEHLTKVTGLSTREV . :.... . :: ::..::.. ::.:: ..::: ..:: .: .::::. :. CCDS63 VPEPPPKVANPPLTPAS--DRKKTKEQIAHLKASFLQSQFPDDAEVYRLIEVTGLARSEI 430 440 450 460 470 480 540 550 560 570 580 590 pF1KA0 RKWFSDRRYHCRNLKGSRAMIPGDHSSIIIDSVPEVSFSPSSKVPEVTCIPTTATLATHP .:::::.::.:. :... :. :. :: CCDS63 KKWFSDHRYRCQ-----RGIVHITSESLAKDQ-----------------------LAIAA 490 500 510 600 610 620 630 640 650 pF1KA0 SAKRQSWHQTPDFTPTKYKERAPEQLRALESSFAQNPLPLDEELDRLRSETKMTRREIDS : . ...: :::.: :.::.. :.. ::.:: .. .: . :::::: :::..:::::: CCDS63 SRHGRTYHAYPDFAPQKFKEKTQGQVKILEDSFLKSSFPTQAELDRLRVETKLSRREIDS 520 530 540 550 560 570 660 670 680 690 700 710 pF1KA0 WFSERRKKVNAEETKKAEENASQEEEEAAEDEGGEEDLASELRVSGENGSLEMPSSHILA ::::::: .. : .:. : : ... :.. ::.: CCDS63 WFSERRKLRDSME-------------QAVLDSMGSGKKGQD--VGAPNGALS-------- 580 590 600 610 720 730 740 750 760 770 pF1KA0 ERKVSPIKINLKNLRVTEANGRNEIPGLGACDPEDDESNKLAEQLPGKVSCKKTAQQRHL :. . .: . .: . .: . :. .: :: CCDS63 --------------RLDQLSGAQLTSSLPSPSP----------------AIAKSQEQVHL 620 630 640 780 790 800 810 820 830 pF1KA0 LRQLFVQTQWPSNQDYDSIMAQTGLPRPEVVRWFGDSRYALKNGQLKWYEDYKRGNFPP- ::. :..::::. :.::.. :.::: : :.:::: ..: ::.: .::.:.:.. . CCDS63 LRSTFARTQWPTPQEYDQLAAKTGLVRTEIVRWFKENRCLLKTGTVKWMEQYQHQPMADD 650 660 670 680 690 700 840 850 860 870 880 pF1KA0 -GLLVIA----------PGNR-ELLQDYYMTHKMLYEEDLQNLCDKTQMSSQQVKQWFAE : ..: : : ... .:: : : ::::..: .....:. .:. . CCDS63 HGYDAVARKATKPMAESPKNGGDVVPQYYKDPKKLCEEDLEKLVTRVKVGSEPAKDCLPA 710 720 730 740 750 760 890 900 910 920 930 940 pF1KA0 KMGEETRAVADTGSED-QGPGTTELTAVHKGMGDTYSE---VSENSESWEPRVPEASSEP : .: : .. .:.: :: .: ..: . : .: .:. :.:: . :. :: CCDS63 KPSEATSDRSEGSSRDGQGSDENEESSVVDYVEVTVGEEDAISDRSDSWSQAAAEGVSEL 770 780 790 800 810 820 950 pF1KA0 FDTSSPQAGRQLETD ...: CCDS63 AESDSDCVPAEAGQA 830 >>CCDS6342.1 ZHX1 gene_id:11244|Hs108|chr8 (873 aa) initn: 1627 init1: 417 opt: 511 Z-score: 382.2 bits: 82.0 E(32554): 5.7e-15 Smith-Waterman score: 1667; 35.5% identity (60.6% similar) in 986 aa overlap (1-932:1-860) 10 20 30 40 50 pF1KA0 MASKRKSTTPCMIPVKTVVLQDASMEAQPAETLPEGPQQDLPPEASAASSEAAQNP--SS :::.::::::::. .. :: ..: : ::: : : . : : .... : CCDS63 MASRRKSTTPCMVLASE---QDPDLEL--ISDLDEGPPVLTPVENTRAESISSDEEVHES 10 20 30 40 50 60 70 80 90 100 110 pF1KA0 TDGSTLANGHRSTLDGYLYSCKYCDFRSHDMTQFVGHMNSEHTDFNKDPTFVCSGCSFLA .:.. : . . ..: : :::: :.. :...:. :..::: . . ..:: :.::. CCDS63 VDSD---NQQNKKVEGG-YECKYCTFQTPDLNMFTFHVDSEHPNVVLNSSYVCVECNFLT 60 70 80 90 100 110 120 130 140 150 160 170 pF1KA0 KTPEGLSLHNATCHSGEASFVWNVAKPDNHVVVEQSIPESTSTPDLAGEPSAEGADG--- : ..:: :: : :: .: ...: .:... ::.: . : ... : .:: :.. CCDS63 KRYDALSEHNLKYHPGEENFKLTMVKRNNQTIFEQTINDLTFDGSFVKEENAEQAESTEV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KA0 -QAEIIITKTPIMKIMKGKAEAKKI---HTLKENVPSQPVGEALPKLSTGEMEVREGDHS .. : :.::::::.::.:.: :.: :. :.:: . .: : . :. :. : CCDS63 SSSGISISKTPIMKMMKNKVENKRIAVHHNSVEDVPEEKENEIKPD----REEIVENPSS 180 190 200 210 220 240 250 260 270 280 290 pF1KA0 FINGAVPVSQASASSAKNPHAANGPLIGT-VPVLPAGIAQFLSLQQQPPVHAQHHVHQPL .. :..:.: .. : ... . : . ::: :.:: .. : ::.. CCDS63 ----SASESNTSTSIVNRIHPSTASTVVTPAAVLP-GLAQVIT-----AVSAQQN----- 230 240 250 260 270 300 310 320 330 340 350 pF1KA0 PTAKALPKVMIPLSSIPTYNAAMDSNSFLKNSFHKFPYPTKAELCYLTVVTKYPEEQLKI .. .:::.::..::::::::.:.: .: :...:::::: .:. :.. .:: :::.:: CCDS63 --SNLIPKVLIPVNSIPTYNAALDNNPLLLNTYNKFPYPTMSEITVLSAQAKYTEEQIKI 280 290 300 310 320 330 360 370 380 390 400 410 pF1KA0 WFTAQRLKQGISWSPEEIEDARKKMFNTVIQSVPQPTITVLNTPLVASAGNVQHLIQAAL ::.:::::.:.::.:::.:.::.:.:: ....::: ::::. : . ...... ..:. CCDS63 WFSAQRLKHGVSWTPEEVEEARRKQFNGTVHTVPQ-TITVIPTHISTGSNGLPSILQTC- 340 350 360 370 380 420 430 440 450 460 470 pF1KA0 PGHVVGQPEGTGGGLLVTQPLMANGLQATSSPLPLTVTSVPKQPGVAPINTVCSNTTSAV ..:::: ::..:: .: : .:. :. :::..::.: .. .. .. :. . CCDS63 --QIVGQP-----GLVLTQVAGTNTLPVTA-PIALTVAGVPSQNNIQKSQVPAAQPTAET 390 400 410 420 430 440 480 490 500 510 520 530 pF1KA0 KVVNAAQSLLTACPSITSQAFLDASIYKNKKSHEQLSALKGSFCRNQFPGQSEVEHLTKV : ..:: . :. . :. . ::..:::. :: :. .:::: .::. .: :. CCDS63 KPATAAVPTSQSVKHETALVNPDSFGIRAKKTKEQLAELKVSYLKNQFPHDSEIIRLMKI 450 460 470 480 490 500 540 550 560 570 580 pF1KA0 TGLSTREVRKWFSDRRYHCRNLKGSRAM-IPGDHSS-IIIDSVPEVSFSPSSKVPEVTCI :::. :..::::: ::. :: :... . . .: :. ::::: :.. :: CCDS63 TGLTKGEIKKWFSDTRYNQRNSKSNQCLHLNNDSSTTIIIDSSDETTESP---------- 510 520 530 540 550 590 600 610 620 630 640 pF1KA0 PTTATLATHPSAKRQSWHQTPDFTPTKYKERAPEQLRALESSFAQNPLPLDEELDRLRSE :..: ..: .:::. ::::: :.::.. ::::.:..:: .. . ::::.:::.. CCDS63 -TVGT--AQP---KQSWNPFPDFTPQKFKEKTAEQLRVLQASFLNSSVLTDEELNRLRAQ 560 570 580 590 600 650 660 670 680 690 700 pF1KA0 TKMTRREIDSWFSERRKKVNAEETKKA--EENASQEEEEAAEDEGGEEDLASELRVSGEN ::.::::::.::.:..:. .: : : ::.. .:::.: CCDS63 TKLTRREIDAWFTEKKKSKALKEEKMEIDESNAGSSKEEAGE------------------ 610 620 630 640 710 720 730 740 750 760 pF1KA0 GSLEMPSSHILAERKVSPIKINLKNLRVTEANGRNEIPGLGACDPEDDESNKLAEQLPGK .:: :::. :: CCDS63 ---------------TSPA----------------------------DESGAPKSGSTGK 650 660 770 780 790 800 810 820 pF1KA0 VSCKKTAQQRHLLRQLFVQTQWPSNQDYDSIMAQTGLPRPEVVRWFGDSRYALKNGQLKW . :::: .: :.:.. ::.::::: ..::.. ..:: : ..: ::::.::: :::.::: CCDS63 I-CKKTPEQLHMLKSAFVRTQWPSPEEYDKLAKESGLARTDIVSWFGDTRYAWKNGNLKW 670 680 690 700 710 720 830 840 pF1KA0 YEDY---------------KRG-NFP------------------------PGLLVIAPGN : : ::: . : :.:. . :. CCDS63 YYYYQSANSSSMNGLSSLRKRGRGRPKGRGRGRPRGRPRGSKRINNWDRGPSLIKFKTGT 730 740 750 760 770 780 850 860 870 880 890 900 pF1KA0 RELLQDYYMTHKMLYEEDLQNLCDKTQMSSQQVKQWFAEKMGEETRAVADTGSEDQGPGT .:.:::. ::.: :.::..: .:..:. .::..::::. . : .. : : . CCDS63 -AILKDYYLKHKFLNEQDLDELVNKSHMGYEQVREWFAER---QRR--SELGIELFEENE 790 800 810 820 830 910 920 930 940 950 pF1KA0 TELTAVHKGMGDTYSEVSENSESWEPRVPEASSEPFDTSSPQAGRQLETD : .. : : ...:..::: CCDS63 EEDEVIDDQEED--EEETDDSDTWEPPRHVKRKLSKSDD 840 850 860 870 956 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 06:54:00 2016 done: Sun Nov 6 06:54:01 2016 Total Scan time: 4.400 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]