FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1056, 862 aa
1>>>pF1KSDA1056 862 - 862 aa - 862 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.5111+/-0.00101; mu= -10.9862+/- 0.061
mean_var=466.8886+/-105.189, 0's: 0 Z-trim(117.0): 15 B-trim: 0 in 0/53
Lambda= 0.059356
statistics sampled from 17643 (17656) to 17643 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.815), E-opt: 0.2 (0.542), width: 16
Scan time: 5.710
The best scores are: opt bits E(32554)
CCDS55907.1 ZFHX2 gene_id:85446|Hs108|chr14 (2572) 6017 530.6 1.4e-149
CCDS47878.2 ZFHX4 gene_id:79776|Hs108|chr8 (3616) 1267 123.9 4.9e-27
CCDS10908.1 ZFHX3 gene_id:463|Hs108|chr16 (3703) 1124 111.7 2.4e-23
>>CCDS55907.1 ZFHX2 gene_id:85446|Hs108|chr14 (2572 aa)
initn: 6017 init1: 6017 opt: 6017 Z-score: 2799.1 bits: 530.6 E(32554): 1.4e-149
Smith-Waterman score: 6017; 99.8% identity (99.9% similar) in 853 aa overlap (1-853:1-853)
10 20 30 40 50 60
pF1KSD MATLNSASTTGTTPSPGHNAPSLPSDTFSSSTPSDPVTKDPPAASSTSENMRSSEPGGQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MATLNSASTTGTTPSPGHNAPSLPSDTFSSSTPSDPVTKDPPAASSTSENMRSSEPGGQL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD LESGCGLVPPKEIGEPQEGPDCGHFPPNDPGVEKDKEQEEEEEGLPPMDLSNHLFFTAGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LESGCGLVPPKEIGEPQEGPDCGHFPPNDPGVEKDKEQEEEEEGLPPMDLSNHLFFTAGG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD EAYLVAKLSLPGGSELLLPKGFPWGEAGIKEEPSLPFLAYPPPSHLTALHIQHGFDPIQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 EAYLVAKLSLPGGSELLLPKGFPWGEAGIKEEPSLPFLAYPPPSHLTALHIQHGFDPIQG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD FSSSDQILSHDTSAPSPAACEERHGAFWSYQLAPNPPGDPKDGPMGNSGGNHVAVFWLCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FSSSDQILSHDTSAPSPAACEERHGAFWSYQLAPNPPGDPKDGPMGNSGGNHVAVFWLCL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD LCRLGFSKPQAFMDHTQSHGVKLTPAQYQGLSGSPAVLQEGDEGCKALISFLEPKLPARP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LCRLGFSKPQAFMDHTQSHGVKLTPAQYQGLSGSPAVLQEGDEGCKALISFLEPKLPARP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD SSDIPLDNSSTVNMEANVAQTEDGPPEAEVQALILLDEEVMALSPPSPPTATWDPSPTQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SSDIPLDNSSTVNMEANVAQTEDGPPEAEVQALILLDEEVMALSPPSPPTATWDPSPTQA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD KESPVAAGEAGPDWFPEGQEEDGGLCPPLNQSSPTSKEGGTLPAPVGSPEDPSDPPQPYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KESPVAAGEAGPDWFPEGQEEDGGLCPPLNQSSPTSKEGGTLPAPVGSPEDPSDPPQPYR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD LADDYTPAPAAFQGLSLSSHMSLLHSRNSCKTLKCPKCNWHYKYQQTLDVHMQEKHPESN
::::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::
CCDS55 LADDYTPAPAAFQGLSLSSHMSLLHSRNSCKTLKCPKCNWHYKYQQTLDVHMREKHPESN
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD SHCSYCSAGGAHPRLARGESYNCGYKPYRCDVCNYSTTTKGNLSIHMQSDKHLANLQGFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SHCSYCSAGGAHPRLARGESYNCGYKPYRCDVCNYSTTTKGNLSIHMQSDKHLANLQGFQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD AGPGGQGSPTEASLPPSAGDKEPKTKSSWQCKVCSYETNISRNLRIHMTSEKHMQNVLML
::::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 AGPGGQGSPPEASLPPSAGDKEPKTKSSWQCKVCSYETNISRNLRIHMTSEKHMQNVLML
550 560 570 580 590 600
610 620 630 640 650 660
pF1KSD HQGLPLGLPPGLMGPGPPPPPGATPTSPPELFQYFGPQALGQPQTPLAGPGLRPDKPLEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HQGLPLGLPPGLMGPGPPPPPGATPTSPPELFQYFGPQALGQPQTPLAGPGLRPDKPLEA
610 620 630 640 650 660
670 680 690 700 710 720
pF1KSD QLLLNGFHHVGAPARKFPTSAPGSLSPDAHLPPSQLLGSSSDSLPTSPPPDDSLSLKVFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 QLLLNGFHHVGAPARKFPTSAPGSLSPDAHLPPSQLLGSSSDSLPTSPPPDDSLSLKVFR
670 680 690 700 710 720
730 740 750 760 770 780
pF1KSD CLVCQAFSTDSLELLLYHCSIGRSLPEAEWKEVAGDTHRCKLCCYGTQLKANFQLHLKTD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 CLVCQAFSTDSLELLLYHCSIGRSLPEAEWKEVAGDTHRCKLCCYGTQLKANFQLHLKTD
730 740 750 760 770 780
790 800 810 820 830 840
pF1KSD KHAQKYQLAAHLREGGGAMGTPSPASLGDGAPYGSVSPLHLRCNICDFESNSKEKMQLHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KHAQKYQLAAHLREGGGAMGTPSPASLGDGAPYGSVSPLHLRCNICDFESNSKEKMQLHA
790 800 810 820 830 840
850 860
pF1KSD RGAAHEENSQIYKRTETGLLIK
:::::::::::::
CCDS55 RGAAHEENSQIYKFLLDMEGAEAGAELGLYHCLLCAWETPSRLAVLQHLRTPAHRDAQAQ
850 860 870 880 890 900
>>CCDS47878.2 ZFHX4 gene_id:79776|Hs108|chr8 (3616 aa)
initn: 1333 init1: 647 opt: 1267 Z-score: 598.8 bits: 123.9 E(32554): 4.9e-27
Smith-Waterman score: 1401; 42.1% identity (64.9% similar) in 573 aa overlap (301-856:497-1034)
280 290 300 310 320
pF1KSD LSGSPAVLQEGDEGCKALISFLEPKLPARPSSDIPLDNSSTVNMEANVAQ-TEDGPPE--
..:.:: :.: . ..: . : :
CCDS47 TEPGDEDEEDAYSNELDDEEVLGELTDSIGNKDFPLLNQSISPLSSSVLKFIEKGTSSSS
470 480 490 500 510 520
330 340 350 360 370 380
pF1KSD AEVQALILLDEEVMALSPPSPPTATWDPSP---TQAKESPVAAGEAGPDWFPEGQEEDGG
: :. ... :. . .... : ..:. : .: : :. . .: .::..
CCDS47 ATVSDDTEKKKQTAAVRASGSVASNYGISGKDFADASASKDSATAAHPSEIARG-DEDSS
530 540 550 560 570 580
390 400 410 420 430 440
pF1KSD LCPPLNQSSPTSKEGGTLPAPVGSPEDPSDPPQPYRLADDYTPAPAAFQGLSLSSHMSLL
: . .: : : :. ::: . . :. : . ::..::...
CCDS47 ATPHQHGFTP-STPGTPGPGGDGSPGSGIECPK----CDTVLGSSR-----SLGGHMTMM
590 600 610 620 630
450 460 470 480 490 500
pF1KSD HSRNSCKTLKCPKCNWHYKYQQTLDVHMQEKHPESNSHCSYCSAGGAHPRLARGESYNCG
::::::::::::::::::::::::..::.::::: .. : ::..: ::::::::::.::
CCDS47 HSRNSCKTLKCPKCNWHYKYQQTLEAHMKEKHPEPGGSCVYCKTGQPHPRLARGESYTCG
640 650 660 670 680 690
510 520 530 540 550 560
pF1KSD YKPYRCDVCNYSTTTKGNLSIHMQSDKHLANLQGFQAGPG----GQGSPTEASLPPSAGD
:::.::.:::::::::::::::::::::: :.:..: : : :...:. . . :
CCDS47 YKPFRCEVCNYSTTTKGNLSIHMQSDKHLNNVQNLQNGNGEQVFGHSAPAPNTSLSGCGT
700 710 720 730 740 750
570 580 590 600 610
pF1KSD ---KEPKTKSSWQCKVCSYETNISRNLRIHMTSEKHMQNVLMLHQGLPLGLPPGLMGPGP
..:: : .:.:.::.::::..:::::::::::::.:...:.:.. .: .:
CCDS47 PSPSKPKQKPTWRCEVCDYETNVARNLRIHMTSEKHMHNMMLLQQNMKQIQHNLHLGLAP
760 770 780 790 800 810
620 630 640 650 660 670
pF1KSD PPPPGATPTSPPELFQYFGPQALGQPQTPLAGPGLRPDKPLEAQLLLNGFHHVGAPARKF
. ::.::. : .: :.. ..: . ::..: :. : : .
CCDS47 ---------AEAELYQYYLAQNIGLT-------GMKLENPADPQLMINPFQLDPATAAAL
820 830 840 850
680 690 700 710 720 730
pF1KSD -PTSAPGSLSPDAHLPPSQLLGSSSDSLPT---SPPPDDSLSLKVFRCLVCQAFSTDSLE
: . . : :. .: .::.:.. . : . :: .: .::.:.: ::. :..::::
CCDS47 APGLVNNELPPEIRLASGQLMGDDLSLLTAGELSPYISDP-ALKLFQCAVCNKFTSDSLE
860 870 880 890 900 910
740 750 760 770 780 790
pF1KSD LLLYHCSIGRSLPEAEWKEVAGDTHRCKLCCYGTQLKANFQLHLKTDKHAQKYQLAAHLR
: : : ::::: ::. : :: ..:::: :.:::::::::: ::::: :::::.::..
CCDS47 ALSVHVSSERSLPEEEWRAVIGDIYQCKLCNYNTQLKANFQLHCKTDKHMQKYQLVAHIK
920 930 940 950 960 970
800 810 820 830 840 850
pF1KSD EGGGAMGTPSPASLGDGAPYGSVSPLHLRCNICDFESNSKEKMQLHARGAAHEENSQIYK
::: . . .. : .:.::.:: ::. .:: .:..::. . :: ..::
CCDS47 EGGKS-NEWRLKCIAIG------NPVHLKCNACDYYTNSVDKLRLHTTNHRHEAALKLYK
980 990 1000 1010 1020 1030
860
pF1KSD RTETGLLIK
. .
CCDS47 HLQKQEGAVNPESCYYYCAVCDYTTKVKLNLVQHVRSVKHQQTEGLRKLQLHQQGLAPEE
1040 1050 1060 1070 1080 1090
>>CCDS10908.1 ZFHX3 gene_id:463|Hs108|chr16 (3703 aa)
initn: 1349 init1: 649 opt: 1124 Z-score: 532.5 bits: 111.7 E(32554): 2.4e-23
Smith-Waterman score: 1417; 40.7% identity (63.0% similar) in 619 aa overlap (279-856:485-1075)
250 260 270 280 290 300
pF1KSD PQAFMDHTQSHGVKLTPAQYQGLSGSPAVLQEGDEGCKALI-SFLEPKLPARPSSD--IP
.: :::::.:. : :. .: :: .
CCDS10 KVEPAEEEAEEEEEEEEAEEEEEEEEEEEEEEEDEGCKGLFPSELDEELEDRPHEEPGAA
460 470 480 490 500 510
310 320 330 340 350 360
pF1KSD LDNSSTVNMEANVAQTEDGPPEAEVQALILLDEEVMALSPPSPPT-ATWDPSPTQAKES-
.:: .. . . ..: .: : :.. . . : : . ...: . . . :
CCDS10 AGSSSKKDLALSNQSISNSPLMPNV--LQTLSRGTASTSSNSASSFVVFDGANRRNRLSF
520 530 540 550 560 570
370 380 390 400
pF1KSD -------PVAAGEAGPDWFPEGQEEDGGLCPPLNQSSPTSKEGGTLP--------APVGS
:: : :. :. ..:.. : :.:. . .:: .: .:
CCDS10 NSEGVRANVAEGGRRLDFADESANKDNATAPEPNESTE-GDDGGFVPHHQHAGSLCELGV
580 590 600 610 620 630
410 420 430 440 450 460
pF1KSD PEDPSDPPQPYRLADDYTPAPAAFQGLSLSSHMSLLHSRNSCKTLKCPKCNWHYKYQQTL
: :: : . ::..::...::::::::::::::::::::::::
CCDS10 GECPSGSGVECPKCDTVLGSSR-----SLGGHMTMMHSRNSCKTLKCPKCNWHYKYQQTL
640 650 660 670 680
470 480 490 500 510 520
pF1KSD DVHMQEKHPESNSHCSYCSAGGAHPRLARGESYNCGYKPYRCDVCNYSTTTKGNLSIHMQ
..::.::::: .. : ::..: ::::::::::.:::::.::.:::::::::::::::::
CCDS10 EAHMKEKHPEPGGSCVYCKSGQPHPRLARGESYTCGYKPFRCEVCNYSTTTKGNLSIHMQ
690 700 710 720 730 740
530 540 550 560 570
pF1KSD SDKHLANLQGFQAGPGGQ--------------GSPTEASLPPSAG---DKEPKTKSSWQC
::::: :.:..: : : : .. . :.. : : .:::: .:.:
CCDS10 SDKHLNNMQNLQNGGGEQVFSHTAGAAAAAVAAAAAAANISSSCGAPSPTKPKTKPTWRC
750 760 770 780 790 800
580 590 600 610 620 630
pF1KSD KVCSYETNISRNLRIHMTSEKHMQNVLMLHQGLPLGLPPGLMGPGPPPPPGATPTSPPEL
.::.::::..:::::::::::::.:...:.:.. .: : : :. . ::
CCDS10 EVCDYETNVARNLRIHMTSEKHMHNMMLLQQNMTQIQHNRHLGLGSLPSPAEA-----EL
810 820 830 840 850 860
640 650 660 670 680
pF1KSD FQYFGPQALGQPQTPLAGPGLRPDKPL-EAQLLLNGFH--HVGAPARKFPTSAPGSLSPD
.::. : .. :. :. :. .::....::. .: : :. . : . :
CCDS10 YQYYLAQNMNLPN-------LKMDSAASDAQFMMSGFQLDPAGPMAAMTPALVGGEIPLD
870 880 890 900 910
690 700 710 720 730 740
pF1KSD AHLPPSQLLGSSSDSLPTSPPPDDSLSLKVFRCLVCQAFSTDSLELLLYHCSIGRSLPEA
.: .::.. .: : .. :::.:.: ::. :.::.:..: : .. ::: :
CCDS10 MRLGGGQLVSEELMNLGESFIQTNDPSLKLFQCAVCNKFTTDNLDMLGLHMNVERSLSED
920 930 940 950 960 970
750 760 770 780 790 800
pF1KSD EWKEVAGDTHRCKLCCYGTQLKANFQLHLKTDKHAQKYQLAAHLREGGGAMG-TPSPASL
::: : ::...:::: :.:::::::::: :::::.:::::.::..::: : . ...
CCDS10 EWKAVMGDSYQCKLCRYNTQLKANFQLHCKTDKHVQKYQLVAHIKEGGKANEWRLKCVAI
980 990 1000 1010 1020 1030
810 820 830 840 850 860
pF1KSD GDGAPYGSVSPLHLRCNICDFESNSKEKMQLHARGAAHEENSQIYKRTETGLLIK
:. :.::.:: ::. .:: ::..::. .. :: . ..::. .
CCDS10 GN--------PVHLKCNACDYYTNSLEKLRLHTVNSRHEASLKLYKHLQQHESGVEGESC
1040 1050 1060 1070 1080
CCDS10 YYHCVLCNYSTKAKLNLIQHVRSMKHQRSESLRKLQRLQKGLPEEDEDLGQIFTIRRCPS
1090 1100 1110 1120 1130 1140
862 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 04:47:01 2016 done: Thu Nov 3 04:47:02 2016
Total Scan time: 5.710 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]