FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDF0044, 989 aa
1>>>pF1KSDF0044 989 - 989 aa - 989 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.0157+/-0.000385; mu= 23.6446+/- 0.024
mean_var=77.9054+/-15.627, 0's: 0 Z-trim(114.1): 20 B-trim: 17 in 1/50
Lambda= 0.145308
statistics sampled from 23806 (23811) to 23806 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.64), E-opt: 0.2 (0.279), width: 16
Scan time: 14.430
The best scores are: opt bits E(85289)
XP_016865166 (OMIM: 603671,615951) PREDICTED: zinc ( 835) 2605 556.4 2.3e-157
NP_065979 (OMIM: 603671,615951) zinc finger SWIM d (1215) 1464 317.4 3e-85
>>XP_016865166 (OMIM: 603671,615951) PREDICTED: zinc fin (835 aa)
initn: 2098 init1: 1422 opt: 2605 Z-score: 2946.3 bits: 556.4 E(85289): 2.3e-157
Smith-Waterman score: 2881; 55.2% identity (75.4% similar) in 821 aa overlap (288-989:15-835)
260 270 280 290 300 310
pF1KSD EEQIQEQVKQLLSNGGYYGASQQLRSMFSKVREMLRMRDSNGARMLILMTEQFLQDTRLA
:::::.:::::::::: :.::::. : ::.
XP_016 MKFFPKIQKSTKFMVREMLKMRDSNGARMLTLITEQFMADPRLS
10 20 30 40
320 330 340 350 360 370
pF1KSD LWRQQGAGMTDKCRQLWDELGALWVCVVLSPHCKPEERAGWLQLLSRWDKLDVCPLEEGN
::::::..:::: :::::::::::.:.::.:::: :..:.::. :..:...:::: :.::
XP_016 LWRQQGTAMTDKYRQLWDELGALWMCIVLNPHCKLEQKASWLKQLKKWNSVDVCPWEDGN
50 60 70 80 90 100
380 390
pF1KSD YSFDGPSLQ---PTMAPA-------P----------------------------------
.. . :.: : : : :
XP_016 HGSELPNLTNALPQGANANQDSSNRPHRTVFTRAIEACDLHWQDSHLQHIISSDLYTNYC
110 120 130 140 150 160
pF1KSD ------------------------------------------------------------
XP_016 YHDDTENSLFDSRGWPLWHEHVPTACARVDALRSHGYPREALRLAIAIVNTLRRQQQKQL
170 180 190 200 210 220
400 410 420 430 440
pF1KSD --------ELLQKGSTCITNTEGWVGHPLDPIGCLCRALLEACRLEEETLTLYPD---SG
:: .:. : ::: ::::::::::.: : .:.::::...:.:. . : .
XP_016 EMFRTQKKELPHKNITSITNLEGWVGHPLDPVGTLFSSLMEACRIDDENLSGFSDFTENM
230 240 250 260 270 280
450 460 470 480 490 500
pF1KSD PEKRKVAYQHVPVPG--SPGESYLVLALEVALLGLGQQRALPEGLYAQDKVVRNEEQLLA
. ... :::.:. :::::.::.::::.:::::: .:.:::.:.:: ::::::..
XP_016 GQCKSLEYQHLPAHKFLEEGESYLTLAVEVALIGLGQQRIMPDGLYTQEKVCRNEEQLIS
290 300 310 320 330 340
510 520 530 540 550 560
pF1KSD LLEEVELDERLVQVLRKQAGLLLEGGPFSGFGEVLFRESVPMHTCARYLFTALLPHDPDL
:.:.:::. ::...:::: .:::.::.::.::.. :::::::: :.::::.::::: .:
XP_016 KLQEIELDDTLVKIFRKQAVFLLEAGPYSGLGEIIHRESVPMHTFAKYLFTSLLPHDAEL
350 360 370 380 390 400
570 580 590 600 610
pF1KSD AYRLALRAMRLPILETAFPAGE-PHPSPLDSIMSNRFPRWFILGHLETRQCELASTMLTA
::..::::::: .::.. :.:. .: . :.. ::.:::: :.:.:..:::::::::::
XP_016 AYKIALRAMRLLVLESTAPSGDLTRPHHIASVVPNRYPRWFTLSHIESQQCELASTMLTA
410 420 430 440 450 460
620 630 640 650 660 670
pF1KSD AKGDPKWLHMVLGSIQQNIHSPALLFKLAQDACKTATPVSAPPDTTLLGIALELGLQVMR
:::: . :. :: :::.:::: . .::::::: : :: ... :: ::: ..:::::::::
XP_016 AKGDVRRLETVLESIQKNIHSSSHIFKLAQDAFKIATLMDSLPDITLLKVSLELGLQVMR
470 480 490 500 510 520
680 690 700 710 720 730
pF1KSD MTLNVMTWRRREMVRWLVSCATEIGPQALMNIMQNWYSLFTPVEAATIVAVTGTTHATLL
:::....:::::::::::.::::.: :: .:::.:..::::.::..:::.: ...:..
XP_016 MTLSTLNWRRREMVRWLVTCATEVGVYALDSIMQTWFTLFTPTEATSIVATTVMSNSTIV
530 540 550 560 570 580
740 750 760 770 780 790
pF1KSD RLQLDTSRREELWACARTLALQCAMKDPQNCALPALTLCEKNHSAFEAAYQIVLDAAAGG
::.:: ..:.: . :::::::::::::::::: :::::::.: :::.:::::::::. :
XP_016 RLHLDCHQQEKLASSARTLALQCAMKDPQNCALSALTLCEKDHIAFETAYQIVLDAATTG
590 600 610 620 630 640
800 810 820 830 840 850
pF1KSD LGHAHLFTVARYMEHRGLPLRAYKLATLALAQLSIAFNQDSHPAVNDVLWACSLSHSLGR
.....:::.:::::::: :.:::::::::...:....:::.:::.:::::::.::::::.
XP_016 MSYTQLFTIARYMEHRGYPMRAYKLATLAMTHLNLSYNQDTHPAINDVLWACALSHSLGK
650 660 670 680 690 700
860 870 880 890 900 910
pF1KSD HELSAIVPLIIRSIHCAPMLSDILRRWTLSAPGL-GPLGARRAAKPLGADRAPLCQLLDA
.::.::.::...:..:: .::::::: ::..::. : : : ..: .. :.::: :::::
XP_016 NELAAIIPLVVKSVKCATVLSDILRRCTLTTPGMVGLHGRRNSGKLMSLDKAPLRQLLDA
710 720 730 740 750 760
920 930 940 950 960 970
pF1KSD AVTAYITTSHSRLTHISPRHYGDFIEFLGKARETFLLAPDGHLQFSQFLENLKQTYKGKK
.. :::.:.::::::::::::..:::::.:::::::.: :::.::.::..:::: :::::
XP_016 TIGAYINTTHSRLTHISPRHYSEFIEFLSKARETFLMAHDGHIQFTQFIDNLKQIYKGKK
770 780 790 800 810 820
980
pF1KSD KLMLLVRERFG
:::.:::::::
XP_016 KLMMLVRERFG
830
>>NP_065979 (OMIM: 603671,615951) zinc finger SWIM domai (1215 aa)
initn: 3350 init1: 1464 opt: 1464 Z-score: 1651.5 bits: 317.4 E(85289): 3e-85
Smith-Waterman score: 3560; 54.3% identity (73.0% similar) in 1050 aa overlap (34-900:76-1125)
10 20 30 40 50 60
pF1KSD PAAKRSRGCPAGPEERDAGAGAARGRGRPEALLDLSAKRVAESWAFEQVEERFSRVPEPV
.:::..:.::::.: :..::::: :.::::
NP_065 PRAGGAAAAAACGGGAALGLLPPGKTQSPESLLDIAARRVAEKWPFQRVEERFERIPEPV
50 60 70 80 90 100
70 80
pF1KSD QKRIVFWSFPRSEREICMYSSL-------GYP---------------------P------
:.:::.:::::::::::::::. : : :
NP_065 QRRIVYWSFPRSEREICMYSSFNTGGGAAGGPGDDSGGGGGAGGGGGGGSSSSPAATSAA
110 120 130 140 150 160
90 100 110
pF1KSD -----------------------P--------EGEHDARVPFTRGLHLLQSGAVDRVLQV
: .: ..:.:: ::. ::.:: :: ::::
NP_065 ATSAAAAAAAAAAAAAAAAGAGAPSVGAAGAADGGDETRLPFRRGIALLESGCVDNVLQV
170 180 190 200 210 220
120 130 140 150 160 170
pF1KSD GFHLSGNIREPGSPGEPERLYHVSISFDRCKITSVSCGCDNRDLFYCAHVVALSLYRIRH
::::::.. ::. .::: . .:.:::::::::::.:.: :.:.:::::::::::::::.
NP_065 GFHLSGTVTEPAIQSEPETVCNVAISFDRCKITSVTCSCGNKDIFYCAHVVALSLYRIRK
230 240 250 260 270 280
180 190 200 210 220 230
pF1KSD AHQVELRLPISETLSQMNRDQLQKFVQYLISAHHTEVLPTAQRLADEILLLGSEINLVNG
::.:.::::::: :::::::::::::::..::::::::::.:::::: .:::: :.:
NP_065 PDQVKLHLPISETLFQMNRDQLQKFVQYLITVHHTEVLPTAQKLADEILSQNSEINQVHG
290 300 310 320 330 340
240 250 260 270 280 290
pF1KSD APDPTAGAGIEDANCWHLDEEQIQEQVKQLLSNGGYYGASQQLRSMFSKVREMLRMRDSN
::::::::.:.: :::::::::.::::: .::.:::.:...:: .:.::::::.:::::
NP_065 APDPTAGASIDDENCWHLDEEQVQEQVKLFLSQGGYHGSGKQLNLLFAKVREMLKMRDSN
350 360 370 380 390 400
300 310 320 330 340 350
pF1KSD GARMLILMTEQFLQDTRLALWRQQGAGMTDKCRQLWDELGALWVCVVLSPHCKPEERAGW
::::: :.::::. : ::.::::::..:::: :::::::::::.:.::.:::: :..:.:
NP_065 GARMLTLITEQFMADPRLSLWRQQGTAMTDKYRQLWDELGALWMCIVLNPHCKLEQKASW
410 420 430 440 450 460
360 370 380 390
pF1KSD LQLLSRWDKLDVCPLEEGNYSFDGPSLQ---PTMAPA-------P---------------
:. :..:...:::: :.::.. . :.: : : : :
NP_065 LKQLKKWNSVDVCPWEDGNHGSELPNLTNALPQGANANQDSSNRPHRTVFTRAIEACDLH
470 480 490 500 510 520
pF1KSD ------------------------------------------------------------
NP_065 WQDSHLQHIISSDLYTNYCYHDDTENSLFDSRGWPLWHEHVPTACARVDALRSHGYPREA
530 540 550 560 570 580
400 410 420
pF1KSD ---------------------------ELLQKGSTCITNTEGWVGHPLDPIGCLCRALLE
:: .:. : ::: ::::::::::.: : .:.:
NP_065 LRLAIAIVNTLRRQQQKQLEMFRTQKKELPHKNITSITNLEGWVGHPLDPVGTLFSSLME
590 600 610 620 630 640
430 440 450 460 470 480
pF1KSD ACRLEEETLTLYPD---SGPEKRKVAYQHVPVPG--SPGESYLVLALEVALLGLGQQRAL
:::...:.:. . : . . ... :::.:. :::::.::.::::.:::::: .
NP_065 ACRIDDENLSGFSDFTENMGQCKSLEYQHLPAHKFLEEGESYLTLAVEVALIGLGQQRIM
650 660 670 680 690 700
490 500 510 520 530 540
pF1KSD PEGLYAQDKVVRNEEQLLALLEEVELDERLVQVLRKQAGLLLEGGPFSGFGEVLFRESVP
:.:::.:.:: ::::::.. :.:.:::. ::...:::: .:::.::.::.::.. :::::
NP_065 PDGLYTQEKVCRNEEQLISKLQEIELDDTLVKIFRKQAVFLLEAGPYSGLGEIIHRESVP
710 720 730 740 750 760
550 560 570 580 590 600
pF1KSD MHTCARYLFTALLPHDPDLAYRLALRAMRLPILETAFPAGE-PHPSPLDSIMSNRFPRWF
::: :.::::.::::: .:::..::::::: .::.. :.:. .: . :.. ::.::::
NP_065 MHTFAKYLFTSLLPHDAELAYKIALRAMRLLVLESTAPSGDLTRPHHIASVVPNRYPRWF
770 780 790 800 810 820
610 620 630 640 650 660
pF1KSD ILGHLETRQCELASTMLTAAKGDPKWLHMVLGSIQQNIHSPALLFKLAQDACKTATPVSA
:.:.:..::::::::::::::: . :. :: :::.:::: . .::::::: : :: ...
NP_065 TLSHIESQQCELASTMLTAAKGDVRRLETVLESIQKNIHSSSHIFKLAQDAFKIATLMDS
830 840 850 860 870 880
670 680 690 700 710 720
pF1KSD PPDTTLLGIALELGLQVMRMTLNVMTWRRREMVRWLVSCATEIGPQALMNIMQNWYSLFT
:: ::: ..::::::::::::....:::::::::::.::::.: :: .:::.:..:::
NP_065 LPDITLLKVSLELGLQVMRMTLSTLNWRRREMVRWLVTCATEVGVYALDSIMQTWFTLFT
890 900 910 920 930 940
730 740 750 760 770 780
pF1KSD PVEAATIVAVTGTTHATLLRLQLDTSRREELWACARTLALQCAMKDPQNCALPALTLCEK
:.::..:::.: ...:..::.:: ..:.: . :::::::::::::::::: :::::::
NP_065 PTEATSIVATTVMSNSTIVRLHLDCHQQEKLASSARTLALQCAMKDPQNCALSALTLCEK
950 960 970 980 990 1000
790 800 810 820 830 840
pF1KSD NHSAFEAAYQIVLDAAAGGLGHAHLFTVARYMEHRGLPLRAYKLATLALAQLSIAFNQDS
.: :::.:::::::::. :.....:::.:::::::: :.:::::::::...:....:::.
NP_065 DHIAFETAYQIVLDAATTGMSYTQLFTIARYMEHRGYPMRAYKLATLAMTHLNLSYNQDT
1010 1020 1030 1040 1050 1060
850 860 870 880 890 900
pF1KSD HPAVNDVLWACSLSHSLGRHELSAIVPLIIRSIHCAPMLSDILRRWTLSAPGLGPLGARR
:::.:::::::.::::::..::.::.::...:..:: .::::::: ::..::. : .::
NP_065 HPAINDVLWACALSHSLGKNELAAIIPLVVKSVKCATVLSDILRRCTLTTPGMVGLHGRR
1070 1080 1090 1100 1110 1120
910 920 930 940 950 960
pF1KSD AAKPLGADRAPLCQLLDAAVTAYITTSHSRLTHISPRHYGDFIEFLGKARETFLLAPDGH
NP_065 NSGKLMSLDKAPLRQLLDATIGAYINTTHSRLTHISPRHYSEFIEFLSKARETFLMAHDG
1130 1140 1150 1160 1170 1180
>--
initn: 446 init1: 446 opt: 446 Z-score: 498.1 bits: 103.9 E(85289): 5.3e-21
Smith-Waterman score: 446; 73.0% identity (93.3% similar) in 89 aa overlap (901-989:1127-1215)
880 890 900 910 920 930
pF1KSD RSIHCAPMLSDILRRWTLSAPGLGPLGARRAAKPLGADRAPLCQLLDAAVTAYITTSHSR
..: .. :.::: :::::.. :::.:.:::
NP_065 SVKCATVLSDILRRCTLTTPGMVGLHGRRNSGKLMSLDKAPLRQLLDATIGAYINTTHSR
1100 1110 1120 1130 1140 1150
940 950 960 970 980
pF1KSD LTHISPRHYGDFIEFLGKARETFLLAPDGHLQFSQFLENLKQTYKGKKKLMLLVRERFG
:::::::::..:::::.:::::::.: :::.::.::..:::: ::::::::.:::::::
NP_065 LTHISPRHYSEFIEFLSKARETFLMAHDGHIQFTQFIDNLKQIYKGKKKLMMLVRERFG
1160 1170 1180 1190 1200 1210
989 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 08:50:18 2016 done: Thu Nov 3 08:50:20 2016
Total Scan time: 14.430 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]