FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0330, 608 aa
1>>>pF1KE0330 608 - 608 aa - 608 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0704+/-0.000951; mu= 15.4528+/- 0.057
mean_var=80.6284+/-16.049, 0's: 0 Z-trim(106.1): 27 B-trim: 0 in 0/51
Lambda= 0.142834
statistics sampled from 8761 (8770) to 8761 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.64), E-opt: 0.2 (0.269), width: 16
Scan time: 3.670
The best scores are: opt bits E(32554)
CCDS41342.2 MROH7 gene_id:374977|Hs108|chr1 (1323) 544 122.3 4.1e-27
CCDS75803.1 MROH1 gene_id:727957|Hs108|chr8 (1632) 414 95.5 5.7e-19
CCDS47938.1 MROH1 gene_id:727957|Hs108|chr8 (1641) 414 95.5 5.7e-19
CCDS74674.1 MROH2A gene_id:339766|Hs108|chr2 (1688) 293 70.6 1.9e-11
>>CCDS41342.2 MROH7 gene_id:374977|Hs108|chr1 (1323 aa)
initn: 484 init1: 239 opt: 544 Z-score: 600.3 bits: 122.3 E(32554): 4.1e-27
Smith-Waterman score: 546; 28.5% identity (63.2% similar) in 478 aa overlap (108-575:360-809)
80 90 100 110 120 130
pF1KE0 GDARDSRQALRARMSSKHRICSQEEVVIPCAYDSDSESVDLELSNLEIIKKGSSSIELTD
: :.. ..: :: ::: : :...
CCDS41 ILGSNETLSLDSSLLFSDTSTLTLSSQQDDAKDNSIHTVPLE-ENLE------SWSEMAS
330 340 350 360 370 380
140 150 160 170 180 190
pF1KE0 LDIPDIP-GLHCEPLSH-SPRHLTQQDPLSEAIVEKLIQSIQKVFNGELKGELEKLKFLG
. . ..: :. :.:. . . . . . :. ... . . :: . : ... ..
CCDS41 IKVGQFPLGF---PISNPAGKDAVTLQGIPEGAFDEVTSCLVKVPEKTEGG--NNMALVE
390 400 410 420 430
200 210 220 230 240 250
pF1KE0 DLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLSSSMRQEVFVTIADLSYQ
....:... : :.. .. : :.. .::: :::::.:.... ...::.
CCDS41 NVTTLQKSQDLLE-AEGEKKTMIKKIMRQ----IQEEPLDSLSSSVRKQAMEILTQLSH-
440 450 460 470 480 490
260 270 280 290 300 310
pF1KE0 DVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTCNTECLYRQTFQAFSEML
.. :: ..:.:: .. ..:...::::... . .: . . . ::.::..:.. .:
CCDS41 -TQPTLGMRERSELVNVCVHSVFSLPSVQAMQEKDEAKAE---TIQALYHQTLEALQTLL
500 510 520 530 540
320 330 340 350 360 370
pF1KE0 QSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVLKCLSKHLNLKLPLRFQR
..: ..:: .: .:.. : ::..: : ::: ::. . ..::. . : . .:: :
CCDS41 KALFIEDPTPAGLKSILEALGPWMNSGKAHERARAVNTNVSVLNHMLLTLPFFMPLGFPA
550 560 570 580 590 600
380 390 400 410 420 430
pF1KE0 LGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHDKKDQQNLKRALTKCREF
:: :.. . : :::.:... :: .:: .:. :.:. ..:: .. : :. . ..:
CCDS41 LGLLLGRLILHIGDPDEEIGCEALDGI-IILYTILELQKRARDK-EETNKKELYESNKHF
610 620 630 640 650 660
440 450 460 470 480
pF1KE0 LELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLK-TLKHPC-----IQRSA
: .. .. : . .:. . : :: ... ........ :: . . : ... :
CCDS41 LGPYNPVSPC--QNILRVIEEFGDFLGPQQIKDLLLAALEGLKGSSEAPGKDSREMMQLA
670 680 690 700 710 720
490 500 510 520 530 540
pF1KE0 GELLLT--LAKNTESQFEEVPEIMGVICAQLPIISQPRVRQQIINTVSLFISRPKYTDIV
.:..:. : . .: .:::: : :: :..::.:: . :::. : .:..:
CCDS41 SEVMLSSVLEWYRHRALEVIPEIMQGIYMQLSHIQEPRARQVALLPVSLLASSF-MTEVV
730 740 750 760 770 780
550 560 570 580 590 600
pF1KE0 LSFLLCHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQEKMAYVAVAVS
...:.: :.: : . ::.::.: . ::
CCDS41 VALLMC-PLPLNSNGAEMWRQLILCKPSCDVRDLLDLLLGSLKEKPVTKEGRASIVPLAA
790 800 810 820 830 840
>>CCDS75803.1 MROH1 gene_id:727957|Hs108|chr8 (1632 aa)
initn: 304 init1: 232 opt: 414 Z-score: 454.1 bits: 95.5 E(32554): 5.7e-19
Smith-Waterman score: 478; 26.4% identity (61.1% similar) in 450 aa overlap (157-602:746-1174)
130 140 150 160 170 180
pF1KE0 KKGSSSIELTDLDIPDIPGLHCEPLSHSPRHLTQQDP--LSEAIVEK-LIQSIQKVFNGE
:.. . : : : ::. ....: . :.
CCDS75 RKSIGILNIFKDRSENEVEKVKSALILCYGHVAARAPRELVLAKVESDILRNICQHFS--
720 730 740 750 760 770
190 200 210 220 230 240
pF1KE0 LKGELEKLKFLGDLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLSSSMRQ
: :: .. .. .:.:. . : :: .. :..: . ... : : :: . .:.
CCDS75 TKDPALKLCLVQSVCMVSRAICSSTQAGSFHFTRKAELVAQMMEFIRAEPPDSLRTPIRK
780 790 800 810 820 830
250 260 270 280 290 300
pF1KE0 EVFVTIADLSYQDVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTCNTECL
....: . : .:. : . ::... ..::..: : . .: .: :. . :
CCDS75 KAMLTCTYLV--SVEPALDEQARADVIHGCLHSIMAL-----LPEPKE--EDGGCQ-KSL
840 850 860 870 880
310 320 330 340 350 360
pF1KE0 YRQTFQAFSEMLQSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVLKCLSK
: .:..:. ..: ::. .. ..:. .:.:: ::..: . ::: :: . : .:. . .
CCDS75 YLETLHALEDLLTSLLQRNMTPQGLQIMIEHLSPWIKSPRGHERARALGLSALLLRYFLE
890 900 910 920 930 940
370 380 390 400 410 420
pF1KE0 HLNLKLPLRFQRLGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHDKKDQQ
:: .. . :. :: :..:.. :.: . .::.. ..:::.. : . ...: .:
CCDS75 HLRVSALVPFHNLGLLIGLFSPRCADLWPATRQEAVDCVYSLLYLQLGYEGFSRDYRD--
950 960 970 980 990 1000
430 440 450 460 470 480
pF1KE0 NLKRALTKCREFLELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLKTLKHP
.. . : . .. : .: . : :..: ..:.. : ..: ....: :..: ..
CCDS75 DVAERLLSLKDGL-VHPDPAILFHTC-HSVGQIIAKRLPPDQLISLLLTMFEALGDPEKN
1010 1020 1030 1040 1050
490 500 510 520 530 540
pF1KE0 CIQRSAGELLLTLAKNTESQFEE-VPEIMGVICAQLPIISQPRVRQQIINTVSLFISRPK
: .:.: .. : .. . ..: ::::..:. ..: . .: ..: :. . .
CCDS75 C-SRAATVMINCLLQERGGVLQEKVPEIVSVLRSKLQEAQGEHVLPAAQHSVYLLAT--Q
1060 1070 1080 1090 1100 1110
550 560 570 580 590 600
pF1KE0 YTDIVLSFLLCHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQEKMAYV
. :.: :: :.: . : .:: :.:: .. .: ::.:... . : .:. :..
CCDS75 HCAAVVSSLLGSPLPLDSHTCMLWRALAVEPRLAAQVLGLLLEKMSR--DVPFKESRAFL
1120 1130 1140 1150 1160 1170
pF1KE0 AVAVSP
CCDS75 LGRTPDRVATLLPLSATCALFEVMSTPAAGPAVLELYPQLFVVLLLRVSCTVGVQLPRNL
1180 1190 1200 1210 1220 1230
>>CCDS47938.1 MROH1 gene_id:727957|Hs108|chr8 (1641 aa)
initn: 304 init1: 232 opt: 414 Z-score: 454.0 bits: 95.5 E(32554): 5.7e-19
Smith-Waterman score: 481; 26.2% identity (60.9% similar) in 455 aa overlap (152-602:749-1183)
130 140 150 160 170 180
pF1KE0 NLEIIKKGSSSIELTDLDIPDIPGLHCEPLSHSPRHLTQQDPLSEAIVEKLIQSIQKVFN
...::.:. :. :.... : ..
CCDS47 IGILNIFKDRSENEVEKVKSALILCYGHVAARAPRELVLAKVESD-ILRNICQHFSTKVL
720 730 740 750 760 770
190 200 210 220 230
pF1KE0 G---ELKGELEKLKFLGDLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLS
: : : :: .. .. .:.:. . : :: .. :..: . ... : : ::
CCDS47 GIKVETKDPALKLCLVQSVCMVSRAICSSTQAGSFHFTRKAELVAQMMEFIRAEPPDSLR
780 790 800 810 820 830
240 250 260 270 280 290
pF1KE0 SSMRQEVFVTIADLSYQDVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTC
. .:.....: . : .:. : . ::... ..::..: : . .: .: :
CCDS47 TPIRKKAMLTCTYLV--SVEPALDEQARADVIHGCLHSIMAL-----LPEPKE--EDGGC
840 850 860 870 880
300 310 320 330 340 350
pF1KE0 NTECLYRQTFQAFSEMLQSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVL
. . :: .:..:. ..: ::. .. ..:. .:.:: ::..: . ::: :: . : .:
CCDS47 Q-KSLYLETLHALEDLLTSLLQRNMTPQGLQIMIEHLSPWIKSPRGHERARALGLSALLL
890 900 910 920 930 940
360 370 380 390 400 410
pF1KE0 KCLSKHLNLKLPLRFQRLGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHD
. . .:: .. . :. :: :..:.. :.: . .::.. ..:::.. : . ...:
CCDS47 RYFLEHLRVSALVPFHNLGLLIGLFSPRCADLWPATRQEAVDCVYSLLYLQLGYEGFSRD
950 960 970 980 990 1000
420 430 440 450 460 470
pF1KE0 KKDQQNLKRALTKCREFLELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLK
.: .. . : . .. : .: . : :..: ..:.. : ..: ....: :..:
CCDS47 YRD--DVAERLLSLKDGL-VHPDPAILFHTC-HSVGQIIAKRLPPDQLISLLLTMFEALG
1010 1020 1030 1040 1050 1060
480 490 500 510 520 530
pF1KE0 TLKHPCIQRSAGELLLTLAKNTESQFEE-VPEIMGVICAQLPIISQPRVRQQIINTVSLF
.. : .:.: .. : .. . ..: ::::..:. ..: . .: ..: :.
CCDS47 DPEKNC-SRAATVMINCLLQERGGVLQEKVPEIVSVLRSKLQEAQGEHVLPAAQHSVYLL
1070 1080 1090 1100 1110 1120
540 550 560 570 580 590
pF1KE0 ISRPKYTDIVLSFLLCHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQE
. .. :.: :: :.: . : .:: :.:: .. .: ::.:... . : .:
CCDS47 AT--QHCAAVVSSLLGSPLPLDSHTCMLWRALAVEPRLAAQVLGLLLEKMSR--DVPFKE
1130 1140 1150 1160 1170
600
pF1KE0 KMAYVAVAVSP
. :..
CCDS47 SRAFLLGRTPDRVATLLPLSATCALFEVMSTPAAGPAVLELYPQLFVVLLLRVSCTVGVQ
1180 1190 1200 1210 1220 1230
>>CCDS74674.1 MROH2A gene_id:339766|Hs108|chr2 (1688 aa)
initn: 145 init1: 109 opt: 293 Z-score: 319.1 bits: 70.6 E(32554): 1.9e-11
Smith-Waterman score: 344; 20.2% identity (58.7% similar) in 426 aa overlap (163-588:805-1202)
140 150 160 170 180 190
pF1KE0 IELTDLDIPDIPGLHCEPLSHSPRHLTQQDPLSEAIVEKLIQSIQKVFNGELKGELEKLK
:.. :... ..: : . :.
CCDS74 RETVKSALMVMYSCVASYCHPQLLLNLVDSPITAKIIHHYVSSCQDIC--------LKMA
780 790 800 810 820
200 210 220 230 240 250
pF1KE0 FLGDLSSLSQALPYDETAKSFIHSHIADIVHTLNVLVQEERPHSLSSSMRQEVFVTIADL
:. .. ....:. . ..: .. . .. . .... : .: : .: .. ... :
CCDS74 FMKSVVQVTKAINNIKDLEDFHFAQKTTLTSIIVAVIKAEPTDNLVSPVRALAMEALSHL
830 840 850 860 870 880
260 270 280 290 300 310
pF1KE0 SYQDVHLLLGSEDRAELFSLTIKSIITLPSVRTLTQIQEIMPNGTCNTECLYRQTFQAFS
: .. . ..:. .::....:.:.:.: .. . . . . :: ......
CCDS74 S--KLKPFYSTEENSELMDISIHSVISL----------QLPGEDNESIKTLYANALSSLE
890 900 910 920 930
320 330 340 350 360 370
pF1KE0 EMLQSLVVKDPHLENLDTIIKHLVPWLQSVKDHERERATASMAQVLKCLSKHLNLKLPLR
....::. .. ..:. ... : :. : :. :::.:.. .. . . . :.
CCDS74 QLMESLLQRQLDPKGLQEMVQLLEKWILSEKEWEREKAVSLHLYLMWIYVHSTAVCIHLK
940 950 960 970 980 990
380 390 400 410 420 430
pF1KE0 FQRLGHLVALMALLCGDPQEKVAEEAAEGIHSLLHITLRLKYITHDKKDQQNLKRALTKC
. ..: .:.:.: : .... . . . ::: . . :..:. ::
CCDS74 LGQFGTMVGLIAPCTCDAHQRTRMASMNVLSSLLDLHASQTCSLWGPSKQKELE----KC
1000 1010 1020 1030 1040 1050
440 450 460 470 480 490
pF1KE0 REFLELHSSAAKCFYNCPFRIAQVFEGFLDSNELCQFIMTTFDTLKTLKHPCIQRSAGEL
. .:.:. .. .. :::.: .. .:. ..:. .. ... . :. .
CCDS74 KG--DLQSTDVEKIFCASSRIAKVVCMEFSCDEVVSLIQKLCENTGAMNLQHDKASVTWI
1060 1070 1080 1090 1100
500 510 520 530 540 550
pF1KE0 LLTLAKNTESQFEEVPEIMGVICAQLPIISQPRVRQQIINTVSLFISRPKYTDIVLSFLL
. : .. ..: ::...: ..::....:.::. .:. . :. . . : .:. ::
CCDS74 AFFLQMRAKELEDKVAEILSAILVHLPVVDHPEVRRLLIDGILLLAHHHQET--ILTSLL
1110 1120 1130 1140 1150 1160
560 570 580 590 600
pF1KE0 CHPVPYNRHLAEVWRMLSVELPSTTWILWRLLRKLQKCHNEPAQEKMAYVAVAVSP
.:.:.. :::::: .: ..: . .: :. .::
CCDS74 RQPLPMESHLAEVWLAVSENVPFARTMLHSLMGRLQSRLSPRISATSKADIWRLAAVDPL
1170 1180 1190 1200 1210 1220
CCDS74 MTLCTIHLLIQKLDENDKLPDFLPDLIYTLLLQLGSSHRPEAAPPVLKMWKLVHTTPLPE
1230 1240 1250 1260 1270 1280
608 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 15:43:29 2016 done: Thu Nov 3 15:43:30 2016
Total Scan time: 3.670 Total Display time: 0.040
Function used was FASTA [36.3.4 Apr, 2011]