FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4192, 693 aa
1>>>pF1KE4192 693 - 693 aa - 693 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.4339+/-0.00112; mu= 13.3048+/- 0.067
mean_var=65.6751+/-13.441, 0's: 0 Z-trim(101.0): 29 B-trim: 0 in 0/49
Lambda= 0.158261
statistics sampled from 6342 (6356) to 6342 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.54), E-opt: 0.2 (0.195), width: 16
Scan time: 3.360
The best scores are: opt bits E(32554)
CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6 (1325) 1457 342.1 3.2e-93
CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325) 1257 296.4 1.8e-79
CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 ( 594) 1203 284.1 4e-76
CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4 ( 657) 952 226.8 8e-59
CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7 ( 573) 872 208.5 2.2e-53
CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 ( 949) 549 134.8 5.8e-31
CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 ( 949) 545 133.8 1.1e-30
CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3 ( 607) 434 108.5 3e-23
>>CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6 (1325 aa)
initn: 1231 init1: 468 opt: 1457 Z-score: 1787.1 bits: 342.1 E(32554): 3.2e-93
Smith-Waterman score: 1457; 37.5% identity (69.6% similar) in 645 aa overlap (64-693:683-1325)
40 50 60 70 80 90
pF1KE4 LPMDLLLKQGSLKQEVESFCYQIVSESNDQKVGILQSEDKQLQPSVSKK---SEGELSRV
::: .... .:. :.:. :: :
CCDS34 MKRKHDEIQRSLPVKPSKMLKPSGTPFSPDKVGDWMAKQASLDFFVKKRHAFSEHSSSNK
660 670 680 690 700 710
100 110 120 130 140
pF1KE4 KFISNSNKITFSKKPK-----RRKYDESYLSFGFTYFGNRDAPHAQCVLCKKILSNSSLA
. ..: . .: . :::: ::. :::. . .. . ::..: .:.: ..
CCDS34 RNVNNRSYPEEGKTKRVHASFTRKYDPSYIEFGFVAVIDGEVLKPQCIICGDVLANEAMK
720 730 740 750 760 770
150 160 170 180 190 200
pF1KE4 PSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIA
::::.::: .:: ... ::... .: ...: :. : :: .:::.:. .:
CCDS34 PSKLKRHLYSKHKEISSQPKEFFERK-SSELKSQPKQVFNVSHINISALRASYKVALPVA
780 790 800 810 820 830
210 220 230 240 250 260
pF1KE4 LSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVC
: .::.: :.: : :.: ..:. :. .::. : :::.:.::::..:: :.:..:.
CCDS34 KSKTPYTIAETLVKDCIKEVCLEMLGESAAKKVAQVPLSNDTIARRIQELANDMEDQLIE
840 850 860 870 880 890
270 280 290 300 310 320
pF1KE4 RLKICDGFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQSNATGEEIFNCIN
..:. ::::::: :.... .:::.::.. . .:.:.... :: .:.:. :... ..
CCDS34 QIKLAKYFSLQLDECRDIANMIILLVYVRFEHDDDIKEEFFFSASLPTNTTSSELYEAVK
900 910 920 930 940 950
330 340 350 360 370 380
pF1KE4 SFM-QKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHCLLYRHALAVKIM
... .: .:.. :: ::::.. .. :: .:.:: :: .::: ..::...:..::.: .
CCDS34 NYIVNKCGLEFKFCVGVCSDGAASMTGKHSEVVTQIKELAPECKTTHCFIHRESLAMKKI
960 970 980 990 1000 1010
390 400 410 420 430 440
pF1KE4 PTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRL
. :..::.. :.:.::::. .:::...::..: :.: :::..:.::::::::: :.
CCDS34 SAELNSVLNDIVKIVNYIKSNSLNSRLFSLLCDNMEADHKQLLLHAEIRWLSRGKVLSRM
1020 1030 1040 1050 1060 1070
450 460 470 480 490 500
pF1KE4 FELRRELLVFMDSAFRL-SDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFD
::.: :::::... . :. . . .: :::::.:::. .:..: ::::::.: :.. :
CCDS34 FEIRNELLVFLQGKKPMWSQLFKDVNWTARLAYLSDIFSIFNDLNASMQGKNATYFSMAD
1080 1090 1100 1110 1120 1130
510 520 530 540 550 560
pF1KE4 KMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVD-KDICSAIVQHLRGLRATLLK
:. . .::: : . . . .: : .:. ...:... .: . ..: .:: .: .
CCDS34 KVEGQKQKLEAWKNRISTDCYDMFHNLTTIINEVGNDLDIAHLRKVISEHLTNLLECFEF
1140 1150 1160 1170 1180 1190
570 580 590 600 610
pF1KE4 YFPVTND---NNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSEL-SLNDFWS
::: .: .: :..::: . .:.. ..:. :..: .: .: . :: .::
CCDS34 YFPSKEDPRIGNLWIQNPFLSSKDNLNLTVTLQDKLLKLATDEGLKISFENTASLPSFWI
1200 1210 1220 1230 1240 1250
620 630 640 650 660 670
pF1KE4 SLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPN
. ..:: .:. :...:: : . .::::::: .. :::.:. :. .:. ::.: :
CCDS34 KAKNDYPELAEIALKLLLLFPSTYLCETGFSTLSVIKTKHRNSLNIHYPLRVALSSIQPR
1260 1270 1280 1290 1300 1310
680 690
pF1KE4 IKRICDKKTQKHCSH
. .. .:: : : ::
CCDS34 LDKLTSKK-QAHLSH
1320
>>CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325 aa)
initn: 1092 init1: 291 opt: 1257 Z-score: 1540.3 bits: 296.4 E(32554): 1.8e-79
Smith-Waterman score: 1260; 32.2% identity (70.6% similar) in 636 aa overlap (67-686:696-1324)
40 50 60 70 80 90
pF1KE4 DLLLKQGSLKQEVESFCYQIVSESNDQKVGILQSEDKQLQPSVSKKSEGELSRVKFISNS
. :.. . .: ...: : . . . . ...
CCDS38 STQEDAMKFPSSQSSQPSRLLKNKGISCKPVTQTKATSCKPHTQHK-ECQ-TDLPMPNEK
670 680 690 700 710 720
100 110 120 130 140
pF1KE4 NKITFSKKPKRRK-------YDESYLSFGFTYF-GNRDA-PHAQCVLCKKILSNSSLAPS
: ... :...: :: ::. :: :.... :. :::.: .:::. .. :.
CCDS38 NDAELDSPPSKKKRLGFFQTYDTEYLKVGFIICPGSKESSPRPQCVICGEILSSENMKPA
730 740 750 760 770 780
150 160 170 180 190 200
pF1KE4 KLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIALS
.: .::.:::. ..: ..::.:. : .. : . .. .: ..::: .... : :
CCDS38 NLSHHLKTKHSELENKPVDFFEQKSLEMECQNSSLKKCLLVE-KSLVKASYLIAFQTAAS
790 800 810 820 830 840
210 220 230 240 250 260
pF1KE4 GEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRL
. .:.: :::: .. ... . . :. .. ::: :. .:: .:.::::..:. ..
CCDS38 KKPFSIAEELIKPYLVEMCSEVLGSSAGDKMKTIPLSNVTIQHRIDELSADIEDQLIQKV
850 860 870 880 890 900
270 280 290 300 310 320
pF1KE4 KICDGFSLQLDESADVSGLAVLLVFVRY-RFN-KSIEEDLLLCESLQSNATGEEIFNCIN
. :.::.:::...:....:: ..:. .. ....:.::.: . .. :: :::. ::
CCDS38 RESKWFALQIDESSEISNITLLLCYIRFIDYDCRDVKEELLFCIEMPTQITGFEIFELIN
910 920 930 940 950 960
330 340 350 360 370 380
pF1KE4 SFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTS-SHCLLYRHALAVKIM
...... ..:..:: .:.:.. .. :. . . :. :: .... .::...:. :... .
CCDS38 KYIDSKSLNWKHCVGLCTDGAASMTGRYSGLKAKIQEVAMNTAAFTHCFIHRERLVAEKL
970 980 990 1000 1010 1020
390 400 410 420 430 440
pF1KE4 PTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRL
:...: :..::...::. .::.: :::::::..:..: :..::::.:::..: ::
CCDS38 SPCLHKILLQSAQILSFIKSNALNSRMLTILCEEMGSEHVSLPLHAEVRWISRGRMLKRL
1030 1040 1050 1060 1070 1080
450 460 470 480 490 500
pF1KE4 FELRRELLVFMDSAFR-LSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFD
::::.:. .:... :. . . :. .::::.:::. .::.:::.:: .: :.. .
CCDS38 FELRHEIEIFLSQKHSDLAKYFHDEEWVGKLAYLSDIFSLINELNLSLQGTLTTFFNLCN
1090 1100 1110 1120 1130 1140
510 520 530 540 550 560
pF1KE4 KMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQHLRGLRATLLKY
:.. . :::..: . ..:...: ::..:.: .. .. :: : .::.:: ..
CCDS38 KIDVFKRKLKMWLKRTQENDYDMFPSFSEF-SNSSGLNMTDITRIIFEHLEGLSQVFSDC
1150 1160 1170 1180 1190 1200
570 580 590 600 610 620
pF1KE4 FPVTND---NNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSL
:: .: .: :. .:: .. . .:. . :.: .:.:: .. :. .:...:: .
CCDS38 FPPEQDLRSGNLWIIHPF-MNHQNNNLTDFEEEKLTELSSDLGLQALFKSVSVTQFWINA
1210 1220 1230 1240 1250 1260
630 640 650 660 670 680
pF1KE4 IQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIK
:: . .::.. ::::.:..::...:: : :..: .. : ..: .:. .... : :.
CCDS38 KTSYPELHERAMKFLLPFSTVYLCDAAFS--ALTESKQKNLLGSGPALRLAVTSLIPRIE
1270 1280 1290 1300 1310
690
pF1KE4 RICDKKTQKHCSH
.. .:
CCDS38 KLVKEKE
1320
>>CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 (594 aa)
initn: 1075 init1: 473 opt: 1203 Z-score: 1480.1 bits: 284.1 E(32554): 4e-76
Smith-Waterman score: 1203; 32.9% identity (68.9% similar) in 592 aa overlap (106-688:3-588)
80 90 100 110 120 130
pF1KE4 QPSVSKKSEGELSRVKFISNSNKITFSKKPKRRKYDESYLSFGFTYFGNRDAPH-AQCVL
:.::.:..:. . :: . :. . ::::
CCDS34 MSKKRKWDDDYVRYWFTCTTEVDGTQRPQCVL
10 20 30
140 150 160 170 180 190
pF1KE4 CKKILSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKI-VNTDNESA
:....::..: :::: :.. .:.. .:.. .: :. .: ... . : . ...
CCDS34 CNSVFSNADLRPSKLSDHFNRQHGGVAGHDLNSLK-HMPAPSDQSETLKAFGVASHEDTL
40 50 60 70 80 90
200 210 220 230 240 250
pF1KE4 TEASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIK
.:::. .: : . ::..: :.:::: .... .. . .::.. : ::.... ::
CCDS34 LQASYQFAYLCAKEKNPHTVAEKLVKPCALEIAQIVLGPDAQKKLQQVPLSDDVIHSRID
100 110 120 130 140 150
260 270 280 290 300 310
pF1KE4 DLAADIEEELVCRLKICD-GFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQ
... :: .... .: ..:: :..:.. . :..:::: .. : :..:.:: ::
CCDS34 EMSQDILQQVLEDIKASPLKVGIQLAETTDMDDCSQLMAFVRYIKEREIVEEFLFCEPLQ
160 170 180 190 200 210
320 330 340 350 360 370
pF1KE4 SNATGEEIFNCINSFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHC
. : ..:: . .:. ::.: . : .::.:.. .. :. .: :. .: :. . .::
CCDS34 LSMKGIDVFNLFRDFFLKHKIALDVCGSVCTDGASSMLGENSEFVAYVKKEIPHIVVTHC
220 230 240 250 260 270
380 390 400 410 420 430
pF1KE4 LLYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEV
:: :::..: .::.:...: .:..::.::.: . ::.. . ::.: ....::..::.
CCDS34 LLNPHALVIKTLPTKLRDALFTVVRVINFIKGRAPNHRLFQAFFEEIGIEYSVLLFHTEM
280 290 300 310 320 330
440 450 460 470 480 490
pF1KE4 RWLSRGKVLVRLFELRRELLVFMD-SAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSM
::::::..:...::. .:. :. .. : : . :. . ..::::::.: .:::.. ::
CCDS34 RWLSRGQILTHIFEMYEEINQFLHHKSSNLVDGFENKEFKIHLAYLADLFKHLNELSASM
340 350 360 370 380 390
500 510 520 530 540 550
pF1KE4 QGKNVTVFTVFDKMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQ
: .... .. .:.:...::. :: . .:..:: :: : .... : . : . :.
CCDS34 QRTGMNTVSAREKLSAFVRKFPFWQKRIEKRNFTNFPFLEEIIVSDNEGIF--IAAEITL
400 410 420 430 440
560 570 580 590 600
pF1KE4 HLRGLRATLLKYFPVTNDNNA--WVRNPFTVTVKPASLVARDY---ESLIDLTSDSQVKQ
::. : . :: . . :.: :. .:: .. ..: .: ..: .: ...:. .
CCDS34 HLQQLSNFFHGYFSIGDLNEASKWILDPFLFNI---DFVDDSYLMKNDLAELRASGQILM
450 460 470 480 490 500
610 620 630 640 650 660
pF1KE4 NFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAP
.: ..:.::: . . .:..:. :...:.:::: .::: ::: ::: :. .. .
CCDS34 EFETMKLEDFWCAQFTAFPNLAKTALEILMPFATTYLCELGFSSLLHFKTKSRSCFNLSD
510 520 530 540 550 560
670 680 690
pF1KE4 HMRIRLSNITPNIKRICDKKTQKHCSH
.:. .:. .: .. : ..: :
CCDS34 DIRVAISKKVPRFSDIIEQKLQLQQKSL
570 580 590
>>CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4 (657 aa)
initn: 747 init1: 286 opt: 952 Z-score: 1169.5 bits: 226.8 E(32554): 8e-59
Smith-Waterman score: 1204; 32.9% identity (67.4% similar) in 675 aa overlap (36-688:1-655)
10 20 30 40 50 60
pF1KE4 LCILSYNFNTFAILNVYSKLTMFCTTNSLPMDLLLKQGSLKQEVESFCYQIVSESNDQKV
:: .. . . ..::. : . :.. .
CCDS47 MDHFFIKRKRNSEVK---YTEACSSSSVES
10 20
70 80 90 100 110 120
pF1KE4 GILQSEDKQLQPSVSKKSEGELSRVKFISNSNKITFSKKP-KRRKYDESYLSFGFTY---
::..:.. . :.....:. :.: . :.:: . :.:.:.::..::
CCDS47 GIVNSDN------IEKNTDSNLQT----STSFEPHFKKKKVSARRYNEDYLKYGFIKCEK
30 40 50 60 70
130 140 150 160 170 180
pF1KE4 -FGNRDAPHAQCVLCKKILSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKP
: : : : :::.:..::.: :: ::::.:::::.:: :: . .:... .. :
CCDS47 PFEN-DRP--QCVICNNILANESLKPSKLKRHLETQHAELIDKPLEYFQRK---KKDIKL
80 90 100 110 120 130
190 200 210 220 230
pF1KE4 PTPKIVNTD--NESATEASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKI
: . . .:.: .:: :.:..: :.: .: .: : :.: .::.. . :.
CCDS47 STQFLSCSTAVSEKALLSSYLVAYRVAKEKIANTAAEKIILPACLDMVRTIFDDKSADKL
140 150 160 170 180 190
240 250 260 270 280 290
pF1KE4 DAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESADVSGLAVLLVFVRYRFN
.. ...::. :: .: .: :. ::. :..:::::.:... ..:::.::: ..
CCDS47 KTIP-NDNTVSLRICTIAEHLETMLITRLQSGIDFAIQLDESTDIGSCTTLLVYVRYAWQ
200 210 220 230 240 250
300 310 320 330 340 350
pF1KE4 KSIEEDLLLCESLQSNATGEEIFNCINS-FMQKHEIEWEKCVDVCSDASRAVDGKIAEAV
.. ::.: .: :. .: .::. .. .. .....:..: . ::.. .. :: ....
CCDS47 DDFLEDFLCFLNLTSHLSGLDIFTELERRIVGQYKLNWKNCKGITSDGTATMTGKHSRVI
260 270 280 290 300 310
360 370 380 390 400 410
pF1KE4 T-LIKYVAPESTSSHCLLYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILC
:.. . .. .::...:..:: . .: .: .:: .::...:.::. .::::. .:
CCDS47 KKLLEVTNNGAVWNHCFIHREGLASREIPQNLMEVLKNAVKVVNFIKGSSLNSRLLETFC
320 330 340 350 360 370
420 430 440 450 460 470
pF1KE4 EEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVFM-DSAFRLSDCLTNSSWLLRLA
:.:..:: :: .:..::::.::.: :..::: :. :. .. .:.. . ...:. .::
CCDS47 SEIGTNHTHLLYHTKIRWLSQGKILSRVYELRNEIHFFLIEKKSHLASIFEDDTWVTKLA
380 390 400 410 420 430
480 490 500 510 520 530
pF1KE4 YLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEFWASSVEEE--NFDCFPTLSDF
::.:::. :::..:..:::: :: ...... . : .: .. . .. :: . .
CCDS47 YLTDIFSILNELSLKLQGKNSDVFQHVERIQGFRKTLLLWQVRLKSNRPSYYMFPRFLQH
440 450 460 470 480 490
540 550 560 570 580
pF1KE4 LTE--INSTVDKDICSAIVQHLRGLRATLLKYFPV----TNDNNAWVRNPFTV----TVK
. : :: .. :.: :. :: .: :. ..:: : .:.::..::. ..
CCDS47 IEENIINENILKEIKLEILLHLTSLSQTFNHFFPEEKFETLRENSWVKDPFAFRHPESII
500 510 520 530 540 550
590 600 610 620 630 640
pF1KE4 PASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHL
.:: .. . :..:.:. .:... :::. :: .. ...: ..:..: .::::.: :
CCDS47 ELNLVPEEENELLQLSSSYTLKNDYETLSLSAFWMKVKEDFPLLSRKSVLLLLPFTTTSL
560 570 580 590 600 610
650 660 670 680 690
pF1KE4 CETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH
:: ::: . ::: :. :. : ::. ::. .:. ... .....
CCDS47 CELGFSILTQLKTKERNGLNCAAVMRVALSSCVPDWNELMNRQAHPS
620 630 640 650
>>CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7 (573 aa)
initn: 986 init1: 321 opt: 872 Z-score: 1071.9 bits: 208.5 E(32554): 2.2e-53
Smith-Waterman score: 1146; 35.7% identity (68.9% similar) in 544 aa overlap (169-693:33-573)
140 150 160 170 180 190
pF1KE4 LSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVN---TDNESATE
..:... .:. .:.... : :: :
CCDS56 PESRDTTDLSPGGTQEMEGIVIVKVEEEDEEDHFQKERNKVESSPQVLSRSTTMNERALL
10 20 30 40 50 60
200 210 220 230 240 250
pF1KE4 ASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDL
.:: :.:..: ::: .: .: : :.: .::.. . :. .. ::..:..::: .
CCDS56 SSYLVAYRVAKEKMAHTAAEKIILPACMDMVRTIFDDKSADKLRTIPLSDNTISRRICTI
70 80 90 100 110 120
260 270 280 290 300 310
pF1KE4 AADIEEELVCRLKICDGFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQSNA
: .: :. ::. :..:::::.:... .:::.::: .. .. :::: : .:.:.
CCDS56 AKHLEAMLITRLQSGIDFAIQLDESTDIASCPTLLVYVRYVWQDDFVEDLLCCLNLNSHI
130 140 150 160 170 180
320 330 340 350 360 370
pF1KE4 TGEEIFNCI-NSFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVT-LIKYVAPESTSSHCL
:: ..:. . : .. .....:..: . ::.. . :: .. . :.. . ... .::.
CCDS56 TGLDLFTELENCLLGQYKLNWKHCKGISSDGTANMTGKHSRLTEKLLEATHNNAVWNHCF
190 200 210 220 230 240
380 390 400 410 420 430
pF1KE4 LYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVR
..:.::. : . :: .:: .::. .:.::. .::::.:.: :.:..:: ::..::::
CCDS56 IHREALVSKEISPSLMDVLKNAVKTVNFIKGSSLNSRLLEIFCSEIGVNHTHLLFHTEVR
250 260 270 280 290 300
440 450 460 470 480 490
pF1KE4 WLSRGKVLVRLFELRRELLVFM-DSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQ
:::.:::: :..::: :. .:. .. .:.. . .. :. .::::.::: :::..:.::
CCDS56 WLSQGKVLSRVYELRNEIYIFLVEKQSHLANIFEDDIWVTKLAYLSDIFGILNELSLKMQ
310 320 330 340 350 360
500 510 520 530 540
pF1KE4 GKNVTVFTVFDKMSSLLRKLEFWASSVEEE--NFDCFPTLSDFLTE--INSTVDKDICSA
::: .: .... .. . : .: . .. . .. :::: . . : :: :.:
CCDS56 GKNNDIFQYLEHILGFQKTLLLWQARLKSNRPSYYMFPTLLQHIEENIINEDCLKEIKLE
370 380 390 400 410 420
550 560 570 580 590
pF1KE4 IVQHLRGLRATLLKYFPVTN----DNNAWVRNPFTVTVKPASLVARDYES-----LIDLT
:. :: .: :. ::: . .: :...::. .: :.. . : :..:.
CCDS56 ILLHLTSLSQTFNYYFPEEKFESLKENIWMKDPFAFQ-NPESIIELNLEPEEENELLQLS
430 440 450 460 470 480
600 610 620 630 640 650
pF1KE4 SDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYR
:. .:. .. :::. :: .. ...: ..:... .::::.: .::: ::: . ::: :
CCDS56 SSFTLKNYYKILSLSAFWIKIKDDFPLLSRKSILLLLPFTTTYLCELGFSILTRLKTKKR
490 500 510 520 530 540
660 670 680 690
pF1KE4 KRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH
.::..:: ::. ::. .:. :.. .. : : ::
CCDS56 NRLNSAPDMRVALSSCVPDWKELMNR--QAHPSH
550 560 570
>>CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 (949 aa)
initn: 378 init1: 268 opt: 549 Z-score: 669.3 bits: 134.8 E(32554): 5.8e-31
Smith-Waterman score: 549; 27.1% identity (62.1% similar) in 420 aa overlap (252-662:526-936)
230 240 250 260 270 280
pF1KE4 AKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESA
..:::... :.: ... ..:. .:: .
CCDS55 YLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEIT
500 510 520 530 540 550
290 300 310 320 330 340
pF1KE4 DVSGLAVLLVFVR-YRFNKSIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKCVD
:... . : .:.: : .. :.:: . .. .:.:::. ... ... :.: : :.
CCDS55 DINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVEKSLKNFCIDWSKLVS
560 570 580 590 600 610
350 360 370 380 390
pF1KE4 VCSDASRA-VDGKIAEAVTLIKYVAP-----ESTSSHCLLYRHALAVKIMPTSLKNVLDQ
: : .. : ::.. . .. : . :: : : :... ..: .. . .. .:.:
CCDS55 VASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMDV
620 630 640 650 660 670
400 410 420 430 440 450
pF1KE4 AVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVF
.:. .:.: .: . . : :. .:. .:: ::..::::: :: :.:: .:. :
CCDS55 VVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDSF
680 690 700 710 720 730
460 470 480 490 500 510
pF1KE4 MDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEF
:.: . :.. .:. ::.:.:. .:: .:.:.::.. : ..: . ..: :: .
CCDS55 MSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKLCL
740 750 760 770 780 790
520 530 540 550 560 570
pF1KE4 WASSVEEENFDCFPTLSDFLTEINSTVDKDICSAI--VQHLRGLRATLLKYFPVTNDNNA
: . . ..:. :::: .. : ..: . : . .:. :. : . ... .
CCDS55 WETHLTRNNLAHFPTL-----KLASRNESDGLNYIPKIAELQTEFQKRLSDFKLYESELT
800 810 820 830 840
580 590 600 610 620 630
pF1KE4 WVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAV
.::.. . :. . .::: .. .: ....... .:.. : ::. .. .
CCDS55 LFSSPFSTKID--SVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHCA
850 860 870 880 890 900
640 650 660 670 680 690
pF1KE4 RVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCS
..: :.. ..:: :: . .:::: ..:
CCDS55 KILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT
910 920 930 940
>>CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 (949 aa)
initn: 378 init1: 268 opt: 545 Z-score: 664.4 bits: 133.8 E(32554): 1.1e-30
Smith-Waterman score: 545; 27.3% identity (62.0% similar) in 418 aa overlap (252-662:526-936)
230 240 250 260 270 280
pF1KE4 AKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESA
..:::... :.: ... ..:. .:: .
CCDS34 YLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEIT
500 510 520 530 540 550
290 300 310 320 330 340
pF1KE4 DVSGLAVLLVFVR-YRFNKSIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKCVD
:... . : .:.: : .. :.:: . .. .:.::: ... ..: :.: . :.
CCDS34 DINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFLRVEKSLKKFCINWSRLVS
560 570 580 590 600 610
350 360 370 380 390
pF1KE4 VCSDASRA-VDGKIAEAVTLIKYVAP-----ESTSSHCLLYRHALAVKIMPTSLKNVLDQ
: : .. : ::.. . .. : . :: : : :... ..: .. . .. .:.:
CCDS34 VASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMDV
620 630 640 650 660 670
400 410 420 430 440 450
pF1KE4 AVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVF
.:. .:.: .: . . : :. .:. .:: ::..::::: :: :.:: .:. :
CCDS34 VVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDSF
680 690 700 710 720 730
460 470 480 490 500 510
pF1KE4 MDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEF
:.: . :.. .:. ::.:.:. .:: .:.:.::.. : ..: . ..: :: .
CCDS34 MSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKLCL
740 750 760 770 780 790
520 530 540 550 560 570
pF1KE4 WASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQHLRGLRATLLKYFPVTNDNNAWV
: . . ..:. ::::. :. : . . :.. :. :. : . ... .
CCDS34 WETHLTRNNLAHFPTLK--LVSRNESDGLNYIPKIAE-LKTEFQKRLSDFKLYESELTLF
800 810 820 830 840 850
580 590 600 610 620 630
pF1KE4 RNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRV
.::.. . :. . .::: .. .: ....... .:.. : ::. .. ...
CCDS34 SSPFSTKID--SVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHCAKI
860 870 880 890 900
640 650 660 670 680 690
pF1KE4 LLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH
: :.. ..:: :: . .:::: ..:
CCDS34 LSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT
910 920 930 940
>>CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3 (607 aa)
initn: 356 init1: 195 opt: 434 Z-score: 531.0 bits: 108.5 E(32554): 3e-23
Smith-Waterman score: 434; 22.8% identity (56.3% similar) in 540 aa overlap (130-650:37-563)
100 110 120 130 140 150
pF1KE4 TFSKKPKRRKYDESYLSFGFTYFGNRDAPHAQCVLCKKILSNSSLAPSKLRRHLETKHAA
: :..:.... . .::: :..:
CCDS46 RSKMEVDEALVFRPEWTQRYLVVEPPEGDGALCLVCRRLIVATR--ERDVRRHYEAEHE-
10 20 30 40 50 60
160 170 180 190 200 210
pF1KE4 YKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIALSGEAHTIGELLIK
: .. .. .. . . : : .: :..:. .. .::.:.. :... .
CCDS46 YYERYVADGERAALVERLRQGDLPVASFTPEERAARAGLGLCRLLALKGRGWGEGDFVYQ
70 80 90 100 110 120
220 230 240 250 260 270
pF1KE4 PCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDE
: .:..: .. . ...:.:: . . .:: .. .....: : . ..:: ::.
CCDS46 -CM-EVLLREVLPEHVSVLQGVDLSPDITRQRILSIDRNLRNQLFNRARDFKAYSLALDD
130 140 150 160 170 180
280 290 300 310 320 330
pF1KE4 SADVSGLAVLLVFVRYRFNK-SIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKC
.: :. ::::.: . ..:::: .: . . ... : .: . ..
CCDS46 QAFVAYENYLLVFIRGVGPELEVQEDLLTIINLTHHFSVGALMSAILESLQTAGLSLQRM
190 200 210 220 230 240
340 350 360 370 380 390
pF1KE4 VDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHC---LLYRHALAVKIMPT---SLKNVL
: . . . . :.: :..:. ...: .: . : : .... . ......
CCDS46 VGLTTTHTLRM---IGENSGLVSYMREKAVSPNCWNVIHYSGFLHLELLSSYDVDVNQII
250 260 270 280 290
400 410 420 430 440
pF1KE4 DQAVQIINYIKAR----PHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELR
. . : ::.: :. . :: : : . .. ::. :: :::.: .: ::
CCDS46 NTISEWIVLIKTRGVRRPEFQTLLTESESEHGERVNGRCLNN---WLRRGKTLKLIFSLR
300 310 320 330 340 350
450 460 470 480 490 500
pF1KE4 RELLVFMDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSL
.:. .:. :. . .....:: ...:.::. .: :.. .. ..: . ..::.. ..
CCDS46 KEMEAFLVSVGATTVHFSDKQWLCDFGFLVDIMEHLRELSEELRVSKVFAAAAFDHICTF
360 370 380 390 400 410
510 520 530 540 550 560
pF1KE4 LRKLEFWASSVEEENFDCFPTLSDFLTEINST-------VDKDICSAIVQHLRGLRATLL
::... .::.:. ::.: . . :... : : . .. .:. .
CCDS46 EVKLNLFQRHIEEKNLTDFPALREVVDELKQQNKEDEKIFDPDRYQMVICRLQKEFERHF
420 430 440 450 460 470
570 580 590 600 610 620
pF1KE4 KYFPVTNDNNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLI
: . . . :::. . : . .: : : ..... ... .:..:...:
CCDS46 KDLRFIKKDLELFSNPFNFKPEYAPISVR--VELTKLQANTNLWNEYRIKDLGQFYAGLS
480 490 500 510 520 530
630 640 650 660 670 680
pF1KE4 QE-YPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIK
: :: : : .: : . ..:: .:::
CCDS46 AESYPIIKGVACKVASLFDSNQICEKAFSYLTRNQHTLSQPLTDEHLQALFRVATTEMEP
540 550 560 570 580 590
693 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 04:08:22 2016 done: Sun Nov 6 04:08:23 2016
Total Scan time: 3.360 Total Display time: 0.140
Function used was FASTA [36.3.4 Apr, 2011]