FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1701, 547 aa
1>>>pF1KSDA1701 547 - 547 aa - 547 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.4273+/-0.00106; mu= 14.2242+/- 0.064
mean_var=104.8730+/-21.024, 0's: 0 Z-trim(107.2): 27 B-trim: 206 in 1/50
Lambda= 0.125240
statistics sampled from 9440 (9461) to 9440 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.652), E-opt: 0.2 (0.291), width: 16
Scan time: 3.640
The best scores are: opt bits E(32554)
CCDS14502.1 BHLHB9 gene_id:80823|Hs108|chrX ( 547) 3618 664.6 8.2e-191
CCDS14501.1 GPRASP2 gene_id:114928|Hs108|chrX ( 838) 824 159.9 1.1e-38
CCDS35352.1 GPRASP1 gene_id:9737|Hs108|chrX (1395) 799 155.5 3.7e-37
CCDS14500.1 ARMCX5 gene_id:64860|Hs108|chrX ( 558) 645 127.5 4.2e-29
CCDS59170.1 ARMCX4 gene_id:100131755|Hs108|chrX (2290) 592 118.3 1e-25
CCDS14489.1 ARMCX3 gene_id:51566|Hs108|chrX ( 379) 406 84.2 3.1e-16
CCDS14487.1 ARMCX1 gene_id:51309|Hs108|chrX ( 453) 399 83.0 8.6e-16
CCDS55146.1 ARMC10 gene_id:83787|Hs108|chr7 ( 308) 372 78.0 1.9e-14
CCDS5728.1 ARMC10 gene_id:83787|Hs108|chr7 ( 343) 372 78.0 2e-14
CCDS14490.1 ARMCX2 gene_id:9823|Hs108|chrX ( 632) 327 70.0 9.3e-12
>>CCDS14502.1 BHLHB9 gene_id:80823|Hs108|chrX (547 aa)
initn: 3618 init1: 3618 opt: 3618 Z-score: 3539.1 bits: 664.6 E(32554): 8.2e-191
Smith-Waterman score: 3618; 100.0% identity (100.0% similar) in 547 aa overlap (1-547:1-547)
10 20 30 40 50 60
pF1KSD MAGTKNKTRAQAKTEKKAAIQAKAGAEREATGVVRPVAKTRAKAKAKTGSKTDAVAEMKA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MAGTKNKTRAQAKTEKKAAIQAKAGAEREATGVVRPVAKTRAKAKAKTGSKTDAVAEMKA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD VSKNKVVAETKEGALSEPKTLGKAMGDFTPKAGNESTSSTCKNEAGTDAWFWAGEEATIN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VSKNKVVAETKEGALSEPKTLGKAMGDFTPKAGNESTSSTCKNEAGTDAWFWAGEEATIN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD SWFWNGEEAGNSFSTKNDKPEIGAQVCAEELEPAAGADCKPRSGAEEEEEENVIGNWFWE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SWFWNGEEAGNSFSTKNDKPEIGAQVCAEELEPAAGADCKPRSGAEEEEEENVIGNWFWE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD GDDTSFDPNPKPVSRIVKPQPVYEINEKNRPKDWSEVTIWPNAPAVTPAVLGFRSQAPSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GDDTSFDPNPKPVSRIVKPQPVYEINEKNRPKDWSEVTIWPNAPAVTPAVLGFRSQAPSE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD ASPPSYIVLASAEENACSLPVATACRPSRNTRSCSQPIPECRFDSDPCIQTIDEIRRQIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ASPPSYIVLASAEENACSLPVATACRPSRNTRSCSQPIPECRFDSDPCIQTIDEIRRQIR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD IREVNGIKPFACPCKMECYMDSEEFEKLVSLLKSTTDPLIHKIARIAMGVHNVHPFAQEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 IREVNGIKPFACPCKMECYMDSEEFEKLVSLLKSTTDPLIHKIARIAMGVHNVHPFAQEF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD INEVGVVTLIESLLSFPSPEMRKKTVITLNPPSGDERQRKIELHVKHMCKETMSFPLNSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 INEVGVVTLIESLLSFPSPEMRKKTVITLNPPSGDERQRKIELHVKHMCKETMSFPLNSP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD GQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLLLNMSENPTAARD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLLLNMSENPTAARD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD MINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIRKGSIVVVDHLSYNTLMAIFREV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIRKGSIVVVDHLSYNTLMAIFREV
490 500 510 520 530 540
pF1KSD KEIIETM
:::::::
CCDS14 KEIIETM
>>CCDS14501.1 GPRASP2 gene_id:114928|Hs108|chrX (838 aa)
initn: 825 init1: 284 opt: 824 Z-score: 808.1 bits: 159.9 E(32554): 1.1e-38
Smith-Waterman score: 827; 29.1% identity (62.2% similar) in 580 aa overlap (2-547:260-822)
10 20 30
pF1KSD MAGTKNKTRAQAKTEKKAAIQAKAGAEREAT
: ... :.. .....: ... .:.: ::.
CCDS14 TSTASSFWTGEETSVRSWPREESNTRSRHRAKHQTNPRSRPRSKQEAYVDSWSGSEDEAS
230 240 250 260 270 280
40 50 60 70
pF1KSD G------------VVRPVAKTRAKAKAKTGSKTDAVAEMKAVSKNKVVAET----KEGAL
. . :: ..: .:. .. .:. ... :... .. : :
CCDS14 NPFSFWVGENTNNLFRP--RVREEANIRSKLRTNREDCFESESEDEFYKQSWVLPGEEAN
290 300 310 320 330 340
80 90 100 110 120 130
pF1KSD SEPKTLGKAMGDFTPK--AGNESTSSTCKNEAGTDAWFWAGEEATINSWFWNGEEA---G
:. . : . . : : .. :. :.: . ::. :.:::: .:: :
CCDS14 SRFRHRDKEDPNTALKLRAQKDVDSDRVKQEPRFE------EEVIIGSWFWAEKEASLEG
350 360 370 380 390 400
140 150 160 170 180
pF1KSD NSFSTKNDKP-----EIGAQVCAEELEPAAGADCKPRSGAEEEEEENVIGNWFWEGDDTS
.. . ...: ::... : . . :: . .. : ::: ..:.:::. :..
CCDS14 GASAICESEPGTEEGAIGGSAYWAEEKSSLGAVAREEA-KPESEEEAIFGSWFWDRDEAC
410 420 430 440 450 460
190 200 210 220 230 240
pF1KSD FDPNPKPVSRIVKP--QPVYEINEKNRPKDWSEVTIWPNAPAVTPAVLGFRSQAPSEASP
:: :: :: .. . . :.: ..::. :.:::. :.. .: :::: .:
CCDS14 FDLNPCPVYKVSDRFRDAAEELNASSRPQTWDEVTV-EFKPGLFHGV-GFRSTSPFGIPE
470 480 490 500 510
250 260 270 280 290 300
pF1KSD PSYIVLASAEENACSLPVATACRPSRNTRSCSQPIPECRFDSDPCIQTIDEIRRQIRIRE
. .: . .: : .. . ... . .:: :: :. :: ... :::...: ::
CCDS14 EASEMLEAKPKN---LELSPEGEEQESLLQPDQPSPEFTFQYDPSYRSVREIREHLRARE
520 530 540 550 560 570
310 320 330 340 350 360
pF1KSD VNGIKPFACPCKMECYMD--SEEFEKLVSLLKSTTDPLIHKIARIAMGVHNVHPFAQEFI
. ..: : ..: . :::::... :. . ::.::.:..::::.... :...::
CCDS14 SAESESWSCSC-IQCELKIGSEEFEEFLLLMDKIRDPFIHEISKIAMGMRSASQFTRDFI
580 590 600 610 620 630
370 380 390 400 410
pF1KSD NEVGVVTLIESLLSFPSPEMRK---KTVITLNPPSGDERQRKIELHVKHMCKETMSFPLN
. :::.:::.::..:: ..: ...: . :: . . :: . ..:.::.. ..
CCDS14 RDSGVVSLIETLLNYPSSRVRTSFLENMIHMAPPYPNLNM--IETFICQVCEETLAHSVD
640 650 660 670 680 690
420 430 440 450 460 470
pF1KSD SPGQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLLLNMSENPTAA
: : .:...: .:: . .: ..:::.: .. ::...: .:. :::.:::.::::..:
CCDS14 SLEQLTGIRMLRHLTMTIDYHTLIANYMSGFLSLLTTANARTKFHVLKMLLNLSENPAVA
700 710 720 730 740 750
480 490 500 510 520 530
pF1KSD RDMINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIRKGSIVVVDH-LSYNTLMAIF
. ... :::. . .:: .:.. :. . .: ::.. :..:.. ..: .: . :.. :
CCDS14 KKLFSAKALSIFVGLFNIEETNDNIQIVIKMFQNISNIIKSGKMSLIDDDFSLEPLISAF
760 770 780 790 800 810
540
pF1KSD REVKEIIETM
:: .:. . .
CCDS14 REFEELAKQLQAQIDNQNDPEVGQQS
820 830
>>CCDS35352.1 GPRASP1 gene_id:9737|Hs108|chrX (1395 aa)
initn: 717 init1: 270 opt: 799 Z-score: 780.5 bits: 155.5 E(32554): 3.7e-37
Smith-Waterman score: 831; 29.4% identity (62.3% similar) in 578 aa overlap (2-547:826-1379)
10 20 30
pF1KSD MAGTKNKTRAQAKTEKKAAIQAKAGAEREAT
::. .:. .:. :. .: .. :.::.
CCDS35 ETREEDRLAAEKEGIVGSWFGAREETIRREAGSCSKSSPKAEEEE--VIIGSWFWEEEAS
800 810 820 830 840 850
40 50 60 70 80
pF1KSD GVVRPVAKTRAKAKAKTGSKTDAVA--------EMKAVSKNKVVAETKEGALSEPKTLGK
: : . . ..: :.. . .. : ... .. ..: :. : .:.
CCDS35 ----PEAVAGVGFESKPGTEEEEITVGSWFWPEEEASIQAGSQAVEEMESETEEETIFGS
860 870 880 890 900
90 100 110 120 130 140
pF1KSD AMGDFTPKAGNESTSSTCKNEAGTDAWFWAGEEATINSWFWNGEEA---GNSFSTKNDKP
. : : .: .. : .. : :: ..::::. ..: .. .: ..::
CCDS35 WFWD--GKEVSEEAGPCCVSKPEDD------EEMIVESWFWSRDKAIKETGTVATCESKP
910 920 930 940 950 960
150 160 170 180 190
pF1KSD E------IGAQVCAE-ELEPAA--GADCKPRSGAEEEEEENVIGNWFWEGDDTSFDPNPK
: .:. :: :.. . :..: :. :.:.: ..:.::: ::.. :. ::.
CCDS35 ENEEGAIVGSWFEAEDEVDNRTDNGSNCGSRTLADEDE--AIVGSWFWAGDEAHFESNPS
970 980 990 1000 1010
200 210 220 230 240
pF1KSD PVSRIVKPQPV---YEINEKNRPKDWSEVTIW----PNAPAVTPAVLGFRSQAPSEASPP
:: : . . : . . ::..: :::. : . . :.. :: :.::.
CCDS35 PVFRAICRSTCSVEQEPDPSRRPQSWEEVTVQFKPGPWGRVGFPSISPFR--FPKEAASL
1020 1030 1040 1050 1060 1070
250 260 270 280 290 300
pF1KSD SYIVLASAEENACSLPVATACRPSRNTRSCSQPIPECRFDSDPCIQTIDEIRRQIRIREV
.... .: : . . ... . .:: :: :. :: ....:::...: .:
CCDS35 FCEMFGGKPRNMVLSPEG---EDQESLLQPDQPSPEFPFQYDPSYRSVQEIREHLRAKES
1080 1090 1100 1110 1120 1130
310 320 330 340 350 360
pF1KSD NGIKPFACPCKMECYMD--SEEFEKLVSLLKSTTDPLIHKIARIAMGVHNVHPFAQEFIN
. . .: : ..: . :::::.:. :... ::.::.:..::::.... :...::
CCDS35 TEPESSSCNC-IQCELKIGSEEFEELLLLMEKIRDPFIHEISKIAMGMRSASQFTRDFIR
1140 1150 1160 1170 1180 1190
370 380 390 400 410
pF1KSD EVGVVTLIESLLSFPSPEMRK---KTVITLNPPSGDERQRKIELHVKHMCKETMSFPLNS
. :::.:::.::..:: ..: ...: . :: . :. .. ..:.::... ..:
CCDS35 DSGVVSLIETLLNYPSSRVRTSFLENMIRMAPPYPN--LNIIQTYICKVCEETLAYSVDS
1200 1210 1220 1230 1240 1250
420 430 440 450 460 470
pF1KSD PGQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLLLNMSENPTAAR
: : ::.... .::: .: .::::.: .. ::..:: ::: :::.:::.::: ..
CCDS35 PEQLSGIRMIRHLTTTTDYHTLVANYMSGFLSLLATGNAKTRFHVLKMLLNLSENLFMTK
1260 1270 1280 1290 1300 1310
480 490 500 510 520 530
pF1KSD DMINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIRKGSIVVVDHLSYNTLMAIFRE
.... .:.. . .::..:.. :. .::: :: ..:.: .. : .. . :.. :..
CCDS35 ELLSAEAVSEFIGLFNREETNDNIQIVLAIFENIGNNIKKETVFSDDDFNIEPLISAFHK
1320 1330 1340 1350 1360 1370
540
pF1KSD VKEIIETM
:... . .
CCDS35 VEKFAKELQGKTDNQNDPEGDQEN
1380 1390
>>CCDS14500.1 ARMCX5 gene_id:64860|Hs108|chrX (558 aa)
initn: 720 init1: 287 opt: 645 Z-score: 635.9 bits: 127.5 E(32554): 4.2e-29
Smith-Waterman score: 727; 30.9% identity (61.5% similar) in 553 aa overlap (10-542:26-531)
10 20 30 40
pF1KSD MAGTKNKTRAQAKTEKKAAIQAKAGAEREATGVVRPVAKTRAKA
: :... :. .: : :: .. .:.. : : .
CCDS14 MVDSGTEARARGKAEAGLQDGISGPATARVNGKTQAEAVAEAELKTESVTQAKAGDGAMT
10 20 30 40 50 60
50 60 70 80 90
pF1KSD KAKTGSKTDAVAEMKAV------SKNKVVAETKEGALSE----PKTLGKAMGDFTPKAGN
...: . .:.: . : .:..:..::: :.: :.: .::: : .
CCDS14 RTHTVTYREAMAVTREVIKVEDTTKTRVMVETKTKPLAERSIVPQTKSKAM----PMS--
70 80 90 100 110
100 110 120 130 140 150
pF1KSD ESTSSTCKNEAGTDAWFWAGEEATINSWFWNGEEAGNSFSTKNDKPEIGAQVCAEELEPA
.:.. :.:. . : . ::.: : .. ..:: . :.. .: : .
CCDS14 -RVSTVTKSEVKVVAVI----EANIRS-----------YAKSHDKANTGSRPDRRE-ETS
120 130 140 150
160 170 180 190 200 210
pF1KSD AGADCKPRSGAEEEEEENVIGNWFWEGDDTS----FDPNPKPVSRIVKPQPVYEINEKNR
: . .:.::: : .::: :.. : : :. . .. :: : .:.:: .
CCDS14 IGMK------SSDEDEEN-ICSWFWTGEEPSVGSWFWPEEETSLQVYKPLP--KIQEKPK
160 170 180 190 200
220 230 240 250 260
pF1KSD PKDWSEVTIWPNAPAVTPAVLGFRSQAPSEASPPSYIVLASAEENACSLPVA---TACRP
: .:: .. : . : ::::. .: . ::: : .
CCDS14 PTHKPTLTIKQKVIAWSRA---------------RYIVLVPVEGGEQSLPPEGNWTLVET
210 220 230 240 250
270 280 290 300 310 320
pF1KSD SRNTRSCSQPIPECRFDSDPCIQTIDEIRRQIRIREVNGIKPFACPCKMECY-MDSEEFE
.: .:. . : ::. ::..::: :: : .: :: :: . . .. .::.
CCDS14 LIETPLGIRPLTKIPPYHGPYYQTLAEIKKQIRQREKYGPNPKACHCKSRGFSLEPKEFD
260 270 280 290 300 310
330 340 350 360 370 380
pF1KSD KLVSLLKSTTDPLIHKIARIAMGVHNVHPFAQEFINEVGVVTLIESLLSFPSPEMRKKTV
:::.::: : ::.::.:: . ::. ..::.:..:..::....::.:.. :. . . ..
CCDS14 KLVALLKLTKDPFIHEIATMIMGISPAYPFTQDIIHDVGITVMIENLVNNPNVKEHPGAL
320 330 340 350 360 370
390 400 410 420 430 440
pF1KSD ITLNPPS-GDERQRKIELHVKHMCKETMSFPLNSPGQQSGLKILGQLTTDFVHHYIVANY
.. : ..:. .. : .....:: .: ::::: : .:::.::.:. : ::....:
CCDS14 SMVDDSSESSEEPKSGESYIHQVCKGIISCPLNSPVQLAGLKLLGHLSIKFEDHYVITSY
380 390 400 410 420 430
450 460 470 480 490 500
pF1KSD FSELFHLLSSGNCKTRNLVLKLLLNMSENPTAARDMINMKALAALKLIFNQKEAKANLVS
. ... ::..:. ::. :::.. .:.: . .:..:. :.:..: ::..:.:::...
CCDS14 IPDFLTLLNKGSVKTKFYVLKVFSCLSKNHANTRELISAKVLSSLVAPFNKNESKANILN
440 450 460 470 480 490
510 520 530 540
pF1KSD GVAIFINIKEHIR-KGSIVVVDHLSYNTLMAIFREVKEIIETM
. :: ::. ... :... . .... . :..::.:.:.
CCDS14 IIEIFENINFQFKTKAKLFTKEKFTKSELISIFQEAKQFGQKLQDLAEHSDPEVRDKVIR
500 510 520 530 540 550
CCDS14 LILKL
>>CCDS59170.1 ARMCX4 gene_id:100131755|Hs108|chrX (2290 aa)
initn: 735 init1: 303 opt: 592 Z-score: 575.3 bits: 118.3 E(32554): 1e-25
Smith-Waterman score: 639; 28.2% identity (59.0% similar) in 547 aa overlap (14-541:1749-2261)
10 20 30
pF1KSD MAGTKNKTRAQAKTEKKAAIQAKAGAEREATGVVRPVA-----
::.:: : .. . ::: . : :
CCDS59 GRFQVSFEVEANEGFWFGPGAEAVIGSWCWTEEKADIVSRPDDKDEATTASRSGAGEEAM
1720 1730 1740 1750 1760 1770
40 50 60 70 80 90
pF1KSD ---KTRAKAKAKTGS--KTDAVAEMKAVSKNKVVAETKEGALSEPKTLGKAMGDFTPKAG
. .:. ::..:: ... :: : . .. : .. :: .: . . : . ::
CCDS59 ICSRIEAENKASSGSWIRSEEVAYMGSCVGAEAGAGAEAGAGAEAGAGAGAEAGAEAGAG
1780 1790 1800 1810 1820 1830
100 110 120 130 140 150
pF1KSD NESTSSTCKNEAGTDAWFWAGEEATINSWFWNGEEAGNSFSTKNDKPEIGAQVCAEELEP
. .: :.:. : : :. .:..: . ::::: : . :
CCDS59 AGAGPGT---ESGAGIWSWDGDATTVESRLGAGEEAG---------------VESWTLAR
1840 1850 1860 1870 1880
160 170 180 190 200 210
pF1KSD AAGADCKPRSGAEEEEEENVIGNWFW---EGDDTSFDPNPKPVSRIVKPQPVYEINEKNR
.: : : .. . :: . . . :: :...: . . : .: :..: .
CCDS59 NVGEDELSRESSPDIEEIS-LRSLFWAESENSNTFRSKSGKDASFESGAGDNTSIKDKFE
1890 1900 1910 1920 1930
220 230 240 250 260 270
pF1KSD PKDWSEVTIWPNAPAVTPAVLGFRSQAPSEASPPSYIVLASAEENACSLPVATACRPSRN
.. : : : .. . ....: :.:.... : . :. .
CCDS59 AAGGVDIGSWFCA--------GNENTSEDKSAPK-----AKAKKSSESRGIYPYMVPGAG
1940 1950 1960 1970 1980
280 290 300 310 320
pF1KSD TRSCSQPI--PECRF--DSDPCIQTIDEIRRQIRIREVNGIKPFACPCKMECYMDSEEFE
: . . : .: .:. . . :: :.: : : . .:..: :: : :: ...:
CCDS59 MGSWDGAMIWSETKFAHQSEASFPVEDESRKQTRTGEKT--RPWSCRCKHEANMDPRDLE
1990 2000 2010 2020 2030 2040
330 340 350 360 370 380
pF1KSD KLVSLLKSTTDPLIHKIARIAMGVHNVHPFAQEFINEVGVVTLIESLLSFPSPEMRKKTV
::. ... : :: .:.:: :. . ...: . .:: ...:::::. : : .:.:..
CCDS59 KLICMIEMTEDPSVHEIANNALYNSADYSYSHEVVRNVGGISVIESLLNNPYPSVRQKAL
2050 2060 2070 2080 2090 2100
390 400 410 420 430 440
pF1KSD ITLNPPS-GDERQRKIELHVKHMCKETMSFPLNSPGQQSGLKILGQLTTDFVHHYIVANY
.:: : . : .::.. .....:..:...:::: : .::... .:: ....:.::
CCDS59 NALNNISVAAENHRKVKTYLNQVCEDTVTYPLNSNVQLAGLRLIRHLTITSEYQHMVTNY
2110 2120 2130 2140 2150 2160
450 460 470 480 490 500
pF1KSD FSELFHLLSSGNCKTRNLVLKLLLNMSENPTAARDMINMKALAALKLIFNQKEAKANLVS
.::...::. :. .:.. :: .:::.:.::. ..:.. .: ..: ::..::.: :...
CCDS59 ISEFLRLLTVGSGETKDHVLGMLLNFSKNPSMTKDLLIANAPTSLINIFSKKETKENILN
2170 2180 2190 2200 2210 2220
510 520 530 540
pF1KSD GVAIFINIKEHI-RKGSIVVVDHLSYNTLMAIFREVKEIIETM
....: ::. :. :... . :..: :.:. .:.. :
CCDS59 ALSLFENINYHFKRRAKAFTQDKFSKNSLYFLFQRPKACAKKLRALAAECNDPEVKERVE
2230 2240 2250 2260 2270 2280
CCDS59 LLISKL
2290
>>CCDS14489.1 ARMCX3 gene_id:51566|Hs108|chrX (379 aa)
initn: 340 init1: 278 opt: 406 Z-score: 404.9 bits: 84.2 E(32554): 3.1e-16
Smith-Waterman score: 406; 28.5% identity (69.2% similar) in 253 aa overlap (268-518:67-317)
240 250 260 270 280 290
pF1KSD PSEASPPSYIVLASAEENACSLPVATACRPSRNTRSCSQPIPECRFDSDPCIQTIDEIR-
: ...: : :. .. .. . :
CCDS14 KMAEGGSGDVDDAGDCSGARYNDWSDDDDDSNESKSIVWYPPWARIGTEAGTRARARARA
40 50 60 70 80 90
300 310 320 330 340 350
pF1KSD RQIRIREVNGIKPFACPCKMECYMDSEEFEKLVSLLKSTTDPLIHKIARIAMGVHNVHPF
: : :. ... : : . . .. .:..:.. :.. . : : . : ::.: . .. :
CCDS14 RATRARR--AVQKRASPNSDDTVLSPQELQKVLCLVEMSEKPYILEAALIALGNNAAYAF
100 110 120 130 140 150
360 370 380 390 400 410
pF1KSD AQEFINEVGVVTLIESLLSFPSPEMRKKTVITLNPPSGD-ERQRKIELHVKHMCKETMSF
...: ..: . .. ..:. .: ...:..:.:: : . : ::.........: .:..
CCDS14 NRDIIRDLGGLPIVAKILNTRDPIVKEKALIVLNNLSVNAENQRRLKVYMNQVCDDTITS
160 170 180 190 200 210
420 430 440 450 460 470
pF1KSD PLNSPGQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLLLNMSENP
::: : .::..: ..:. .....:: .:..:.:.:.:: .:. :::::::..:::
CCDS14 RLNSSVQLAGLRLLTNMTVTNEYQHMLANSISDFFRLFSAGNEETKLQVLKLLLNLAENP
220 230 240 250 260 270
480 490 500 510 520 530
pF1KSD TAARDMINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIRKGSIVVVDHLSYNTLMA
. .:... .. ..: .::.:: : ... ..:: ::.....
CCDS14 AMTRELLRAQVPSSLGSLFNKKENKEVILKLLVIFENINDNFKWEENEPTQNQFGEGSLF
280 290 300 310 320 330
540
pF1KSD IFREVKEIIETM
CCDS14 FFLKEFQVCADKVLGIESHHDFLVKVKVGKFMAKLAEHMFPKSQE
340 350 360 370
>>CCDS14487.1 ARMCX1 gene_id:51309|Hs108|chrX (453 aa)
initn: 279 init1: 225 opt: 399 Z-score: 397.0 bits: 83.0 E(32554): 8.6e-16
Smith-Waterman score: 409; 26.0% identity (57.9% similar) in 423 aa overlap (142-539:16-423)
120 130 140 150 160 170
pF1KSD WAGEEATINSWFWNGEEAGNSFSTKNDKPEIGAQVCAEELEPAAGADCKPRSGAEEEEEE
::: .: . : : : . . :.::
CCDS14 MGRTREAGCVAAGVVIGAGACYCVYRLAWGRDENEKIWDEDEEST
10 20 30 40
180 190 200 210
pF1KSD NV--IGNWFWEGDDTSF----------DPNPKP-VSRIVKPQPVYEINEKNRPKDWSEVT
.. :: .: :. : . :: :: .. : ..:: . . :
CCDS14 DTSEIGVETVKGAKTNAGAGSGAKLQGDSEVKPEVSLGLEDCP--GVKEKAHSGSHSGGG
50 60 70 80 90 100
220 230 240 250 260 270
pF1KSD IWPNAPAVTPAVLGFRSQAPSEASPPSYIVLASAEEN-ACSLPV----ATACRPSRNT--
. .: :. .. . :: ..:. . . :.... : ::: . .:.:.:.
CCDS14 LEAKAKALFNTL---KEQASAKAGKGARVGTISGNRTLAPSLPCPGGRGGGCHPTRSGSR
110 120 130 140 150 160
280 290 300 310 320
pF1KSD ---RSCSQPIPECRFDSDPCIQTIDEIRRQIRIREVNGIKPFACPCKMECYMDSEEFEKL
:. .. . : : : .:: : : :.. ... ...:.
CCDS14 AGGRASGKSKGKARSKSTRAPATTWPVRRG----------KFNFPYKIDDILSAPDLQKV
170 180 190 200 210
330 340 350 360 370 380
pF1KSD VSLLKSTTDPLIHKIARIAMGVHNVHPFAQEFINEVGVVTLIESLLSFPSPEMRKKTVIT
...:. :.::.:...: ...: . .. : :. : :.: : .: .:.. .: .:.:: .
CCDS14 LNILERTNDPFIQEVALVTLGNNAAYSFNQNAIRELGGVPIIAKLIKTKDPIIREKTYNA
220 230 240 250 260 270
390 400 410 420 430 440
pF1KSD LNPPSGD-ERQRKIELHVKHMCKETMSFPLNSPGQQSGLKILGQLTTDFVHHYIVANYFS
:: : . : : ::. .....: .:: :.: :..::..: ..:. ...... :
CCDS14 LNNLSVNAENQGKIKTYISQVCDDTMVCRLDSAVQMAGLRLLTNMTVTNHYQHLLSYSFP
280 290 300 310 320 330
450 460 470 480 490 500
pF1KSD ELFHLLSSGNCKTRNLVLKLLLNMSENPTAARDMINMKALAALKLIFNQKEAKANLVSGV
..: :: :: :. ..::..:..:::. .:.... :. . : .::.. . :.. .
CCDS14 DFFALLFLGNHFTKIQIMKLIINFTENPAMTRELVSCKVPSELISLFNKEWDREILLNIL
340 350 360 370 380 390
510 520 530 540
pF1KSD AIFINIKEHIR-KGSIVVVDHLSYNTLMAIFREVKEIIETM
..: ::...:. .: ..: ..:. .:.:
CCDS14 TLFENINDNIKNEGLASSRKEFSRSSLFFLFKESGVCVKKIKALANHNDLVVKVKVLKVL
400 410 420 430 440 450
CCDS14 TKL
>>CCDS55146.1 ARMC10 gene_id:83787|Hs108|chr7 (308 aa)
initn: 360 init1: 250 opt: 372 Z-score: 373.0 bits: 78.0 E(32554): 1.9e-14
Smith-Waterman score: 372; 30.1% identity (71.3% similar) in 216 aa overlap (320-533:58-273)
290 300 310 320 330 340
pF1KSD QTIDEIRRQIRIREVNGIKPFACPCKMECYMDSEEFEKLVSLLKSTTDPLIHKIARIAMG
...:...::. ::.:: ::.: . : :..:
CCDS55 TRGRRRGDRELGIRSSKSAEDLTDGSYDDVLNAEQLQKLLYLLESTEDPVIIERALITLG
30 40 50 60 70 80
350 360 370 380 390 400
pF1KSD VHNVHPFAQEFINEVGVVTLIESLLSFPSPEMRKKTVITLNPPSGD-ERQRKIELHVKHM
. . : .: :.: . .. . .. . ...:.. .:: : . : : ::.......
CCDS55 NNAAFSVNQAIIRELGGIPIVANKINHSNQSIKEKALNALNNLSVNVENQIKIKIYISQV
90 100 110 120 130 140
410 420 430 440 450 460
pF1KSD CKETMSFPLNSPGQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLL
:....: :::: : .:: .: ..:. :.... .:...::..: .:: .:. :::::
CCDS55 CEDVFSGPLNSAVQLAGLTLLTNMTVTNDHQHMLHSYITDLFQVLLTGNGNTKVQVLKLL
150 160 170 180 190 200
470 480 490 500 510 520
pF1KSD LNMSENPTAARDMINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIR-KGSIVVVDH
::.::::. .. .. .. ... ..... :: :. ...: :::. .. .: ..:
CCDS55 LNLSENPAMTEGLLRAQVDSSFLSLYDSHVAKEILLRVLTLFQNIKNCLKIEGHLAVQPT
210 220 230 240 250 260
530 540
pF1KSD LSYNTLMAIFREVKEIIETM
.. ..:
CCDS55 FTEGSLFFLLHGEECAQKIRALVDHHDAEVKEKVVTIIPKI
270 280 290 300
>>CCDS5728.1 ARMC10 gene_id:83787|Hs108|chr7 (343 aa)
initn: 360 init1: 250 opt: 372 Z-score: 372.4 bits: 78.0 E(32554): 2e-14
Smith-Waterman score: 372; 30.1% identity (71.3% similar) in 216 aa overlap (320-533:93-308)
290 300 310 320 330 340
pF1KSD QTIDEIRRQIRIREVNGIKPFACPCKMECYMDSEEFEKLVSLLKSTTDPLIHKIARIAMG
...:...::. ::.:: ::.: . : :..:
CCDS57 ARPQTGGTWESQWSKTSQPEDLTDGSYDDVLNAEQLQKLLYLLESTEDPVIIERALITLG
70 80 90 100 110 120
350 360 370 380 390 400
pF1KSD VHNVHPFAQEFINEVGVVTLIESLLSFPSPEMRKKTVITLNPPSGD-ERQRKIELHVKHM
. . : .: :.: . .. . .. . ...:.. .:: : . : : ::.......
CCDS57 NNAAFSVNQAIIRELGGIPIVANKINHSNQSIKEKALNALNNLSVNVENQIKIKIYISQV
130 140 150 160 170 180
410 420 430 440 450 460
pF1KSD CKETMSFPLNSPGQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLL
:....: :::: : .:: .: ..:. :.... .:...::..: .:: .:. :::::
CCDS57 CEDVFSGPLNSAVQLAGLTLLTNMTVTNDHQHMLHSYITDLFQVLLTGNGNTKVQVLKLL
190 200 210 220 230 240
470 480 490 500 510 520
pF1KSD LNMSENPTAARDMINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIR-KGSIVVVDH
::.::::. .. .. .. ... ..... :: :. ...: :::. .. .: ..:
CCDS57 LNLSENPAMTEGLLRAQVDSSFLSLYDSHVAKEILLRVLTLFQNIKNCLKIEGHLAVQPT
250 260 270 280 290 300
530 540
pF1KSD LSYNTLMAIFREVKEIIETM
.. ..:
CCDS57 FTEGSLFFLLHGEECAQKIRALVDHHDAEVKEKVVTIIPKI
310 320 330 340
>>CCDS14490.1 ARMCX2 gene_id:9823|Hs108|chrX (632 aa)
initn: 236 init1: 147 opt: 327 Z-score: 324.6 bits: 70.0 E(32554): 9.3e-12
Smith-Waterman score: 335; 22.3% identity (53.1% similar) in 557 aa overlap (5-518:40-582)
10 20 30
pF1KSD MAGTKNKTRAQAKTEKKAAIQAKAGAEREATGVV
: :.:: : : .: .:: . .
CCDS14 VAAGIVIGAGAWYCVYKYTRGRDQTKKRMAKPKNRAVAGTGARARAGLRAGFTIDLGSGF
10 20 30 40 50 60
40 50 60 70 80
pF1KSD RPVAKTRAKAKAKTGSKTDAVAEM--KAVSKNKVVAETKEGALSE----------PKT--
: . .::.:. .. ....:. . .::. ::.. :: :. ::.
CCDS14 SPPTPVRAEAEDRAQDEASALDTVGAEAVAPAASSAEAQSGAGSQAQEADGAGVGPKAES
70 80 90 100 110 120
90 100 110 120 130
pF1KSD -LGKAMGD-FTPKAG-NESTSST-CKNEAGTDAWFWAGEEATINSWFWNGEEAGNSFSTK
.: ::.. ..: : .:. ... ::. : .:: . . :. :.
CCDS14 VVGAAMASAIAPPPGVTEALGAAEAPAMAGAPKVAEAPREAETSR---AAVPPGTVVPTE
130 140 150 160 170 180
140 150 160 170 180 190
pF1KSD NDKP-EI--GAQVCAEELEPAAGADCKPRSGAEEEEEENVIGNWFWEGDDTSFDPNPKPV
: :. : : : : . .: .:: . : : : . .:
CCDS14 AAAPTEVTEGPGVAAPTKVAEAPGVASPTEAAEAPVPATPTGAAAPTGAAESPGTSGSPR
190 200 210 220 230 240
200 210 220 230
pF1KSD SRIVKPQPVYEINEKNRPKDWSEVTIWPNAPAVTPAV-----------------LGFRSQ
. .: : .: : ... :.: ..: :: : .:.
CCDS14 TAVV---PGTSAAKKATPG--AHTGAIPKATSATGAVPKGGGKGVTRSRNGGKGKGKKSK
250 260 270 280 290 300
240 250 260 270 280 290
pF1KSD APSEASP----PSYIVLASAEENACSLPVATACRPSRNTRSCSQPIPECRFDSDPCIQTI
. . :. . :.: .: . . : :. . . : ::.: :
CCDS14 VEVDELGMGFRPGDGAAAAAAASANGGQAFLAEVPDSEEGESGWTDTESDSDSEPETQRR
310 320 330 340 350 360
300 310 320 330 340 350
pF1KSD DEIRRQIRIREVNGIKPFACPCKMECYMDSEEFEKLVSLLKSTTDPLIHKIARIAMGVHN
. :: . ... .:: : ... . ....:...::... ::.:...: .... .
CCDS14 GRGRRPVAMQK----RPF--PYEIDEILGVRDLRKVLALLQKSDDPFIQQVALLTLSNNA
370 380 390 400 410
360 370 380 390 400 410
pF1KSD VHPFAQEFINEVGVVTLIESLLSFPSPEMRKKTVITLNPPSGD-ERQRKIELHVKHMCKE
. :: : ..: . .: .... .:....:.....: : . : : ......... .
CCDS14 NYSCNQETIRKLGGLPIIANMINKTDPHIKEKALMAMNNLSENYENQGRLQVYMNKVMDD
420 430 440 450 460 470
420 430 440 450 460 470
pF1KSD TMSFPLNSPGQQSGLKILGQLTTDFVHHYIVANYFSELFHLLSSGNCKTRNLVLKLLLNM
:. ::: : :::.: ..: ......: ....:.:::.:. : . .::.: :.
CCDS14 IMASNLNSAVQVVGLKFLTNMTITNDYQHLLVNSIANFFRLLSQGGGKIKVEILKILSNF
480 490 500 510 520 530
480 490 500 510 520 530
pF1KSD SENPTAARDMINMKALAALKLIFNQKEAKANLVSGVAIFINIKEHIRKGSIVVVDHLSYN
.::: . ... .. :... ..:. . :......: : ...:
CCDS14 AENPDMLKKLLSTQVPASFSSLYNSYVESEILINALTLFEIIYDNLRAEVFNYREFNKGS
540 550 560 570 580 590
540
pF1KSD TLMAIFREVKEIIETM
CCDS14 LFYLCTTSGVCVKKIRALANHHDLLVKVKVIKLVNKF
600 610 620 630
547 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:57:54 2016 done: Thu Nov 3 06:57:54 2016
Total Scan time: 3.640 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]