FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA0540, 2754 aa
1>>>pF1KA0540 2754 - 2754 aa - 2754 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.5827+/-0.00115; mu= 8.3049+/- 0.070
mean_var=274.8986+/-54.354, 0's: 0 Z-trim(111.6): 26 B-trim: 6 in 1/54
Lambda= 0.077355
statistics sampled from 12468 (12484) to 12468 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.687), E-opt: 0.2 (0.383), width: 16
Scan time: 7.710
The best scores are: opt bits E(32554)
CCDS46817.1 NBEAL2 gene_id:23218|Hs108|chr3 (2754) 18479 2077.9 0
CCDS46495.1 NBEAL1 gene_id:65065|Hs108|chr2 (2694) 3187 371.3 4e-101
CCDS58928.1 LRBA gene_id:987|Hs108|chr4 (2851) 1397 171.6 5.7e-41
CCDS3773.1 LRBA gene_id:987|Hs108|chr4 (2863) 1393 171.1 7.8e-41
CCDS55894.1 NBEA gene_id:26960|Hs108|chr13 ( 739) 1367 167.7 2.1e-40
CCDS45026.1 NBEA gene_id:26960|Hs108|chr13 (2946) 1367 168.3 5.9e-40
CCDS3609.1 WDFY3 gene_id:23001|Hs108|chr4 (3526) 1231 153.1 2.5e-35
CCDS44385.1 WDFY4 gene_id:57705|Hs108|chr10 (3184) 1151 144.2 1.1e-32
CCDS6173.1 NSMAF gene_id:8439|Hs108|chr8 ( 917) 955 121.8 1.7e-26
CCDS47864.1 NSMAF gene_id:8439|Hs108|chr8 ( 948) 955 121.9 1.8e-26
CCDS31062.1 LYST gene_id:1130|Hs108|chr1 (3801) 698 93.7 2.1e-17
>>CCDS46817.1 NBEAL2 gene_id:23218|Hs108|chr3 (2754 aa)
initn: 18479 init1: 18479 opt: 18479 Z-score: 11152.0 bits: 2077.9 E(32554): 0
Smith-Waterman score: 18479; 100.0% identity (100.0% similar) in 2754 aa overlap (1-2754:1-2754)
10 20 30 40 50 60
pF1KA0 MAASERLYELWLLYYAQKDLGYLQQWLKAFVGAFKKSISLSSLEPRRPEEAGAEVPLLPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 MAASERLYELWLLYYAQKDLGYLQQWLKAFVGAFKKSISLSSLEPRRPEEAGAEVPLLPL
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA0 DELHVLAEQLHQADLEQALLLLKLFIILCRNLENIEAGRGQVLVPRVLALLTKLVAELKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 DELHVLAEQLHQADLEQALLLLKLFIILCRNLENIEAGRGQVLVPRVLALLTKLVAELKG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA0 CPPPQGRGTQLENVALHALLLCEGLFDPYQTWRRQRSGEVISSKEKSKYKFPPAALPQEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 CPPPQGRGTQLENVALHALLLCEGLFDPYQTWRRQRSGEVISSKEKSKYKFPPAALPQEF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA0 SAFFQESLQNADHLPPILLLRLIHLFCAVLAGGKENGQMAVSDGSVKGLLSVVRGWSRGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SAFFQESLQNADHLPPILLLRLIHLFCAVLAGGKENGQMAVSDGSVKGLLSVVRGWSRGP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA0 APDPCLVPLALEALVGAVHVLHASRAPPRGPELRALLESYFHVLNADWPAGLSSGPEEAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 APDPCLVPLALEALVGAVHVLHASRAPPRGPELRALLESYFHVLNADWPAGLSSGPEEAL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA0 VTLRVSMLDAIPMMLACEDRPVLQATFLSNNCFEHLTRLIQNSKLYLQSRAPPEGDSDLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VTLRVSMLDAIPMMLACEDRPVLQATFLSNNCFEHLTRLIQNSKLYLQSRAPPEGDSDLA
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA0 TRLLTEPDVQKVLDQDTDAIAVHVVRVLTCIMSDSPSAKEVFKERIGYPHLQEVLQSHGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 TRLLTEPDVQKVLDQDTDAIAVHVVRVLTCIMSDSPSAKEVFKERIGYPHLQEVLQSHGP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA0 PTHRLLQELLNMAVEGDHSMCPPPPIRNEQPVLVLAQWLPSLPTAELRLFLAQRLRWLCD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 PTHRLLQELLNMAVEGDHSMCPPPPIRNEQPVLVLAQWLPSLPTAELRLFLAQRLRWLCD
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA0 SCPASRATCVQAGLVGCLLETLSTGLALEARCQEQLLALLQALGRVSIRPMELRHLLRPR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SCPASRATCVQAGLVGCLLETLSTGLALEARCQEQLLALLQALGRVSIRPMELRHLLRPR
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA0 PGLDSEPGGAEAGKARHAGAVIRTLSGMARHQGPARALRYFDLTPSMAGIMVPPVQRWPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 PGLDSEPGGAEAGKARHAGAVIRTLSGMARHQGPARALRYFDLTPSMAGIMVPPVQRWPG
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA0 PGFTFHAWLCLHPMDTAPTPAPTRPLQRKQLYSFFTSSGSGFEAFFTAAGTLVVAVCTRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 PGFTFHAWLCLHPMDTAPTPAPTRPLQRKQLYSFFTSSGSGFEAFFTAAGTLVVAVCTRK
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA0 EYLTMSLPEVSFADSAWHCVAIVHVPGRRPFSQNLVHVYKDGHLVKTAPLRCPSLSEPFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 EYLTMSLPEVSFADSAWHCVAIVHVPGRRPFSQNLVHVYKDGHLVKTAPLRCPSLSEPFS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA0 SCCIGSAGYRTTTTTTGLPTPPVPATLAYTHPALTRSQSVPASTGLGWGSGLVAPLQEGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SCCIGSAGYRTTTTTTGLPTPPVPATLAYTHPALTRSQSVPASTGLGWGSGLVAPLQEGS
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA0 IDSTLAGTQDTRWGSPTSLEGELGAVAIFHEALQATALRTLCTLGPNETAPFKPEGELHE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 IDSTLAGTQDTRWGSPTSLEGELGAVAIFHEALQATALRTLCTLGPNETAPFKPEGELHE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA0 LSTRLLLHYSPQACKNNICLDLSPSHGLDGRLTGHRVETWDVKDVVNCVGGMGALLPLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LSTRLLLHYSPQACKNNICLDLSPSHGLDGRLTGHRVETWDVKDVVNCVGGMGALLPLLE
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA0 RVAAQPKEAEAGPAETHDLVGPELTSGHNTQGLVLPLGKSSEERMERNAVAAFLLMLRNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 RVAAQPKEAEAGPAETHDLVGPELTSGHNTQGLVLPLGKSSEERMERNAVAAFLLMLRNF
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KA0 LQGHMVNQESLVQCQGPAIIGALLRKVPSWAMDMNVLMSAQLLMEQVAAEGSGPLLYLLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LQGHMVNQESLVQCQGPAIIGALLRKVPSWAMDMNVLMSAQLLMEQVAAEGSGPLLYLLY
970 980 990 1000 1010 1020
1030 1040 1050 1060 1070 1080
pF1KA0 QHLLFNFHLWTLSDFAVRLGHIQYMSSIVREHRQKLRKKYGVQFILDALRTHYSPQRERP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 QHLLFNFHLWTLSDFAVRLGHIQYMSSIVREHRQKLRKKYGVQFILDALRTHYSPQRERP
1030 1040 1050 1060 1070 1080
1090 1100 1110 1120 1130 1140
pF1KA0 LAADDLRTVQTSLLGLAREFLVRSLSADDVQVTQTMLSFLAATGDDGQAVGALDLLLALL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LAADDLRTVQTSLLGLAREFLVRSLSADDVQVTQTMLSFLAATGDDGQAVGALDLLLALL
1090 1100 1110 1120 1130 1140
1150 1160 1170 1180 1190 1200
pF1KA0 HGSLVQESLAVFLLEPGNLEVLLALLVRPGSLPLLPDRVCKILRRLQQNERLPERSRQRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 HGSLVQESLAVFLLEPGNLEVLLALLVRPGSLPLLPDRVCKILRRLQQNERLPERSRQRL
1150 1160 1170 1180 1190 1200
1210 1220 1230 1240 1250 1260
pF1KA0 RLRECGLQGLVACLPEGTVSPQLCQGLYKLFLGADCLNLSDLLAVVQLSLQADLSVRLDI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 RLRECGLQGLVACLPEGTVSPQLCQGLYKLFLGADCLNLSDLLAVVQLSLQADLSVRLDI
1210 1220 1230 1240 1250 1260
1270 1280 1290 1300 1310 1320
pF1KA0 CRQLFHLIYGQPDVVRLLARQAGWQDVLTRLYVLEAATAGSPPPSSPESPTSPKPAPPKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 CRQLFHLIYGQPDVVRLLARQAGWQDVLTRLYVLEAATAGSPPPSSPESPTSPKPAPPKP
1270 1280 1290 1300 1310 1320
1330 1340 1350 1360 1370 1380
pF1KA0 PTESPAEPSDVFLPSEAPCPDPDGFYHALSPFCTPFDLGLERSSVGSGNTAGGGGSSGTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 PTESPAEPSDVFLPSEAPCPDPDGFYHALSPFCTPFDLGLERSSVGSGNTAGGGGSSGTL
1330 1340 1350 1360 1370 1380
1390 1400 1410 1420 1430 1440
pF1KA0 TPASQPGTPSPLDGPRPFPAAPGRHSSSLSNVLEDGSLPEPTISGDDTSNTSNPQQTSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 TPASQPGTPSPLDGPRPFPAAPGRHSSSLSNVLEDGSLPEPTISGDDTSNTSNPQQTSEE
1390 1400 1410 1420 1430 1440
1450 1460 1470 1480 1490 1500
pF1KA0 ELCNLLTNVLFSVTWRGVEGSDEAAWRERGQVFSVLTQLGASATLVRPPDCIKRSLLEMM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 ELCNLLTNVLFSVTWRGVEGSDEAAWRERGQVFSVLTQLGASATLVRPPDCIKRSLLEMM
1450 1460 1470 1480 1490 1500
1510 1520 1530 1540 1550 1560
pF1KA0 LESALTDIKEAPVGVLASLTQQALWLLRLLQDFLCAEGHGNQELWSEKLFEGVCSLLDRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LESALTDIKEAPVGVLASLTQQALWLLRLLQDFLCAEGHGNQELWSEKLFEGVCSLLDRL
1510 1520 1530 1540 1550 1560
1570 1580 1590 1600 1610 1620
pF1KA0 GAWPHLANGTADLREMAQIGLRLVLGYILLEDPQLHAQAYVRLHMLLQTAVPARREEACY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 GAWPHLANGTADLREMAQIGLRLVLGYILLEDPQLHAQAYVRLHMLLQTAVPARREEACY
1570 1580 1590 1600 1610 1620
1630 1640 1650 1660 1670 1680
pF1KA0 VLSKLEAALGRVLNTSSLESATDEAGSPLAAAAAAAAAERCSWLVPLVRTLLDRAYEPLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VLSKLEAALGRVLNTSSLESATDEAGSPLAAAAAAAAAERCSWLVPLVRTLLDRAYEPLG
1630 1640 1650 1660 1670 1680
1690 1700 1710 1720 1730 1740
pF1KA0 LQWGLPSLPPTNGSPTFFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKSHDLMSGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LQWGLPSLPPTNGSPTFFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKSHDLMSGF
1690 1700 1710 1720 1730 1740
1750 1760 1770 1780 1790 1800
pF1KA0 WNACYDMLMSSGQRRQWERAQSRRAFQELVLEPAQRRARLEGLRYTAVLKQQATQHSMAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 WNACYDMLMSSGQRRQWERAQSRRAFQELVLEPAQRRARLEGLRYTAVLKQQATQHSMAL
1750 1760 1770 1780 1790 1800
1810 1820 1830 1840 1850 1860
pF1KA0 LHWGALWRQLASPCGAWALRDTPIPRWKLSSAETYSRMRLKLVPNHHFDPHLEASALRDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LHWGALWRQLASPCGAWALRDTPIPRWKLSSAETYSRMRLKLVPNHHFDPHLEASALRDN
1810 1820 1830 1840 1850 1860
1870 1880 1890 1900 1910 1920
pF1KA0 LGEVPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLGEDELAELETPMEAAELDEQREKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 LGEVPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLGEDELAELETPMEAAELDEQREKL
1870 1880 1890 1900 1910 1920
1930 1940 1950 1960 1970 1980
pF1KA0 VLSAECQLVTVVAVVPGLLEVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQLREVHLRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 VLSAECQLVTVVAVVPGLLEVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQLREVHLRR
1930 1940 1950 1960 1970 1980
1990 2000 2010 2020 2030 2040
pF1KA0 FNLRRSALELFFIDQANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQVYSWLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 FNLRRSALELFFIDQANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQVYSWLL
1990 2000 2010 2020 2030 2040
2050 2060 2070 2080 2090 2100
pF1KA0 RLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 RLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFP
2050 2060 2070 2080 2090 2100
2110 2120 2130 2140 2150 2160
pF1KA0 WVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTIDKFHYGTHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 WVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTIDKFHYGTHY
2110 2120 2130 2140 2150 2160
2170 2180 2190 2200 2210 2220
pF1KA0 SNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLESPADVKELIPEFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLESPADVKELIPEFF
2170 2180 2190 2200 2210 2220
2230 2240 2250 2260 2270 2280
pF1KA0 YFPDFLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQALESEYVSAHLHEWI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 YFPDFLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQALESEYVSAHLHEWI
2230 2240 2250 2260 2270 2280
2290 2300 2310 2320 2330 2340
pF1KA0 DLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 DLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKE
2290 2300 2310 2320 2330 2340
2350 2360 2370 2380 2390 2400
pF1KA0 PHPTRLSAEEAAHRLARLDTNSPSIFQHLDELKAFFAEVVSDGVPLVLALVPHRQPHSFI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 PHPTRLSAEEAAHRLARLDTNSPSIFQHLDELKAFFAEVVSDGVPLVLALVPHRQPHSFI
2350 2360 2370 2380 2390 2400
2410 2420 2430 2440 2450 2460
pF1KA0 TQGSPDLLVTVSASGLLGTHSWLPYDRNISNYFSFSKDPTMGSHKTQRLLSGPWVPGSGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 TQGSPDLLVTVSASGLLGTHSWLPYDRNISNYFSFSKDPTMGSHKTQRLLSGPWVPGSGV
2410 2420 2430 2440 2450 2460
2470 2480 2490 2500 2510 2520
pF1KA0 SGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQLSCHLDVVTCLALDTCGIYLISG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQLSCHLDVVTCLALDTCGIYLISG
2470 2480 2490 2500 2510 2520
2530 2540 2550 2560 2570 2580
pF1KA0 SRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVSCVAISTELDMAVSGSEDGTVIIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 SRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVSCVAISTELDMAVSGSEDGTVIIH
2530 2540 2550 2560 2570 2580
2590 2600 2610 2620 2630 2640
pF1KA0 TVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQSSAWERPGAQVTYSLHLYSVNGKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 TVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQSSAWERPGAQVTYSLHLYSVNGKL
2590 2600 2610 2620 2630 2640
2650 2660 2670 2680 2690 2700
pF1KA0 RASLPLAEQPTALTVTEDFVLLGTAQCALHILQLNTLLPAAPPLPMKVAIRSVAVTKERS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 RASLPLAEQPTALTVTEDFVLLGTAQCALHILQLNTLLPAAPPLPMKVAIRSVAVTKERS
2650 2660 2670 2680 2690 2700
2710 2720 2730 2740 2750
pF1KA0 HVLVGLEDGKLIVVVAGQPSEVRSSQFARKLWRSSRRISQVSSGETEYNPTEAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS46 HVLVGLEDGKLIVVVAGQPSEVRSSQFARKLWRSSRRISQVSSGETEYNPTEAR
2710 2720 2730 2740 2750
>>CCDS46495.1 NBEAL1 gene_id:65065|Hs108|chr2 (2694 aa)
initn: 6206 init1: 2723 opt: 3187 Z-score: 1929.0 bits: 371.3 E(32554): 4e-101
Smith-Waterman score: 7835; 46.0% identity (71.5% similar) in 2823 aa overlap (1-2754:1-2694)
10 20 30 40 50
pF1KA0 MAASERLYELWLLYYAQKDLGYLQQWLKAFVGAFKK--SISLSSLEPRRPEEAGAEVPLL
::. :::.:::.:: ..:: ::. :: .::..... .... .: : : .. . ::
CCDS46 MASRERLFELWMLYCTKKDPDYLKLWLDTFVSSYEQFLDVDFEKL-PTRVDDMPPGISLL
10 20 30 40 50
60 70 80 90 100
pF1KA0 PLDELHVLAEQLHQ-----AD-LE---QAL--LLLKLFIILCRNLENIEAGRGQVLVPRV
: . :.:: :: : :: :: ::: ::.:.:::::::: :.: . :
CCDS46 PDNILQVLRIQLLQCVQKMADGLEEQQQALSILLVKFFIILCRNLSNVEEIGTCSYINYV
60 70 80 90 100 110
110 120 130 140 150 160
pF1KA0 LALLTKLVAELKGCPPPQGRGTQ--LENVALHALLLCEGLFDPYQTWRRQRSGEVISSKE
... : . .::. . . : .:. ..::: .::.:.:::..::.. ::...:. :
CCDS46 ITMTTLYIQQLKSKKKEKEMADQTCIEEFVIHALAFCESLYDPYRNWRHRISGRILSTVE
120 130 140 150 160 170
170 180 190 200 210 220
pF1KA0 KSKYKFPPAALPQEFSAFFQESLQNADHLPPILLLRLIHLFCAVLAGGKENGQMAVSDGS
::. :. ::.: :: :: . .:...:: : :.::: :..:::..:. .:.: ..
CCDS46 KSRQKYKPASLTVEFVPFFYQCFQESEHLKESLKCCLLHLFGAIVAGGQRNALQAISPAT
180 190 200 210 220 230
230 240 250 260 270
pF1KA0 VKGLLSVVR---GWSRGPAPDPCLV----PLALEALVGAVHVLHASRAPPRGPELRALLE
.. :. :. .: : :: : :.:. :. .::.: .: . : : ..::
CCDS46 MEVLMRVLADCDSWEDG---DPEEVGRKAELTLKCLTEVVHILLSSNSDQRQVETSTILE
240 250 260 270 280 290
280 290 300 310 320 330
pF1KA0 SYFHVLNADWPA----GLSSGPEEALVTLRVSMLDAIPMMLACEDRPVLQATFLSNNCFE
.::..::.: : : :. ...:...::..: :: : ::::::: ::..::::
CCDS46 NYFKLLNSDHSALPNQRRSRQWENRFIALQIKMLNTITAMLDCTDRPVLQAIFLNSNCFE
300 310 320 330 340 350
340 350 360 370 380 390
pF1KA0 HLTRLIQNSKLYLQSRAPPEGDSDLATRLLTEPDVQKVLDQDTDAIAVHVVRVLTCIMSD
:: ::.:: :.. .:. : .:. ....:: .:.
CCDS46 HLIRLLQNCKVF-------QGQ--------------------LDCLAISTIQALTAVMNK
360 370 380
400 410 420 430 440 450
pF1KA0 SPSAKEVFKERIGYPHLQEVLQSHGPPTHRLLQELLNMAVEGDHSMCPPPPIRNEQPVLV
::.::::::::::: :. :::.: : : .::.::.::::::::. : : ::.:.
CCDS46 SPAAKEVFKERIGYTHMLEVLKSLGQPPLELLKELMNMAVEGDHTSVGILGISNVQPLLL
390 400 410 420 430 440
460 470 480 490 500 510
pF1KA0 LAQWLPSLPTAELRLFLAQRLRWLCDSCPASRATCVQAGLVGCLLETLSTGLALEARCQE
: :::: : . .:..:... :. .: ::.:::.:.. ..:::. .:. : :
CCDS46 LIQWLPELQSHDLQIFISDWLKRICCINRQSRTTCVNANMGIRIIETLDLHSSLHQTCAE
450 460 470 480 490 500
520 530 540 550 560 570
pF1KA0 QLLALLQALGRVSIRPMELRHLLRPRPGLDSEPGGAEAGKARHAGAVIRTLSGMARHQGP
.:.:. .:: :. :.:.::: .:: .. : :.. :::. .
CCDS46 NLIAIHGSLGSQSVSSEEIRRLLRLLRVDESESVHP------YVTPVTRAILTMARKLSL
510 520 530 540 550 560
580 590 600 610 620 630
pF1KA0 ARALRYFDLTPSMAGIMVPPVQRWPGPGFTFHAWLCLHPMDTAPTPAPTRPLQRKQLYSF
::.::.:. ::::: :::.:.::: .:.: ::.:: .: .. .:::::::
CCDS46 ESALQYFNLSHSMAGISVPPIQKWPGSAFSFSAWFCLD-QDQLTLGIANKGGKRKQLYSF
570 580 590 600 610 620
640 650 660 670 680 690
pF1KA0 FTSSGSGFEAFFTAAGTLVVAVCTRKEYLTMSLPEVSFADSAWHCVAIVHVPGRRPFSQN
::.:: :::::.: .: :::::::..:: :. ::. :: :: :: ...::.::.:::.:.
CCDS46 FTGSGMGFEAFITHSGMLVVAVCTKREYATVMLPDHSFCDSLWHNITVVHMPGKRPFGQS
630 640 650 660 670 680
700 710 720 730 740 750
pF1KA0 LVHVYKDGHLVKTAPLRCPSLSEPFSSCCIGSAGYRTTTTT-TGLPTPPVPATLAYTHPA
.:..: .:. .:::: :...:::.:::::::: :::: . .: :: . .. :
CCDS46 FVYIYDNGQQKVSAPLRFPAMNEPFTSCCIGSAGQRTTTPPPSQIPDPPFSSPIT---PH
690 700 710 720 730
760 770 780 790 800 810
pF1KA0 LTRSQSVPASTGLGWGSGLVAPLQEGSIDSTL--AGTQDTRWGSPTSLEGELGAVAIFHE
: .. .:.. ::. ...... . : :::::..:: ::::::.::.: ::.:
CCDS46 RTSFGGILSSAS--WGG----TIEKSKLITKLISAGTQDSEWGCPTSLEGQLGSVIIFYE
740 750 760 770 780 790
820 830 840 850 860 870
pF1KA0 ALQATALRTLCTLGPNETAPFK-PEGELHELSTRLLLHYSPQACKNNICLDLSPSHGLDG
:: ...: ::: .:.: :... .: .::.:. .::::.:::::: .. : :
CCDS46 PLQPPQVKALYLAGPNCLSPWKCQESDMADLPGNILLYYTAKACKNSICLDLS-TNCLHG
800 810 820 830 840 850
880 890 900 910 920 930
pF1KA0 RLTGHRVETWDVKDVVNCVGGMGALLPLLERVAAQPKEAEAGPAETHDLVGPELTSGHNT
::::..: .::.::..::.::...:.::::... . .:.. : : .. . :: .. .
CCDS46 RLTGNKVVNWDIKDIINCIGGLNVLFPLLEQIS-HFSEGQI-PEEKNESTVPESVTPVEG
860 870 880 890 900 910
940 950 960 970 980 990
pF1KA0 QGLVLPLGKSSEERMERNAVAAFLLMLRNFLQGHMVNQESLVQCQGPAIIGALLRKVPSW
. :: :.:: :.::: ::.:.:....:.: : .:: .:.. .: : .::::.::::
CCDS46 DWLVWTSTKASESRLERNLVATFILIVKHFIQRHPINQGNLIHSHGVATLGALLQKVPST
920 930 940 950 960 970
1000 1010 1020 1030 1040 1050
pF1KA0 AMDMNVLMSAQLLMEQVAAEGSGPLLYLLYQHLLFNFHLWTLSDFAVRLGHIQYMSSIVR
::.::::..:::.:::. : . :: .::.:::.:..:. .:: :.:::::.:.:..
CCDS46 LMDVNVLMAVQLLIEQVSLEKNMQLLQQMYQYLLFDFRIWNRGDFPFRIGHIQYLSTIIK
980 990 1000 1010 1020 1030
1060 1070 1080 1090 1100
pF1KA0 EHRQKLRKKYGVQFILDALRTHYSPQ-RERPLAADDLRTVQTSLLGLAREFLVRSLSADD
. :. .::::::::.::.:: .:. . :. ::.::..::: :: . :: .. : ..
CCDS46 DSRRVFRKKYGVQFLLDTLRIYYGNGCKYNELSLDDIRTIRTSLYGLIKYFLCKGGSHEE
1040 1050 1060 1070 1080 1090
1110 1120 1130 1140 1150 1160
pF1KA0 VQVTQTMLSFLAATGDDGQAVGALDLLLALLHGSLVQESLAVFLLEPGNLEVLLALLVRP
.: ......:::... : : ::.:..::. : .. .: ..:.:::: ..: :::.
CCDS46 IQ---SIMGYIAATNEEEQLFGILDVLFSLLRTSPTRGQLFLLLFEPGNADILYALLLNQ
1100 1110 1120 1130 1140
1170 1180 1190 1200 1210 1220
pF1KA0 GSLPLLPDRVCKILRRLQQNERLPERSRQRLRLRECGLQGLVACLPEGTVSPQLCQGLYK
: . . ::.... . . :::.:..:::: : .:: : :. :. .: ..: .
CCDS46 KYSDRLREIIFKIMEQMLKCTNVYERSKQHIRLREVGYSGLGLLLNEALVNTSLIKNLTH
1150 1160 1170 1180 1190 1200
1230 1240 1250 1260 1270 1280
pF1KA0 LFLGAD-CLNLSDLLAVVQLSLQADLSVRLDICRQLFHLIYGQPDVVRLLARQAGWQDVL
....: .:..:::.:: .: .: ..::. :::...... :::... ...:.::::.:
CCDS46 QIINTDPVINFKDLLSVVYISHRAHINVRVAICRKVLQILQFQPDAAHQISQQVGWQDTL
1210 1220 1230 1240 1250 1260
1290 1300 1310 1320 1330
pF1KA0 TRLYVLEAATAGSP------------PPSSPESPTSPKPAPPKPPTE------SPAEPSD
.::.. :. .. . . : . : : : ::
CCDS46 VRLFLKAKFENGNTLHKHSRAVLMKDNDKNMSTEDTKKNSDEKTDEEKITSFASANVSSD
1270 1280 1290 1300 1310 1320
1340 1350 1360 1370
pF1KA0 VF-------LPSEAPCPDPDGFYHALS-------PF--CTPFDLGLERSSVGSGNTAGGG
. : :..: :. :: : .: :.:. :.. : . .
CCDS46 QWSLEDRHSLDSNTPLFPEDSSVGELSFKSENQEEFWHSNPSHLSLDLSGIDSCEMS---
1330 1340 1350 1360 1370 1380
1380 1390 1400 1410 1420 1430
pF1KA0 GSSGTLTPASQPGTPSPLDGPRPFPAAPGRHSSSLSNVLEDGSLPEPTISGDDTSNTSNP
.::. .: : :.::::... . : . ::. :.. .: .. .:: : .
CCDS46 -DSGSQVPDSLPSTPSPVESTKSFSV----HSDRESSITNDMGF------SDDFS-LLES
1390 1400 1410 1420 1430
1440 1450 1460 1470 1480 1490
pF1KA0 QQTSEEELCNLLTNVLFSVTWRGVEGSDEAAWRERGQVFSVLTQLGASATLVRPPDCIKR
:. :::: .:::..: : .:.: ::. .: :::::::.:.. : :. :.:: : ::
CCDS46 QERCEEELLQLLTHILNYVMCKGLEKSDDDTWIERGQVFSALSKPGISSELLRPSDEIKL
1440 1450 1460 1470 1480 1490
1500 1510 1520 1530 1540 1550
pF1KA0 SLLEMMLESALTDIKEAPVGVLASLTQQALWLLRLLQDFLCAEGHGNQELWSEKLFEGVC
.::. ::: :... .:: .. ... ..:. :. ..:::: .:: :...:.:::.: .
CCDS46 TLLQKMLEWAISENREAKTNPVTA--ENAFRLVLIIQDFLQSEGLVNSNMWTEKLLEDMM
1500 1510 1520 1530 1540 1550
1560 1570 1580 1590 1600 1610
pF1KA0 SLLDRLGAWPHLANGTADLREMAQIGLRLVLGYILLEDPQLHAQAYVRLHMLLQTAVPAR
:.: :.. . . ...:: ..:.::.: . :. :.: ..:. :::: :
CCDS46 LLFDCLSV---CYSESPVWVKLSQIQIQLLLGFIGRGNLQVCAMASAKLNTLLQTKVIEN
1560 1570 1580 1590 1600
1620 1630 1640 1650 1660 1670
pF1KA0 REEACYVLSKLEAALGRVLNTSSLESATDEAGSPLAAAAAAAAAERCSWLVPLVRTLLDR
..::::.:.::: .: ..:.. : : :.:.::::::...
CCDS46 QDEACYILGKLEHVL-----SQSIKEQT----------------EIYSFLIPLVRTLVSK
1610 1620 1630 1640
1680 1690 1700 1710 1720 1730
pF1KA0 AYEPLGLQWGLPSLPPTNGSPTFFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKSH
:: : .. ::::: :::: .:::::: .: . ::. .:.: . : :.:.: :. .:
CCDS46 IYELLFMNLHLPSLPFTNGSSSFFEDFQEYCNSNEWQVYIEKYIVPYMKQYEAHTFYDGH
1650 1660 1670 1680 1690 1700
1740 1750 1760 1770 1780 1790
pF1KA0 DLMSGFWNACYDMLMSSGQRRQWERAQSRRAFQELVLEPAQRRARLEGLRYTAVLKQQAT
. :. .:. ::. :: . ..:. : ..:. :::: .:: .:.:: :.:::. .::: ..
CCDS46 ENMALYWKDCYEALMVNMHKRDREGGESKLKFQELFVEPFNRKARQENLRYNNMLKQLSS
1710 1720 1730 1740 1750 1760
1800 1810 1820 1830 1840 1850
pF1KA0 QHSMALLHWGALWRQLASPCGAWALR-DTPIPRWKLSSAETYSRMRLKLVPNHHFDPHLE
:. .: .: :. :. : :: : ..:: .:::...:.:::::::::::..: : :
CCDS46 QQLATLRRWKAIQLYLTCERGPWAKRKQNPI-HWKLANVENYSRMRLKLVPNYNFKTHEE
1770 1780 1790 1800 1810 1820
1860 1870 1880 1890 1900 1910
pF1KA0 ASALRDNLGEVPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLG-EDELAELETPMEAAE
::::::::: :. . .: : :.:..::: . ::.: .: .. .. :
CCDS46 ASALRDNLGIQHSQPSSD-TLLLEVVKQVKVSD----MVEDKLDLPEEDITARVNVDEKE
1830 1840 1850 1860 1870 1880
1920 1930 1940 1950 1960 1970
pF1KA0 LDEQREKLVLSAECQLVTVVAVVPGLLEVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQ
..:.::::: .:.:.:.. :.:: ::.:::..:::::: .: :.:.:.::. : .:
CCDS46 EQDQKEKLVLMEDCELITIIDVIPGRLEITTQHIYFYDGS---IEKEDGVGFDFKWPHSQ
1890 1900 1910 1920 1930
1980 1990 2000 2010 2020 2030
pF1KA0 LREVHLRRFNLRRSALELFFIDQANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVR
.::.::::.::::::::.: .::.:::::: . .::
CCDS46 IREIHLRRYNLRRSALEIFHVDQSNYFLNF-------------------------KKEVR
1940 1950 1960 1970
2040 2050 2060 2070 2080 2090
pF1KA0 NQVYSWLLRLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAGRTYND
:..:: :: :. :.. : .::::::...:::::::::.::::::.::.:.::.:::::::
CCDS46 NKIYSRLLSLHSPNS-YYGSRSPQELFKASGLTQKWVNREISNFDYLIQINTMAGRTYND
1980 1990 2000 2010 2020 2030
2100 2110 2120 2130 2140 2150
pF1KA0 LSQYPVFPWVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTID
:.:::::::.::::.: :::.:::::::::::::::: :.:. .:::::.:::: ::::
CCDS46 LAQYPVFPWILQDYTSEELDLNNPAVFRDLSKPIGVVNEKNAKAMREKYENFEDPMGTID
2040 2050 2060 2070 2080 2090
2160 2170 2180 2190 2200 2210
pF1KA0 KFHYGTHYSNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLESPADV
::::::::::.::::::::::::::.::.:::::::::.::::::. :.::: ...: ::
CCDS46 KFHYGTHYSNSAGVMHYLIRVEPFTTLHIQLQSGRFDCADRQFHSIPATWQALMDNPYDV
2100 2110 2120 2130 2140 2150
2220 2230 2240 2250 2260 2270
pF1KA0 KELIPEFFYFPDFLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQALESEYV
:::::::::::.:::::: :.:: ::...: :.::.:: ::.: :::: .::.:::::::
CCDS46 KELIPEFFYFPEFLENQNQFNLGRLQISKELVNDVILPKWAKSAEDFIYKHRKALESEYV
2160 2170 2180 2190 2200 2210
2280 2290 2300 2310 2320 2330
pF1KA0 SAHLHEWIDLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQ
::::::::::::::::::::: :::::::::.:::::::: .:::.:::::::.:.::::
CCDS46 SAHLHEWIDLIFGYKQRGPAAVEALNVFYYCSYEGAVDLDALTDEKERKALEGMINNFGQ
2220 2230 2240 2250 2260 2270
2340 2350 2360 2370 2380 2390
pF1KA0 TPCQLLKEPHPTRLSAEEAAHRLARLDTNSPSIFQHLDELKAFFAEVVSDGVPLVLALVP
::::::::::: :::::::... ...::.. ..:::: :::.:: : .:::.::. : .:
CCDS46 TPCQLLKEPHPPRLSAEEAVQKPTKIDTSTLNLFQHLPELKSFFIEGISDGIPLLKATIP
2280 2290 2300 2310 2320 2330
2400 2410 2420 2430 2440 2450
pF1KA0 HRQPHSFITQGSPDLLVTVSASGLLGTHSWLPYDRNISNYFSFSKDPTMGSHKTQRLLSG
. : .::..::::.::.:.: . ..:::.::::::::::::.: :: :. . :::: ..:
CCDS46 KNQYRSFMSQGSPELLITISMNYVIGTHGWLPYDRNISNYFTFIKDQTVTNPKTQRSING
2340 2350 2360 2370 2380 2390
2460 2470 2480 2490 2500 2510
pF1KA0 PWVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQLSCHLDVVTCLALDT
..:: .... ..:. :.:::::.:.::.:..: .: .::..:.. :.:.::::: :
CCDS46 SFAPGLEITSKLFVVSHDAKLLFSAGYWDNSIQVMSLTKGKIISHIIRHMDIVTCLATDY
2400 2410 2420 2430 2440 2450
2520 2530 2540 2550 2560 2570
pF1KA0 CGIYLISGSRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVSCVAISTELDMAVSGS
:::.:::::::::::.:.. .:::. :::: :: :.:::: : :.::::::::::::
CCDS46 CGIHLISGSRDTTCMIWQITQQGGVPVGLASKPFQILYGHTNEVLSVGISTELDMAVSGS
2460 2470 2480 2490 2500 2510
2580 2590 2600 2610 2620 2630
pF1KA0 EDGTVIIHTVRRGQFVAALRP-LGATFPGPIFHLALGSEGQIVVQSSAWERPGAQVTYSL
.::::::::...::.. .::: ... : .::.. ::.::: ::. :. . .:
CCDS46 RDGTVIIHTIQKGQYMRTLRPPCESSLFLTIPNLAISWEGHIVVYSSTEEKTTLKDKNAL
2520 2530 2540 2550 2560 2570
2640 2650 2660 2670 2680 2690
pF1KA0 HLYSVNGKLRASLPLAEQPTALTVTEDFVLLGTAQCALHILQLNTLLPAAPPLPMKVAIR
::.:.::: .: : :: . . . . .. :. : : : .:..: . :: :.. :.
CCDS46 HLFSINGKYLGSQILKEQVSDICIIGEHIVTGSIQGFLSIRDLHSLNLSINPLAMRLPIH
2580 2590 2600 2610 2620 2630
2700 2710 2720 2730 2740 2750
pF1KA0 SVAVTKERSHVLVGLEDGKLIVVVAGQPSEVRSSQFARKLWRSSRRISQVSSGETEYNPT
: :::: ::.:::::::::::: .:.:.:.::.:..::.: ::.:.::.:.::::::
CCDS46 CVCVTKEYSHILVGLEDGKLIVVGVGKPAEMRSGQLSRKFWGSSKRLSQISAGETEYNTQ
2640 2650 2660 2670 2680 2690
pF1KA0 EAR
...
CCDS46 DSK
>>CCDS58928.1 LRBA gene_id:987|Hs108|chr4 (2851 aa)
initn: 1597 init1: 459 opt: 1397 Z-score: 849.1 bits: 171.6 E(32554): 5.7e-41
Smith-Waterman score: 1629; 32.6% identity (59.9% similar) in 1082 aa overlap (1667-2713:1822-2835)
1640 1650 1660 1670 1680 1690
pF1KA0 SLESATDEAGSPLAAAAAAAAAERCSWLVPLVRTLLDRAYEPLGLQWGLPSLPPTNGSPT
: :::: . : .. : :: ..: .
CCDS58 SNMSITERLEHALEKAAPLLREIFVDFAPFLSRTLLGSHGQELLIE-GT-SLVCMKSSSS
1800 1810 1820 1830 1840
1700 1710 1720 1730 1740 1750
pF1KA0 FFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKSHDLMSGFWNACYDM-LMSSGQRR
: . .: . ::.. :.:.. .. .. . :. . . . . . .. : ::
CCDS58 VVELVMLLC-SQEWQNSIQKNAGLAFIELVNEGRLLSQTMKDHLVRVANEAEFILSRQRA
1850 1860 1870 1880 1890 1900
1760 1770 1780 1790 1800 1810
pF1KA0 QWERAQSRRAFQELVLEPAQRRARLEGLRYTAVLKQQATQHSMALLHWGALWRQLASPCG
: . . :. : . . . . : . . . .: : . :.. :
CCDS58 --EDIHRHAEFESLCAQYSADKREDEKMCDHLIRAAKYRDHVTATQLIQKIINILTDKHG
1910 1920 1930 1940 1950 1960
1820 1830 1840 1850 1860 1870
pF1KA0 AW--ALRDTPIPRWKLSSAETYSRMRLKLVPNHHFDPHLEAS---ALRDNLGEVPLTPTE
:: . . :. :.:. : : : ..: : . : ::. :.. : :. .
CCDS58 AWGNSAVSRPLEFWRLDYWEDDLRRRRRFVRNPLGSTHPEATLKTAVEHATDEDILAKGK
1970 1980 1990 2000 2010 2020
1880 1890 1900 1910 1920 1930
pF1KA0 EASLPLAVTKEAKVSTPPELLQEDQLGEDELAELETPMEAAELDEQREKLVLSAECQLVT
.. :. .. .. :.: : :.:. . .. .:.. . ::. :::.
CCDS58 QSIRSQALGNQ---NSENEILLE---GDDDTL---SSVDEKDLENLAGPVSLSTPAQLVA
2030 2040 2050 2060 2070
1940 1950 1960 1970 1980
pF1KA0 VVAVVPGLLEVTTQNVYFY----DGSTERVETE-----EGIGYDFRRPLAQLREVHLRRF
.:: : : ::....:: : . .... . ::. . ....: . ::.
CCDS58 PSVVVKGTLSVTSSELYFEVDEEDPNFKKIDPKILAYTEGLHGKWL--FTEIRSIFSRRY
2080 2090 2100 2110 2120 2130
1990 2000 2010 2020 2030 2040
pF1KA0 NLRRSALELFFIDQANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQVYSWLLR
:. .:::.:. ... ..::: . . : . :: : :. :
CCDS58 LLQNTALEIFMANRVAVMFNFPDPATVKKVV--NYLPRVGVGT------------SFGL-
2140 2150 2160 2170 2180
2050 2060 2070 2080 2090 2100
pF1KA0 LRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFPW
:. .: ::.....::..::.: .:::::::::: :::::::.::::.:::::::
CCDS58 ---PQTRRISLASPRQLFKASNMTQRWQHREISNFEYLMFLNTIAGRSYNDLNQYPVFPW
2190 2200 2210 2220 2230
2110 2120 2130 2140 2150 2160
pF1KA0 VLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTIDKFHYGTHYS
:. .: : :::. :. :::::::::..:::.: . :.:::.:: . :::::::::
CCDS58 VITNYESEELDLTLPTNFRDLSKPIGALNPKRAAFFAERYESWEDD--QVPKFHYGTHYS
2240 2250 2260 2270 2280 2290
2170 2180 2190 2200 2210 2220
pF1KA0 NAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLESPADVKELIPEFFY
.:. :. .:.:.::::. ..::.:.:: .:: : :.. ::. .. .:.:::::::.:
CCDS58 TASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSSISRAWRNSQRDTSDIKELIPEFYY
2300 2310 2320 2330 2340 2350
2230 2240 2250 2260 2270 2280
pF1KA0 FPDFLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQALESEYVSAHLHEWID
.:... : :...:: .. . :.:: :::::.. :.:.. .: :::::.:: .::.:::
CCDS58 LPEMFVNFNNYNLGVMD-DGTVVSDVELPPWAKTSEEFVHINRLALESEFVSCQLHQWID
2360 2370 2380 2390 2400 2410
2290 2300 2310 2320 2330 2340
pF1KA0 LIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKEP
:::::::.:: : .::::::: ::::::.:. .:: :.:.:. : .::::: ::: ::
CCDS58 LIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDPVLREAVEAQIRSFGQTPSQLLIEP
2420 2430 2440 2450 2460 2470
2350 2360 2370 2380 2390 2400
pF1KA0 HPTRLSAEEAAHRLARLDTNSPSIFQHLDELKAFFAEVVSDGVPLVLALVPHRQPHSFIT
:: : :: .. :: .: . .... .. : : .. . ::
CCDS58 HPPRGSAMQV----------SPLMFTDKAQQDVIMVLKFPSNSP-VTHVAANTQPG----
2480 2490 2500 2510
2410 2420 2430 2440 2450
pF1KA0 QGSPDLLVTVSASGLLGTHSW--LPYDRNISN----YFSFSKDPTMGSHKT--QRLLSGP
..: . .::.:. :.....: :: .. . . :: ..:. .: ..
CCDS58 LATPAV-ITVTANRLFAVNKWHNLPAHQGAVQDQPYQLPVEIDPLIASNTGMHRRQITDL
2520 2530 2540 2550 2560 2570
2460 2470 2480 2490 2500 2510
pF1KA0 WVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQLSCHLDVVTCLALDTC
. : .: .... :.. .. : :: :.:: . :.:.. . : ::::::: .
CCDS58 LDQSIQVHSQCFVITSDNRYILVCGFWDKSFRVYSTDTGRLIQVVFGHWDVVTCLARSES
2580 2590 2600 2610 2620 2630
2520 2530 2540 2550 2560
pF1KA0 GI----YLISGSRDTTCMVWRLLHQ--G-GLSVGLAPKPVQVLYGHGAAVSCVAISTELD
: :..:::::.: ..: . : : . : . : .: :: :.:.:. .::
CCDS58 YIGGNCYILSGSRDATLLLWYWNGKCSGIGDNPGETAAPRAILTGHDYEVTCAAVCAELG
2640 2650 2660 2670 2680 2690
2570 2580 2590 2600 2610 2620
pF1KA0 MAVSGSEDGTVIIHTVRRGQFVAALR-PLGATFPGPIFHLALGSEGQIVVQSSAWERPGA
...:::..: .::.. :... .:. : . : : . ::. :. . . :
CCDS58 LVLSGSQEGPCLIHSMN-GDLLRTLEGPENCLKPKLI---QASREGHCVI----FYENGL
2700 2710 2720 2730 2740 2750
2630 2640 2650 2660 2670 2680
pF1KA0 QVTYSLHLYSVNGKLRASLPLAEQPTALTVTED--FVLLGTAQCALHILQLNTL--LPAA
:.: :::::.:.. .. :. ...: ..: : . .. . :.. : : :
CCDS58 FCTFS-----VNGKLQATMETDDNIRAIQLSRDGQYLLTGGDRGVVVVRQVSDLKQLFAY
2760 2770 2780 2790 2800
2690 2700 2710 2720 2730 2740
pF1KA0 PPLPMKVAIRSVAVTKERSHVLVGLEDGKLIVVVAGQPSEVRSSQFARKLWRSSRRISQV
: ..::..:.. .. .. :. .:....
CCDS58 PGC--DAGIRAMALSYDQRCIISGMASGSIVLFYNDFNRWHHEYQTRY
2810 2820 2830 2840 2850
2750
pF1KA0 SSGETEYNPTEAR
>>CCDS3773.1 LRBA gene_id:987|Hs108|chr4 (2863 aa)
initn: 1504 init1: 459 opt: 1393 Z-score: 846.6 bits: 171.1 E(32554): 7.8e-41
Smith-Waterman score: 1626; 32.9% identity (59.9% similar) in 1092 aa overlap (1667-2713:1822-2847)
1640 1650 1660 1670 1680 1690
pF1KA0 SLESATDEAGSPLAAAAAAAAAERCSWLVPLVRTLLDRAYEPLGLQWGLPSLPPTNGSPT
: :::: . : .. : :: ..: .
CCDS37 SNMSITERLEHALEKAAPLLREIFVDFAPFLSRTLLGSHGQELLIE-GT-SLVCMKSSSS
1800 1810 1820 1830 1840
1700 1710 1720 1730 1740 1750
pF1KA0 FFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKSHDLMSGFWNACYDM-LMSSGQRR
: . .: . ::.. :.:.. .. .. . :. . . . . . .. : ::
CCDS37 VVELVMLLC-SQEWQNSIQKNAGLAFIELVNEGRLLSQTMKDHLVRVANEAEFILSRQRA
1850 1860 1870 1880 1890 1900
1760 1770 1780 1790 1800 1810
pF1KA0 QWERAQSRRAFQELVLEPAQRRARLEGLRYTAVLKQQATQHSMALLHWGALWRQLASPCG
: . . :. : . . . . : . . . .: : . :.. :
CCDS37 --EDIHRHAEFESLCAQYSADKREDEKMCDHLIRAAKYRDHVTATQLIQKIINILTDKHG
1910 1920 1930 1940 1950 1960
1820 1830 1840 1850 1860 1870
pF1KA0 AW--ALRDTPIPRWKLSSAETYSRMRLKLVPNHHFDPHLEASALRDNLGEVPLTPTEEAS
:: . . :. :.:. : : : ..: : . : ::. :. . .: . .: :
CCDS37 AWGNSAVSRPLEFWRLDYWEDDLRRRRRFVRNPLGSTHPEAT-LKTAVEHVCIFKLRENS
1970 1980 1990 2000 2010 2020
1880 1890 1900 1910 1920
pF1KA0 LPLAVTKEAKVSTPPELLQEDQLGEDELAELETPMEAAE-----LDEQR-EKLV----LS
.: : .. . .. . :: .. .: : .:. . .::. :.:. ::
CCDS37 ---KATDEDILAKGKQSIRSQALG-NQNSENEILLEGDDDTLSSVDEKDLENLAGPVSLS
2030 2040 2050 2060 2070 2080
1930 1940 1950 1960 1970
pF1KA0 AECQLVTVVAVVPGLLEVTTQNVYFY----DGSTERVETE-----EGIGYDFRRPLAQLR
. :::. .:: : : ::....:: : . .... . ::. . ....:
CCDS37 TPAQLVAPSVVVKGTLSVTSSELYFEVDEEDPNFKKIDPKILAYTEGLHGKWL--FTEIR
2090 2100 2110 2120 2130
1980 1990 2000 2010 2020 2030
pF1KA0 EVHLRRFNLRRSALELFFIDQANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQ
. ::. :. .:::.:. ... ..::: . . : . :: :
CCDS37 SIFSRRYLLQNTALEIFMANRVAVMFNFPDPATVKKVV--NYLPRVGVGT----------
2140 2150 2160 2170 2180
2040 2050 2060 2070 2080 2090
pF1KA0 VYSWLLRLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAGRTYNDLS
:. : :. .: ::.....::..::.: .:::::::::: :::::::.::::.
CCDS37 --SFGL----PQTRRISLASPRQLFKASNMTQRWQHREISNFEYLMFLNTIAGRSYNDLN
2190 2200 2210 2220 2230 2240
2100 2110 2120 2130 2140 2150
pF1KA0 QYPVFPWVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTIDKF
::::::::. .: : :::. :. :::::::::..:::.: . :.:::.:: . ::
CCDS37 QYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAAFFAERYESWEDD--QVPKF
2250 2260 2270 2280 2290
2160 2170 2180 2190 2200 2210
pF1KA0 HYGTHYSNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLESPADVKE
:::::::.:. :. .:.:.::::. ..::.:.:: .:: : :.. ::. .. .:.::
CCDS37 HYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSSISRAWRNSQRDTSDIKE
2300 2310 2320 2330 2340 2350
2220 2230 2240 2250 2260 2270
pF1KA0 LIPEFFYFPDFLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQALESEYVSA
:::::.:.:... : :...:: .. . :.:: :::::.. :.:.. .: :::::.::
CCDS37 LIPEFYYLPEMFVNFNNYNLGVMD-DGTVVSDVELPPWAKTSEEFVHINRLALESEFVSC
2360 2370 2380 2390 2400 2410
2280 2290 2300 2310 2320 2330
pF1KA0 HLHEWIDLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTP
.::.::::::::::.:: : .::::::: ::::::.:. .:: :.:.:. : .:::::
CCDS37 QLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDPVLREAVEAQIRSFGQTP
2420 2430 2440 2450 2460 2470
2340 2350 2360 2370 2380 2390
pF1KA0 CQLLKEPHPTRLSAEEAAHRLARLDTNSPSIFQHLDELKAFFAEVVSDGVPLVLALVPHR
::: :::: : :: .. :: .: . .... .. : : .. .
CCDS37 SQLLIEPHPPRGSAMQV----------SPLMFTDKAQQDVIMVLKFPSNSP-VTHVAANT
2480 2490 2500 2510 2520
2400 2410 2420 2430 2440
pF1KA0 QPHSFITQGSPDLLVTVSASGLLGTHSW--LPYDRNISN----YFSFSKDPTMGSHKT--
:: ..: . .::.:. :.....: :: .. . . :: ..:.
CCDS37 QPG----LATPAV-ITVTANRLFAVNKWHNLPAHQGAVQDQPYQLPVEIDPLIASNTGMH
2530 2540 2550 2560 2570 2580
2450 2460 2470 2480 2490 2500
pF1KA0 QRLLSGPWVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQLSCHLDVVT
.: .. . : .: .... :.. .. : :: :.:: . :.:.. . : ::::
CCDS37 RRQITDLLDQSIQVHSQCFVITSDNRYILVCGFWDKSFRVYSTDTGRLIQVVFGHWDVVT
2590 2600 2610 2620 2630 2640
2510 2520 2530 2540 2550
pF1KA0 CLALDTCGI----YLISGSRDTTCMVWRLLHQGGLS-VGLAP-----KPVQVLYGHGAAV
::: . : :..:::::.: ..: .: : .: : : .: :: :
CCDS37 CLARSESYIGGNCYILSGSRDATLLLWYW--NGKCSGIGDNPGSETAAPRAILTGHDYEV
2650 2660 2670 2680 2690 2700
2560 2570 2580 2590 2600 2610
pF1KA0 SCVAISTELDMAVSGSEDGTVIIHTVRRGQFVAALR-PLGATFPGPIFHLALGSEGQIVV
.:.:. .:: ...:::..: .::.. :... .:. : . : : . ::. :.
CCDS37 TCAAVCAELGLVLSGSQEGPCLIHSMN-GDLLRTLEGPENCLKPKLI---QASREGHCVI
2710 2720 2730 2740 2750
2620 2630 2640 2650 2660 2670
pF1KA0 QSSAWERPGAQVTYSLHLYSVNGKLRASLPLAEQPTALTVTED--FVLLGTAQCALHILQ
. . : :.: :::::.:.. .. :. ...: ..: : . .. . :
CCDS37 ----FYENGLFCTFS-----VNGKLQATMETDDNIRAIQLSRDGQYLLTGGDRGVVVVRQ
2760 2770 2780 2790 2800
2680 2690 2700 2710 2720 2730
pF1KA0 LNTL--LPAAPPLPMKVAIRSVAVTKERSHVLVGLEDGKLIVVVAGQPSEVRSSQFARKL
.. : : : : ..::..:.. .. .. :. .:....
CCDS37 VSDLKQLFAYPGC--DAGIRAMALSYDQRCIISGMASGSIVLFYNDFNRWHHEYQTRY
2810 2820 2830 2840 2850 2860
2740 2750
pF1KA0 WRSSRRISQVSSGETEYNPTEAR
>>CCDS55894.1 NBEA gene_id:26960|Hs108|chr13 (739 aa)
initn: 1384 init1: 488 opt: 1367 Z-score: 838.8 bits: 167.7 E(32554): 2.1e-40
Smith-Waterman score: 1544; 37.2% identity (65.8% similar) in 771 aa overlap (1970-2712:2-722)
1940 1950 1960 1970 1980 1990
pF1KA0 EVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQLREVHLRRFNLRRSALELFFIDQANYF
....: : ::. :. .:::.:. .... .
CCDS55 MFSEIRAVFSRRYLLQNTALEVFMANRTSVM
10 20 30
2000 2010 2020 2030 2040 2050
pF1KA0 LNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQVYSWLLRLRPPSQGYLSSRSPQEML
.::: .. . : . :: : :. : :. .: .:...
CCDS55 FNFPDQATVKKVVY--SLPRVGVGT------------SYGL----PQARRISLATPRQLY
40 50 60 70
2060 2070 2080 2090 2100 2110
pF1KA0 RASGLTQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFPWVLQDYVSPTLDLSNPAVF
..:..::.: .:::::::::: ::::::::::::.::::::::: .: : :::. :. :
CCDS55 KSSNMTQRWQRREISNFEYLMFLNTIAGRTYNDLNQYPVFPWVLTNYESEELDLTLPGNF
80 90 100 110 120 130
2120 2130 2140 2150 2160 2170
pF1KA0 RDLSKPIGVVNPKHAQLVREKYESFEDPAGTIDKFHYGTHYSNAAGVMHYLIRVEPFTSL
::::::::..:::.: . :.::..:: . .::.::::.:.... .:.:.::::..
CCDS55 RDLSKPIGALNPKRAVFYAERYETWEDDQS--PPYHYNTHYSTATSTLSWLVRIEPFTTF
140 150 160 170 180 190
2180 2190 2200 2210 2220 2230
pF1KA0 HVQLQSGRFDCSDRQFHSVAAAWQARLESPADVKELIPEFFYFPDFLENQNGFDLGCLQL
.. ..:.:: :: : ::: .:.. .. .:::::::::.:.:... :.::..:: ..
CCDS55 FLNANDGKFDHPDRTFSSVARSWRTSQRDTSDVKELIPEFYYLPEMFVNSNGYNLG-VRE
200 210 220 230 240 250
2240 2250 2260 2270 2280 2290
pF1KA0 TNEKVGDVVLPPWASSPEDFIQQHRQALESEYVSAHLHEWIDLIFGYKQRGPAAEEALNV
. :.:: :::::..::::.. .:.:::::.:: .::.::::::::::::: : .::::
CCDS55 DEVVVNDVDLPPWAKKPEDFVRINRMALESEFVSCQLHQWIDLIFGYKQRGPEAVRALNV
260 270 280 290 300 310
2300 2310 2320 2330 2340 2350
pF1KA0 FYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKEPHPTRLSAEEAAHRLARLD
:.: ::::.:.:: .:: :.:.:. :.:::::: ::: :::: : : : .: :
CCDS55 FHYLTYEGSVNLDSITDPVLREAMEAQIQNFGQTPSQLLIEPHPPRSS----AMHLCFLP
320 330 340 350 360
2360 2370 2380 2390 2400 2410
pF1KA0 TNSPSIFQHLDELKAFFAEVVSDGVPLVLALVPHRQPHSFITQGS-PDL----LVTVSAS
.:: .:. :... . : .:: . : .: . .. .. : : .:::. :
CCDS55 -QSPLMFK--DQMQ--------QDVIMVLKF-PSNSPVTHVAANTLPHLTIPAVVTVTCS
370 380 390 400 410
2420 2430 2440 2450 2460
pF1KA0 GLLGTHSW--------LP-YDRNISNYFSFSKDPTMGSHK--TQRLLSGPWVPGSGVSGQ
:.... : : :. . .... . :: ..... ..: .. . ....
CCDS55 RLFAVNRWHNTVGLRGAPGYSLDQAHHLPIEMDPLIANNSGVNKRQITDLVDQSIQINAH
420 430 440 450 460 470
2470 2480 2490 2500 2510
pF1KA0 ALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQLSCHLDVVTCLALDTCGI----YLIS
..:. :.. .. : :: :.:: . ::: . . : ::::::: . : :..:
CCDS55 CFVVTADNRYILICGFWDKSFRVYSTETGKLTQIVFGHWDVVTCLARSESYIGGDCYIVS
480 490 500 510 520 530
2520 2530 2540 2550 2560 2570
pF1KA0 GSRDTTCMVWRLL---HQGGLSVGLA--PKPVQVLYGHGAAVSCVAISTELDMAVSGSED
::::.: ..: : : . . . : : :: :: : ::.. .:: ...::...
CCDS55 GSRDATLLLWYWSGRHHIIGDNPNSSDYPAPRAVLTGHDHEVVCVSVCAELGLVISGAKE
540 550 560 570 580 590
2580 2590 2600 2610 2620 2630
pF1KA0 GTVIIHTVRRGQFVAALR-PLGATFPGPIFHLALGSEGQIVVQSSAWERPGAQVTYSLHL
: ..::. :... ::. : . :: : ...:::. .. .:: : .
CCDS55 GPCLVHTIT-GDLLRALEGPENCLFPRLI---SVSSEGHCIIY---YER-G-----RFSN
600 610 620 630 640
2640 2650 2660 2670 2680 2690
pF1KA0 YSVNGKLRASLPLAEQPTALTVTEDF--VLLGTAQCALHILQLNTLLPAAPPLPMKVAIR
.:.:::: :.. . .. :. .. : .. : . .... : . ..::
CCDS55 FSINGKLLAQMEINDSTRAILLSSDGQNLVTGGDNGVVEVWQACDFKQLYIYPGCDAGIR
650 660 670 680 690 700
2700 2710 2720 2730 2740 2750
pF1KA0 SVAVTKERSHVLVGLEDGKLIVVVAGQPSEVRSSQFARKLWRSSRRISQVSSGETEYNPT
.. ..... ...:. .:...
CCDS55 AMDLSHDQRTLITGMASGSIVAFNIDFNRWHYEHQNRY
710 720 730
>>CCDS45026.1 NBEA gene_id:26960|Hs108|chr13 (2946 aa)
initn: 1497 init1: 488 opt: 1367 Z-score: 830.8 bits: 168.3 E(32554): 5.9e-40
Smith-Waterman score: 1660; 32.5% identity (61.1% similar) in 1087 aa overlap (1667-2712:1910-2929)
1640 1650 1660 1670 1680 1690
pF1KA0 SLESATDEAGSPLAAAAAAAAAERCSWLVPLVRTLLDRAYEPLGLQWGLPSLPPTNGSPT
: :::: . : .. :: . ..: .
CCDS45 ENMSITAKLERALEKVAPLLREIFVDFAPFLSRTLLGSHGQELLIE-GLVCM---KSSTS
1880 1890 1900 1910 1920 1930
1700 1710 1720 1730 1740 1750
pF1KA0 FFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKSHDLMSGFWNACYDMLMSSGQRRQ
: . .: . ::.. :.:.. .. .. . : . . . . . . ...:
CCDS45 VVELVMLLC-SQEWQNSIQKNAGLAFIELINEGRLLCHAMKDHIVRVANEAEFILNRQRA
1940 1950 1960 1970 1980 1990
1760 1770 1780 1790 1800 1810
pF1KA0 WERAQSRRAFQELVLEPAQRRARLEGLRYTAVLKQQATQHSMALLHWGALWRQLASPCGA
: .... :. . : : . : . . . .: : . :.. ::
CCDS45 -EDVHKHAEFESQCAQYAADRREEEKMCDHLISAAKHRDHVTANQLKQKILNILTNKHGA
2000 2010 2020 2030 2040 2050
1820 1830 1840 1850 1860 1870
pF1KA0 W-ALRDTPIPR-WKLSSAETYSRMRLKLVPNHHFDPHLEA--SALRDNLGEVPLTPTEEA
: :. . . :.:. : : : ..: : . : :: .: . : .. ....
CCDS45 WGAVSHSQLHDFWRLDYWEDDLRRRRRFVRNAFGSTHAEALLKAAIEYGTEEDVVKSKKT
2060 2070 2080 2090 2100 2110
1880 1890 1900 1910 1920 1930
pF1KA0 SLPLAVTKEAKVSTPPELLQEDQLGEDELAELETPMEAAELDEQREKLVLSAECQLVTVV
:.... .. ::. : :.:. . : .. :.:. .:::. ::.. :
CCDS45 FRSQAIVNQ---NAETELMLE---GDDDAVSL---LQEKEIDNLAGPVVLSTPAQLIAPV
2120 2130 2140 2150 2160
1940 1950 1960 1970 1980
pF1KA0 AVVPGLLEVTTQNVYFY----DGSTERVETE-----EGIGYDFRRPLAQLREVHLRRFNL
.:. : : .:: ..:: :.. ....:. ::. . ....: : ::. :
CCDS45 VVAKGTLSITTTEIYFEVDEDDSAFKKIDTKVLAYTEGLHGKWM--FSEIRAVFSRRYLL
2170 2180 2190 2200 2210 2220
1990 2000 2010 2020 2030 2040
pF1KA0 RRSALELFFIDQANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQVYSWLLRLR
. .:::.:. .... ..::: .. . : . :: : :. :
CCDS45 QNTALEVFMANRTSVMFNFPDQATVKKVV--YSLPRVGVGT------------SYGL---
2230 2240 2250 2260
2050 2060 2070 2080 2090 2100
pF1KA0 PPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFPWVL
:. .: .:... ..:..::.: .:::::::::: ::::::::::::.:::::::::
CCDS45 -PQARRISLATPRQLYKSSNMTQRWQRREISNFEYLMFLNTIAGRTYNDLNQYPVFPWVL
2270 2280 2290 2300 2310 2320
2110 2120 2130 2140 2150 2160
pF1KA0 QDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTIDKFHYGTHYSNA
.: : :::. :. :::::::::..:::.: . :.::..:: . .::.::::.:
CCDS45 TNYESEELDLTLPGNFRDLSKPIGALNPKRAVFYAERYETWEDDQS--PPYHYNTHYSTA
2330 2340 2350 2360 2370 2380
2170 2180 2190 2200 2210 2220
pF1KA0 AGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLESPADVKELIPEFFYFP
.... .:.:.::::.. .. ..:.:: :: : ::: .:.. .. .:::::::::.:.:
CCDS45 TSTLSWLVRIEPFTTFFLNANDGKFDHPDRTFSSVARSWRTSQRDTSDVKELIPEFYYLP
2390 2400 2410 2420 2430 2440
2230 2240 2250 2260 2270 2280
pF1KA0 DFLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQALESEYVSAHLHEWIDLI
... :.::..:: .. . :.:: :::::..::::.. .:.:::::.:: .::.:::::
CCDS45 EMFVNSNGYNLG-VREDEVVVNDVDLPPWAKKPEDFVRINRMALESEFVSCQLHQWIDLI
2450 2460 2470 2480 2490 2500
2290 2300 2310 2320 2330 2340
pF1KA0 FGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKEPHP
:::::::: : .:::::.: ::::.:.:: .:: :.:.:. :.:::::: ::: ::::
CCDS45 FGYKQRGPEAVRALNVFHYLTYEGSVNLDSITDPVLREAMEAQIQNFGQTPSQLLIEPHP
2510 2520 2530 2540 2550 2560
2350 2360 2370 2380 2390 2400
pF1KA0 TRLSAEEAAHRLARLDTNSPSIFQHLDELKAFFAEVVSDGVPLVLALVPHRQPHSFITQG
: : : .: : .:: .:. :... . : .:: . : .: . .. .
CCDS45 PRSS----AMHLCFLP-QSPLMFK--DQMQ--------QDVIMVLKF-PSNSPVTHVAAN
2570 2580 2590 2600
2410 2420 2430 2440
pF1KA0 S-PDL----LVTVSASGLLGTHSW--------LP-YDRNISNYFSFSKDPTMGSHK--TQ
. : : .:::. : :.... : : :. . .... . :: ..... ..
CCDS45 TLPHLTIPAVVTVTCSRLFAVNRWHNTVGLRGAPGYSLDQAHHLPIEMDPLIANNSGVNK
2610 2620 2630 2640 2650 2660
2450 2460 2470 2480 2490 2500
pF1KA0 RLLSGPWVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQLSCHLDVVTC
: .. . .... ..:. :.. .. : :: :.:: . ::: . . : :::::
CCDS45 RQITDLVDQSIQINAHCFVVTADNRYILICGFWDKSFRVYSTETGKLTQIVFGHWDVVTC
2670 2680 2690 2700 2710 2720
2510 2520 2530 2540 2550
pF1KA0 LALDTCGI----YLISGSRDTTCMVWRLL---HQGGLSVGLA--PKPVQVLYGHGAAVSC
:: . : :..:::::.: ..: : : . . . : : :: :: : :
CCDS45 LARSESYIGGDCYIVSGSRDATLLLWYWSGRHHIIGDNPNSSDYPAPRAVLTGHDHEVVC
2730 2740 2750 2760 2770 2780
2560 2570 2580 2590 2600 2610
pF1KA0 VAISTELDMAVSGSEDGTVIIHTVRRGQFVAALR-PLGATFPGPIFHLALGSEGQIVVQS
:.. .:: ...::...: ..::. :... ::. : . :: : ...:::. ..
CCDS45 VSVCAELGLVISGAKEGPCLVHTIT-GDLLRALEGPENCLFPRLI---SVSSEGHCIIY-
2790 2800 2810 2820 2830 2840
2620 2630 2640 2650 2660 2670
pF1KA0 SAWERPGAQVTYSLHLYSVNGKLRASLPLAEQPTALTVTEDF--VLLGTAQCALHILQLN
.:: . .:.:::: :.. . .. :. .. : .. : . .... :
CCDS45 --YERG------RFSNFSINGKLLAQMEINDSTRAILLSSDGQNLVTGGDNGVVEVWQAC
2850 2860 2870 2880 2890
2680 2690 2700 2710 2720 2730
pF1KA0 TLLPAAPPLPMKVAIRSVAVTKERSHVLVGLEDGKLIVVVAGQPSEVRSSQFARKLWRSS
. ..::.. ..... ...:. .:...
CCDS45 DFKQLYIYPGCDAGIRAMDLSHDQRTLITGMASGSIVAFNIDFNRWHYEHQNRY
2900 2910 2920 2930 2940
2740 2750
pF1KA0 RRISQVSSGETEYNPTEAR
>>CCDS3609.1 WDFY3 gene_id:23001|Hs108|chr4 (3526 aa)
initn: 773 init1: 599 opt: 1231 Z-score: 747.7 bits: 153.1 E(32554): 2.5e-35
Smith-Waterman score: 1340; 36.2% identity (60.6% similar) in 766 aa overlap (1889-2588:2503-3216)
1860 1870 1880 1890 1900 1910
pF1KA0 DNLGEVPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLGEDELAELETPMEAA---ELDE
: :: ::..: : : . : .: :
CCDS36 EDTIAKVKGLVKPPLKRSRSAPDGGDEENQEQLQ-DQIAEGSSIEEEEKTDNATLLRLLE
2480 2490 2500 2510 2520 2530
1920 1930 1940 1950 1960 1970
pF1KA0 QREKLVLSAECQLVTVVAVVPGLLEVTTQNVYFYDG----STERVETEEGIGYDFRRPL-
. ::. .: : . . ::: .. : :: .:.... : . ....:.
CCDS36 EGEKIQHMYRCARVQGLDTSEGLLLFGKEHFYVIDGFTMTATREIRDIETLPPNMHEPII
2540 2550 2560 2570 2580 2590
1980 1990 2000 2010
pF1KA0 --------AQLR------------EVHLRRFNLRRSALELFFIDQANYFLNFPCKVGTTP
.::. ::: ::. :. :.:.: : ::.: :
CCDS36 PRGARQGPSQLKRTCSIFAYEDIKEVHKRRYLLQPIAVEVFSGDGRNYLLAF--------
2600 2610 2620 2630 2640
2020 2030 2040 2050 2060
pF1KA0 VSSPSQTPRPQPGPIPPHTQVRNQVYSWLLRLRPP---SQGYLSSRSPQEML-RASGL--
: : .::.::. .: . : :. .:.. :. . ..:::
CCDS36 ----------QKG-------IRNKVYQRFLAVVPSLTDSSESVSGQRPNTSVEQGSGLLS
2650 2660 2670 2680
2070 2080 2090 2100 2110
pF1KA0 --------TQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFPWVLQDYVSPTLDLSNP
::.: . :::::.:::.:::.:::.:::: :::::::.: :: : .::.::
CCDS36 TLVGEKSVTQRWERGEISNFQYLMHLNTLAGRSYNDLMQYPVFPWILADYDSEEVDLTNP
2690 2700 2710 2720 2730 2740
2120 2130 2140 2150 2160 2170
pF1KA0 AVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTIDKFHYGTHYSNAAGVMHYLIRVEPF
.::.:.::.:. . .. ...:...::: : .:::::::.: : ::.:.:::
CCDS36 KTFRNLAKPMGAQTDERLAQYKKRYKDWEDPNGETPAYHYGTHYSSAMIVASYLVRMEPF
2750 2760 2770 2780 2790 2800
2180 2190 2200 2210 2220 2230
pF1KA0 TSLHVQLQSGRFDCSDRQFHSVAAAW-QARLESPADVKELIPEFFYFPDFLENQNGFDLG
:.. ..::.:.:: .::.:::: :: .: .. ::::::::::::.:.:: :.:.::::
CCDS36 TQIFLRLQGGHFDLADRMFHSVREAWYSASKHNMADVKELIPEFFYLPEFLFNSNNFDLG
2810 2820 2830 2840 2850 2860
2240 2250 2260 2270 2280 2290
pF1KA0 CLQLTNEKVGDVVLPPWASS-PEDFIQQHRQALESEYVSAHLHEWIDLIFGYKQRGPAAE
: : .. :.:::.:::::.. :..::. ::.::: .::::::::::::::::::.::::
CCDS36 CKQ-NGTKLGDVILPPWAKGDPREFIRVHREALECDYVSAHLHEWIDLIFGYKQQGPAAV
2870 2880 2890 2900 2910 2920
2300 2310 2320 2330 2340
pF1KA0 EALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKEPHP-----TRLSAE
::.:::.. ::: ::. ...: .. : :.:.:::: : ::.:.::: .::...
CCDS36 EAVNVFHHLFYEGQVDIYNINDPLKETATIGFINNFGQIPKQLFKKPHPPKRVRSRLNGD
2930 2940 2950 2960 2970 2980
2350 2360 2370 2380 2390 2400
pF1KA0 EAAHRLARLDTNSPSIFQHLDELKAFFAEVVSDGVPLVLALVPHRQPHSFITQGSPDLLV
.:. . .:.. .:.:::.:. : . . ..: . :. . .:.
CCDS36 NAGISVLPGSTSDKIFFHHLDNLR-----------PSLTPVKELKEPVGQIVCTDKGILA
2990 3000 3010 3020 3030
2410 2420 2430 2440 2450 2460
pF1KA0 TVSASGLLGTHSWLPYDRNIS-NYFSFSKDPTMGSHKTQRLLS-----GPWVPGSGVSGQ
: . .: .: ..... .: ..: .:...... .. . : ::
CCDS36 -VEQNKVLIPPTW---NKTFAWGYADLSC--RLGTYESDKAMTVYECLSEW-------GQ
3040 3050 3060 3070 3080
2470 2480 2490 2500 2510
pF1KA0 AL-AVAPDGKLLFSGGH------WDGSLRVTALPRGKLLSQLSCHLDVVTCLALDTCGIY
: :. :. ::...:: :. . : . : : :.::: . .
CCDS36 ILCAICPNPKLVITGGTSTVVCVWEMGTSKEKAKTVTLKQALLGHTDTVTCATASLAYHI
3090 3100 3110 3120 3130 3140
2520 2530 2540 2550 2560 2570
pF1KA0 LISGSRDTTCMVWRLLHQGGLSVGLAPK-PVQVLYGH---GAAVSCVAISTELDMAVSGS
..::::: ::..: : . . :. . . ::..: . : :::.. .. ...:.
CCDS36 IVSGSRDRTCIIWDLNKLSFLTQLRGHRAPVSALCINELTGDIVSCAGTYIHV-WSINGN
3150 3160 3170 3180 3190 3200
2580 2590 2600 2610 2620 2630
pF1KA0 EDGTVIIHTVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQSSAWERPGAQVTYSLH
.: : : :..
CCDS36 PIVSVNTFTGRSQQIICCCMSEMNEWDTQNVIVTGHSDGVVRFWRMEFLQVPETPAPEPA
3210 3220 3230 3240 3250 3260
>>CCDS44385.1 WDFY4 gene_id:57705|Hs108|chr10 (3184 aa)
initn: 940 init1: 477 opt: 1151 Z-score: 700.1 bits: 144.2 E(32554): 1.1e-32
Smith-Waterman score: 1225; 25.7% identity (51.5% similar) in 2091 aa overlap (793-2711:1224-3177)
770 780 790 800 810 820
pF1KA0 STGLGWGSGLVAPLQEGSIDSTLAGTQDTRWGSPTSLEGELGAVAIFHEALQATALRTLC
: . .:: .:: . .:.::.. .:...
CCDS44 LYIQALPGPFLSMDPSAFVDVYGYIATPRVWKQKSSLIWRLGPTYLFEEAISMETLEVIN
1200 1210 1220 1230 1240 1250
830 840 850 860
pF1KA0 TLGPNETAPFKP---EGE---------LHELSTRLLLHYSPQACKNNICLDLSPSHG-LD
::: . :. .:: . : . . :: . .. . :. ... .:
CCDS44 KLGPRYCGNFQAVHVQGEDLDSEATPFVAEERVSFGLHIASSSITS--VADIRNAYNEVD
1260 1270 1280 1290 1300 1310
870 880 890 900 910 920
pF1KA0 GRLTGH------RVETWDVKDVVNCVGGMGALLPLLERVAAQPKEAEAGPAETHDLVGPE
.:: .. : .. : . ::.: ... : . ::. .. : :. .:
CCDS44 SRLIAKEMNISSRDNAMPVFLLRNCAGHLSGSLRTIGAVAV----GQLGVRVFHS--SPA
1320 1330 1340 1350 1360
930 940 950 960 970 980
pF1KA0 LTSGHNTQGLVLPLGKSSEERMERNAVAAFLLMLRNFLQGHMVNQESLVQCQGPAIIGAL
.: : .. :: : ... :: . .:.. : .. . . . . : :.. :
CCDS44 ASSLDFIGGPAILLGLISLATDDHTMYAA-VKVLHSVLTSNAMCDFLMQHICGYQIMAFL
1370 1380 1390 1400 1410 1420
990 1000 1010 1020 1030
pF1KA0 LRKVPS------WAMDMNVLMSAQLLMEQVAAEGSGPLLYLLYQHLLFNFHLWTLSDFAV
::: : . . ..: ...: ... : ..: ..::.: ::.:: . .
CCDS44 LRKKASLLNHRIFQLILSVAGTVELGFRSSAITNTG-----VFQHILCNFELWMNTADNL
1430 1440 1450 1460 1470
1040 1050 1060 1070 1080
pF1KA0 RLGHIQYMSSIVREHRQKLRKK---YGVQFI--LDALRTHYS--PQRERPLA---ADDLR
.:. .... :.. :. :. . .:.: : : .. : :.. . : .::
CCDS44 ELSLFSHLLEILQSPREGPRNAEAAHQAQLIPKLIFLFNEPSLIPSKISTIIGILACQLR
1480 1490 1500 1510 1520 1530
1090 1100 1110 1120 1130
pF1KA0 ---TVQTSL-LGLAREFLVRSLSADDVQVTQTML------SFLAATGDDGQAV----GAL
..: : .:: :.: .:. ..:. : . :. :.. .:... :
CCDS44 GHFSTQDLLRIGL---FVVYTLKPSSVNERQICMDGALDPSLPAGSQTSGKTIWLRNQLL
1540 1550 1560 1570 1580 1590
1140 1150 1160 1170 1180
pF1KA0 DLLLALLHGS---LVQESLAVFLLEPGNLEVLLALLVR-PGSLPLLPDRVCKILRRLQQN
..::... . : .:: ..:. : :: : . .: .: . :.: . .
CCDS44 EMLLSVISSPQLHLSSESKEEMFLKLGPDWFLLLLQGHLHASTTVL---ALKLLLYFLAS
1600 1610 1620 1630 1640 1650
1190 1200 1210 1220 1230
pF1KA0 ERLPERSRQRL---RLRECGLQGLVACL-------PEGTVSPQLCQGLYKL--FLGADCL
: : :. : : . .:. . : :: : :. : :: : .
CCDS44 PSLRTRFRDGLCAGSWVERSTEGVDIVMDNLKSQSPLPEQSPCLLPGFRVLNDFL-AHHV
1660 1670 1680 1690 1700 1710
1240 1250 1260 1270 1280
pF1KA0 NLSDLLAVVQ-LSLQADLSV-------RLDICRQLFHLIYGQPDVVRLLARQAGW--QDV
.. .. .:. . ::. :. :: : . . : .:. ::: . .
CCDS44 HIPEVYLIVSTFFLQTPLTELMDGPKDSLDAMLQWLLQRHHQEEVL-----QAGLCTEGA
1720 1730 1740 1750 1760
1290 1300 1310 1320 1330 1340
pF1KA0 LTRLYVLEAATAGSPPPSSPE---SPTSPKPAPPKPPTESPAEPSDVFLPS-EAPCPDPD
: : .:.: : ..: .: . . : : . . :.: :. .::
CCDS44 LLLLEMLKA-TMSQPLAGSEDGAWAQTFPASVLQFLSLVHRTYPQD---PAWRAPE----
1770 1780 1790 1800 1810
1350 1360 1370 1380 1390 1400
pF1KA0 GFYHALSPFCTPFDLGLERSSVGSGNTAGGGGSSGTLTPASQPGTPSPLDGPR-PFPAAP
: ..:. . : :: ... ::. .: .: .: . : ..: . : : :
CCDS44 -FLQTLA--IAAFPLGAQKG-VGAEST------RNTSSPEAAAEGDSTVEGLQAPTKAHP
1820 1830 1840 1850 1860
1410 1420 1430 1440 1450
pF1KA0 GRHSSS------LSNVLEDGSLPEPTISGDDTSNTSNPQQTSEEELCNLLTNVLFSVT--
.:.. : ..: .: :. . . ..: :.... .. .. ..::.:.
CCDS44 ARRKLREFTQLLLRELLLGASSPKQWLPLEVLLEAS-PDHATSQQKRDFQSEVLLSAMEL
1870 1880 1890 1900 1910 1920
1460 1470 1480 1490 1500
pF1KA0 WRGVEGSDEAAWRERGQVFSVLTQLGASATLVRPPDCIKRSLLEMM---LESA-----LT
.. . :.: : .:. :. . .. .:. .:. .:. ..:.: . . :: :
CCDS44 FHMTSGGDAAMFRD-GKEPQPSAEAAAAPSLANI-SCFTQKLVEKLYSGMFSADPRHILL
1930 1940 1950 1960 1970 1980
1510 1520 1530 1540 1550 1560
pF1KA0 DIKEAPVGVLASLTQQALWLLRLLQDFL------CAEGHGNQELWSEKLFEGVCSLLDRL
: : . :. . ..: .: : . : : :. :: : :. :.: :
CCDS44 FILEHIMVVIETASSQRDTVLSTLYSSLNKVILYCLSKP--QQSLSECL--GLLSILGFL
1990 2000 2010 2020 2030 2040
1570 1580 1590 1600 1610 1620
pF1KA0 GAWPHLANGTADLREMAQIGLRLVLGYILLEDPQLHAQAYVRLHMLLQTAVPARREEACY
.. .: . ..:.. : : . :: :. ..: . : :
CCDS44 QEHWDVVFATYN----SNISFLLCLMHCLL---LLNERSYPEGFGL--EPKPRMSTYHQV
2050 2060 2070 2080 2090
1630 1640 1650 1660 1670 1680
pF1KA0 VLSKLEAALGRVLNTSSLESATDEAGSPLAAAAAAAAAERCSWLVPLVRTLLDRAYEPLG
:: : . . . :: .. . . . . .:.: .:: : :.
CCDS44 FLSPNEDVKEKREDLPSLSDVQHNIQKTVQTLWQQLVAQRQ-------QTLEDAFKIDLS
2100 2110 2120 2130 2140
1690 1700 1710 1720 1730 1740
pF1KA0 LQWGLPSLPPTNGSPTFFEDFQAFCATPEWRHFIDKQVQPTMSQFEMDTYAKSHDLMSGF
.. : . . .: . : . :.:.. .. . :. .. .: .
CCDS44 VKPGEREVKIEEVTPLWEETM-----LKAWQHYLASEKKSLASRSNV-----AHHSKVTL
2150 2160 2170 2180 2190
1750 1760 1770 1780 1790
pF1KA0 WNACYDMLMSSGQRRQWERAQSRRAFQELVLEPAQRRAR-LEGLRYTAVLKQQATQHSMA
:.. . :. :: . . . .: .::.. : . : .... . :
CCDS44 WSGSLSSAMKLMPGRQAKDPECKTEDFVSCIENYRRRGQELYASLYKDHVQRRKCGNIKA
2200 2210 2220 2230 2240 2250
1800 1810 1820 1830 1840 1850
pF1KA0 LLHWGALWRQLASPCGAWALRDT--PIPRWKLSSAETYSRMRLK---LVPNHHFDP--HL
:. . .:: . : :. . : :.:. : .::: . : : . .. :
CCDS44 ANAWARIQEQLFGELGLWSQGEETKPCSPWELDWREGPARMRKRIKRLSPLEALSSGRHK
2260 2270 2280 2290 2300 2310
1860 1870 1880 1890 1900
pF1KA0 EASALRDNLGEVPLTPTEEASLPLAVTKEAKVSTP-PEL-----LQEDQLGEDELAELET
:.. :..... .: .: : . .:.. .: :.:. .:: : ::
CCDS44 ESQDKNDHISQTNAENQDELTLREAEGEPDEVGVDCTQLTFFPALHESLHSEDFL-ELCR
2320 2330 2340 2350 2360 2370
1910 1920 1930 1940 1950 1960
pF1KA0 PMEAAELDEQREKLVLSAECQLVTVVA--VVPGLLEVTTQNVY----FYDGSTERVETEE
.. :.: .: .. . .:: : . : :.: :. : : . : : .
CCDS44 ERQVI-LQELLDKEKVTQKFSLVIVQGHLVSEGVLLFGHQHFYICENFTLSPTGDVYCTR
2380 2390 2400 2410 2420 2430
1970 1980 1990
pF1KA0 GIGYDFRRPL---------------------AQLREVHLRRFNLRRSALELFFIDQANYF
.. :. :..::.. :: :. :::.:: . . :
CCDS44 HCLSNISDPFIFNLCSKDRSTDHYSCQCHSYADMRELRQARFLLQDIALEIFFHNGYSKF
2440 2450 2460 2470 2480 2490
2000 2010 2020 2030 2040 2050
pF1KA0 LNFPCKVGTTPVSSPSQTPRPQPGPIPPHTQVRNQVYSWLLRLRPPSQGYLSSRSPQEML
: : ... :..... . ..: .: .:.. .
CCDS44 LVF-------------------------YNNDRSKAFKSFCSFQPSLKGKATSEDTLSLR
2500 2510 2520
2060 2070 2080 2090 2100 2110
pF1KA0 RASG----LTQKWVQREISNFEYLMQLNTIAGRTYNDLSQYPVFPWVLQDYVSPTLDLSN
: : . ::: .:.:::::::: ::: :::: :: ::::::::: ::.: ::.:.:
CCDS44 RYPGSDRIMLQKWQKRDISNFEYLMYLNTAAGRTCNDYMQYPVFPWVLADYTSETLNLAN
2530 2540 2550 2560 2570 2580
2120 2130 2140 2150 2160 2170
pF1KA0 PAVFRDLSKPIGVVNPKHAQLVREKYESFEDPAGTID-KFHYGTHYSNAAGVMHYLIRVE
: .:::::::.:. . .. .... : : . . :: ::::.: : ::.:.
CCDS44 PKIFRDLSKPMGAQTKERKLKFIQRFKEVEKTEGDMTVQCHYYTHYSSAIIVASYLVRMP
2590 2600 2610 2620 2630 2640
2180 2190 2200 2210 2220 2230
pF1KA0 PFTSLHVQLQSGRFDCSDRQFHSVAAAWQ-ARLESPADVKELIPEFFYFPDFLENQNGFD
:::. ::.: :: .::.:::: ..:. : :. .::.:: :::::.:.:: : :: .
CCDS44 PFTQAFCALQGGSFDVADRMFHSVKSTWESASRENMSDVRELTPEFFYLPEFLTNCNGVE
2650 2660 2670 2680 2690 2700
2240 2250 2260 2270 2280 2290
pF1KA0 LGCLQLTNEKVGDVVLPPWASS-PEDFIQQHRQALESEYVSAHLHEWIDLIFGYKQRGPA
.::.: . .::: :::::.. :. ::. ::.::::..:::.::.::::::::::.:::
CCDS44 FGCMQ-DGTVLGDVQLPPWADGDPRKFISLHRKALESDFVSANLHHWIDLIFGYKQQGPA
2710 2720 2730 2740 2750 2760
2300 2310 2320 2330 2340 2350
pF1KA0 AEEALNVFYYCTYEGAVDLDHVTDERERKALEGIISNFGQTPCQLLKEPHPTRLSAEEAA
: .:.:.:. : .::. .:: .... :..:::::.: ::. .:::.: .: .
CCDS44 AVDAVNIFHPYFYGDRMDLSSITDPLIKSTILGFVSNFGQVPKQLFTKPHPARTAAGKP-
2770 2780 2790 2800 2810 2820
2360 2370 2380 2390 2400
pF1KA0 HRLARLDTNSP--------SIFQHLDELKAFFAEV-VSDGVPLVLALVPHRQPHSFITQ-
: :...: .: :. :. ..: :.: . : . ..:.. : .
CCDS44 --LPGKDVSTPVSLPGHPQPFFYSLQSLRP--SQVTVKD---MYLFSLGSESPKGAIGHI
2830 2840 2850 2860 2870 2880
2410 2420 2430 2440 2450 2460
pF1KA0 -GSPDLLVTVSASGLLGTHSWLPYDRNISNYFS-FSKDPTMGSHKTQRLLSGPWVPGSGV
.. ...: . .: : .:..: :. :: .::. ....: . ..
CCDS44 VSTEKTILAVERNKVLLPPLW---NRTFSWGFDDFSC--CLGSYGSDKVLMT--FENLAA
2890 2900 2910 2920 2930
2470 2480 2490 2500 2510
pF1KA0 SGQAL-AVAPDGKLLFSGGH------WDGSLRVTALPRGKLLSQ-LSCHLDVVTCLALDT
:. : :: :. . ..: :. :. . . ::: : : : : ..::::: ..
CCDS44 WGRCLCAVCPSPTTIVTSGTSTVVCVWELSM-TKGRPRGLRLRQALYGHTQAVTCLAASV
2940 2950 2960 2970 2980 2990
2520 2530 2540 2550 2560 2570
pF1KA0 CGIYLISGSRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVSCVAISTELDMAVS--
:.:::.: ::..: : : :. : : .: ..: ..:: ::
CCDS44 TFSLLVSGSQDCTCILWDLDH---LT------HVTRLPAHREGISAITISDVSGTIVSCA
3000 3010 3020 3030 3040
2580 2590 2600 2610 2620 2630
pF1KA0 GSEDGTVIIHTVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQSSAWERPGAQVTYS
:.. . .. .....: : :: ... . .::.. .: . : .
CCDS44 GAHLSLWNVNGQPLASITTAWGPEGAITCCCLMEGPAWDTSQIIITGSQDGMVRVWKTED
3050 3060 3070 3080 3090 3100
2640 2650 2660 2670 2680 2690
pF1KA0 LHLYSVNGKLRASLPLAEQPTALTVTEDFVLLGTAQCALHILQLNTLLPAAPPLPMKVAI
... :: :. . : :. :. . : . . :... : . : . :.
CCDS44 VKM-SVPGRPAGEEPPAQPPSPRGHKWEKNLALSRE-----LDVSIALTGKPS-KTSPAV
3110 3120 3130 3140 3150
2700 2710 2720 2730 2740 2750
pF1KA0 RSVAVTKERSHVLVGLEDGKLIVVVAGQPSEVRSSQFARKLWRSSRRISQVSSGETEYNP
..::.......::: : :..
CCDS44 TALAVSRNHTKLLVGDERGRIFCWSADG
3160 3170 3180
>>CCDS6173.1 NSMAF gene_id:8439|Hs108|chr8 (917 aa)
initn: 990 init1: 536 opt: 955 Z-score: 589.0 bits: 121.8 E(32554): 1.7e-26
Smith-Waterman score: 1048; 32.6% identity (57.5% similar) in 711 aa overlap (1894-2579:160-789)
1870 1880 1890 1900 1910
pF1KA0 VPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLGEDE---LAELETPMEAAELDEQR---
:.::.. : :.. . . .:..:
CCDS61 KMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQN
130 140 150 160 170 180
1920 1930 1940 1950 1960 1970
pF1KA0 --EKLVLSAECQLVTVVAVVPGLLEVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQL--
::: . . ..:: ... :: . .: :.:: . :: .:..:.
CCDS61 ISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLN----------GYP--KPVVQITL
190 200 210 220 230
1980 1990 2000 2010 2020
pF1KA0 ---REVHLRRFNLRRSALELFFIDQ---ANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPP
:... :: .: .::.: .. .. .:.: .::
CCDS61 QDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFY---------------EPQD-----
240 250 260 270
2030 2040 2050 2060 2070 2080
pF1KA0 HTQVRNQVYSWLLRLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAG
:...: .. :: . .. : . .: . ..::..::..::..:
CCDS61 ----RDDLYFYIAT-------YLEHHVAEHT--AESYMLQWQRGHLSNYQYLLHLNNLAD
280 290 300 310 320
2090 2100 2110 2120 2130 2140
pF1KA0 RTYNDLSQYPVFPWVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDP
:. :::::::::::...:: : ::::::..:::::::.:..: .. . . .:. . .:
CCDS61 RSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEP
330 340 350 360 370 380
2150 2160 2170 2180 2190 2200
pF1KA0 AGTIDKFHYGTHYSNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLE
:: ::.:::. . :. ::.:. : . ::.:::: .::.:.:.: .:. :.
CCDS61 -----KFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNSIAETWKNCLD
390 400 410 420 430
2210 2220 2230 2240 2250 2260
pF1KA0 SPADVKELIPEFFYFPD--FLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQ
. .: ::::::: : : :: :. .::: : .. : :: :::::::::::.:. ..
CCDS61 GATDFKELIPEF-YGDDVSFLVNSLKLDLGKRQ-GGQMVDDVELPPWASSPEDFLQKSKD
440 450 460 470 480 490
2270 2280 2290 2300 2310 2320
pF1KA0 ALESEYVSAHLHEWIDLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEG
::::.::: ::::::::::::::.: : : :::. ::::.:::. . : :. :.
CCDS61 ALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLT
500 510 520 530 540 550
2330 2340 2350 2360 2370
pF1KA0 IISNFGQTPCQLLKEPHPTRLS------AEEAAHRLARLDTNSPSIFQHLDELKAFFAEV
: .::::: ::. ::: :.. .. ... . :. . :. : : . .:
CCDS61 QILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAW-
560 570 580 590 600 610
2380 2390 2400 2410 2420 2430
pF1KA0 VSDGVPLVLALVPHRQPHSFITQGSPDLLVTVSASGLLGTHSWLPYDRNISNYFSFSKDP
... : : : . :. . : .::: :: :. :. :.:
CCDS61 --NNITK-LQLHEHYKIHKEAVTG-----ITVS--------------RNGSSVFTTSQDS
620 630 640 650
2440 2450 2460 2470 2480 2490
pF1KA0 TMGSH-KTQRLLSGPWVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQL
:. : ...:. .. . .. : . :. .. :. ::... .. :. . :
CCDS61 TLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSS--WDNNVYFYSIAFGRRQDTL
660 670 680 690 700 710
2500 2510 2520 2530 2540 2550
pF1KA0 SCHLDVVTCLALDTCGIYLISGSRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVSC
: :.:. . .: :.: :.: :: . .. . . : ..:.
CCDS61 MGHDDAVSKICWHDNRLY--SASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVDT
720 730 740 750 760
2560 2570 2580 2590 2600 2610
pF1KA0 VAISTELDMAVSGSEDGTVIIHTVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQSS
..... . :::...::: :
CCDS61 ISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDGC
770 780 790 800 810 820
>>CCDS47864.1 NSMAF gene_id:8439|Hs108|chr8 (948 aa)
initn: 990 init1: 536 opt: 955 Z-score: 588.8 bits: 121.9 E(32554): 1.8e-26
Smith-Waterman score: 1048; 32.6% identity (57.5% similar) in 711 aa overlap (1894-2579:191-820)
1870 1880 1890 1900 1910
pF1KA0 VPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLGEDE---LAELETPMEAAELDEQR---
:.::.. : :.. . . .:..:
CCDS47 KMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQN
170 180 190 200 210 220
1920 1930 1940 1950 1960 1970
pF1KA0 --EKLVLSAECQLVTVVAVVPGLLEVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQL--
::: . . ..:: ... :: . .: :.:: . :: .:..:.
CCDS47 ISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLN----------GYP--KPVVQITL
230 240 250 260
1980 1990 2000 2010 2020
pF1KA0 ---REVHLRRFNLRRSALELFFIDQ---ANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPP
:... :: .: .::.: .. .. .:.: .::
CCDS47 QDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFY---------------EPQD-----
270 280 290 300
2030 2040 2050 2060 2070 2080
pF1KA0 HTQVRNQVYSWLLRLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAG
:...: .. :: . .. : . .: . ..::..::..::..:
CCDS47 ----RDDLYFYIAT-------YLEHHVAEHT--AESYMLQWQRGHLSNYQYLLHLNNLAD
310 320 330 340 350
2090 2100 2110 2120 2130 2140
pF1KA0 RTYNDLSQYPVFPWVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDP
:. :::::::::::...:: : ::::::..:::::::.:..: .. . . .:. . .:
CCDS47 RSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEP
360 370 380 390 400 410
2150 2160 2170 2180 2190 2200
pF1KA0 AGTIDKFHYGTHYSNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLE
:: ::.:::. . :. ::.:. : . ::.:::: .::.:.:.: .:. :.
CCDS47 -----KFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNSIAETWKNCLD
420 430 440 450 460
2210 2220 2230 2240 2250 2260
pF1KA0 SPADVKELIPEFFYFPD--FLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQ
. .: ::::::: : : :: :. .::: : .. : :: :::::::::::.:. ..
CCDS47 GATDFKELIPEF-YGDDVSFLVNSLKLDLGKRQ-GGQMVDDVELPPWASSPEDFLQKSKD
470 480 490 500 510 520
2270 2280 2290 2300 2310 2320
pF1KA0 ALESEYVSAHLHEWIDLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEG
::::.::: ::::::::::::::.: : : :::. ::::.:::. . : :. :.
CCDS47 ALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLT
530 540 550 560 570 580
2330 2340 2350 2360 2370
pF1KA0 IISNFGQTPCQLLKEPHPTRLS------AEEAAHRLARLDTNSPSIFQHLDELKAFFAEV
: .::::: ::. ::: :.. .. ... . :. . :. : : . .:
CCDS47 QILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAW-
590 600 610 620 630 640
2380 2390 2400 2410 2420 2430
pF1KA0 VSDGVPLVLALVPHRQPHSFITQGSPDLLVTVSASGLLGTHSWLPYDRNISNYFSFSKDP
... : : : . :. . : .::: :: :. :. :.:
CCDS47 --NNITK-LQLHEHYKIHKEAVTG-----ITVS--------------RNGSSVFTTSQDS
650 660 670 680
2440 2450 2460 2470 2480 2490
pF1KA0 TMGSH-KTQRLLSGPWVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQL
:. : ...:. .. . .. : . :. .. :. ::... .. :. . :
CCDS47 TLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSS--WDNNVYFYSIAFGRRQDTL
690 700 710 720 730 740
2500 2510 2520 2530 2540 2550
pF1KA0 SCHLDVVTCLALDTCGIYLISGSRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVSC
: :.:. . .: :.: :.: :: . .. . . : ..:.
CCDS47 MGHDDAVSKICWHDNRLY--SASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVDT
750 760 770 780 790
2560 2570 2580 2590 2600 2610
pF1KA0 VAISTELDMAVSGSEDGTVIIHTVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQSS
..... . :::...::: :
CCDS47 ISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDGC
800 810 820 830 840 850
2754 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 19:45:14 2016 done: Thu Nov 3 19:45:15 2016
Total Scan time: 7.710 Total Display time: 1.560
Function used was FASTA [36.3.4 Apr, 2011]