FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2267, 948 aa
1>>>pF1KE2267 948 - 948 aa - 948 aa
Library: human.CCDS.faa
18921897 residues in 33420 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9081+/-0.00117; mu= 13.3369+/- 0.069
mean_var=129.3732+/-27.017, 0's: 0 Z-trim(104.2): 151 B-trim: 54 in 1/50
Lambda= 0.112759
statistics sampled from 7708 (7883) to 7708 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.596), E-opt: 0.2 (0.236), width: 16
Scan time: 2.110
The best scores are: opt bits E(33420)
CCDS47864.1 NSMAF gene_id:8439|Hs109|chr8 ( 948) 6429 1058.7 0
CCDS6173.1 NSMAF gene_id:8439|Hs109|chr8 ( 917) 6064 999.3 0
CCDS58928.1 LRBA gene_id:987|Hs109|chr4 (2851) 982 172.9 8e-42
CCDS3773.1 LRBA gene_id:987|Hs109|chr4 (2863) 982 172.9 8e-42
CCDS3609.1 WDFY3 gene_id:23001|Hs109|chr4 (3526) 979 172.5 1.3e-41
CCDS55894.1 NBEA gene_id:26960|Hs109|chr13 ( 739) 965 169.7 1.9e-41
CCDS45026.1 NBEA gene_id:26960|Hs109|chr13 (2946) 965 170.2 5.6e-41
CCDS46817.1 NBEAL2 gene_id:23218|Hs109|chr3 (2754) 955 168.5 1.6e-40
CCDS46495.1 NBEAL1 gene_id:65065|Hs109|chr2 (2694) 945 166.9 4.9e-40
CCDS31062.1 LYST gene_id:1130|Hs109|chr1 (3801) 620 114.1 5.3e-24
CCDS44385.1 WDFY4 gene_id:57705|Hs109|chr10 (3184) 576 106.9 6.6e-22
>>CCDS47864.1 NSMAF gene_id:8439|Hs109|chr8 (948 aa)
initn: 6429 init1: 6429 opt: 6429 Z-score: 5660.2 bits: 1058.7 E(33420): 0
Smith-Waterman score: 6429; 100.0% identity (100.0% similar) in 948 aa overlap (1-948:1-948)
10 20 30 40 50 60
pF1KE2 MTGQARFHRGAEACRAIRQCRSRRPRAAHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MTGQARFHRGAEACRAIRQCRSRRPRAAHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 EYYFEQHRANHILHKGSHHERKIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EYYFEQHRANHILHKGSHHERKIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 ENGANRHFTKAKSGGISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ENGANRHFTKAKSGGISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVET
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 LLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 PGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 LKFYEPQDRDDLYFYIATYLEHHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LKFYEPQDRDDLYFYIATYLEHHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCND
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 LSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 LSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 SHYSSPGYVLFYLVRIAPEYMLCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SHYSSPGYVLFYLVRIAPEYMLCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEF
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 YGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 YGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEW
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 IDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 IDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFV
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 TPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIH
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 KEAVTGITVSRNGSSVFTTSQDSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KEAVTGITVSRNGSSVFTTSQDSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVIT
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 SSWDNNVYFYSIAFGRRQDTLMGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SSWDNNVYFYSIAFGRRQDTLMGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGT
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 KRHHFDLLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 KRHHFDLLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVC
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 DTAFSPDSRHVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DTAFSPDSRHVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELL
850 860 870 880 890 900
910 920 930 940
pF1KE2 VWDLLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VWDLLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY
910 920 930 940
>>CCDS6173.1 NSMAF gene_id:8439|Hs109|chr8 (917 aa)
initn: 6064 init1: 6064 opt: 6064 Z-score: 5339.5 bits: 999.3 E(33420): 0
Smith-Waterman score: 6064; 100.0% identity (100.0% similar) in 897 aa overlap (52-948:21-917)
30 40 50 60 70 80
pF1KE2 SRRPRAAHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLEEYYFEQHRANHILHKGSHHER
::::::::::::::::::::::::::::::
CCDS61 MAFIRKKQQEQQLQLYSKERFSLLLLNLEEYYFEQHRANHILHKGSHHER
10 20 30 40 50
90 100 110 120 130 140
pF1KE2 KIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHGENGANRHFTKAKSGGISLIFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 KIRGSLKICSKSVIFEPDSISQPIIKIPLRDCIKIGKHGENGANRHFTKAKSGGISLIFS
60 70 80 90 100 110
150 160 170 180 190 200
pF1KE2 QVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 QVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMIT
120 130 140 150 160 170
210 220 230 240 250 260
pF1KE2 AILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLNGYPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 AILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLNGYPK
180 190 200 210 220 230
270 280 290 300 310 320
pF1KE2 PVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFYEPQDRDDLYFYIATYLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 PVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFYEPQDRDDLYFYIATYLE
240 250 260 270 280 290
330 340 350 360 370 380
pF1KE2 HHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 HHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDL
300 310 320 330 340 350
390 400 410 420 430 440
pF1KE2 SNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYGSHYSSPGYVLFYLVRIAPEYM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 SNPGTFRDLSKPVGALNKERLERLLTRYQEMPEPKFMYGSHYSSPGYVLFYLVRIAPEYM
360 370 380 390 400 410
450 460 470 480 490 500
pF1KE2 LCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 LCLQNGRFDNADRMFNSIAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQG
420 430 440 450 460 470
510 520 530 540 550 560
pF1KE2 GQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 GQMVDDVELPPWASSPEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVF
480 490 500 510 520 530
570 580 590 600 610 620
pF1KE2 HPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 HPLTYEGGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYN
540 550 560 570 580 590
630 640 650 660 670 680
pF1KE2 ASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 ASMADSPGEESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQ
600 610 620 630 640 650
690 700 710 720 730 740
pF1KE2 DSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSSWDNNVYFYSIAFGRRQDTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 DSTLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSSWDNNVYFYSIAFGRRQDTL
660 670 680 690 700 710
750 760 770 780 790 800
pF1KE2 MGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVDTIS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MGHDDAVSKICWHDNRLYSASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVDTIS
720 730 740 750 760 770
810 820 830 840 850 860
pF1KE2 LNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDGCLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 LNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDGCLN
780 790 800 810 820 830
870 880 890 900 910 920
pF1KE2 VIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELLVWDLLGAKISERIQGHTGAVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 VIDVQTGMLISSMTSDEPQRCFVWDGNSVLSGSQSGELLVWDLLGAKISERIQGHTGAVT
840 850 860 870 880 890
930 940
pF1KE2 CIWMNEQCSSIITGGEDRQIIFWKLQY
:::::::::::::::::::::::::::
CCDS61 CIWMNEQCSSIITGGEDRQIIFWKLQY
900 910
>>CCDS58928.1 LRBA gene_id:987|Hs109|chr4 (2851 aa)
initn: 1033 init1: 441 opt: 982 Z-score: 864.6 bits: 172.9 E(33420): 8e-42
Smith-Waterman score: 1134; 30.6% identity (58.2% similar) in 834 aa overlap (175-944:2019-2836)
150 160 170 180 190 200
pF1KE2 FIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMITAIL
::.. : :.. ::.:.. .:
CCDS58 LRRRRRFVRNPLGSTHPEATLKTAVEHATDEDILAKGKQSIRSQA---LGNQNSENEILL
1990 2000 2010 2020 2030 2040
210 220 230 240 250 260
pF1KE2 QSRLAR-TSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLNGYPK--
.. .: :.. ..:.. . . :..:.: :. : . .:...:::. . :.
CCDS58 EGDDDTLSSVDEKDLENLAGPVSLSTPAQLVAPSVVVKGTLSVTSSELYFEVDEEDPNFK
2050 2060 2070 2080 2090 2100
270 280 290 300
pF1KE2 ---PVV---------QITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFYEPQDR
: . . . ..: :..::. :. .::.: .. ....: .:
CCDS58 KIDPKILAYTEGLHGKWLFTEIRSIFSRRYLLQNTALEIFMANR---VAVMFNFPDPATV
2110 2120 2130 2140 2150 2160
310 320 330 340 350
pF1KE2 DDLYFYIATY---------------LEHHVAEHTAESYMLQWQRGHLSNYQYLLHLNNLA
. :. : : .. .::. ..::..::. ::..:
CCDS58 KKVVNYLPRVGVGTSFGLPQTRRISLASPRQLFKASNMTQRWQHREISNFEYLMFLNTIA
2170 2180 2190 2200 2210 2220
360 370 380 390 400 410
pF1KE2 DRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPE
:: :::.:::::::.: .: : ::::. : .:::::::.:::: .: . ::. .
CCDS58 GRSYNDLNQYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAAFFAERYESWED
2230 2240 2250 2260 2270 2280
420 430 440 450 460
pF1KE2 ---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNSIAETWKNCLDG
::: ::.:::. ..:: .:.:: : :.: ::.:.::.::: :.::...:.:
CCDS58 DQVPKFHYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSSISRAWRNSQRD
2290 2300 2310 2320 2330 2340
470 480 490 500 510 520
pF1KE2 ATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPEDFLQKSKDALE
..:.:::::::: : :: . .:: . : .:.::::::::.. :.:.. .. :::
CCDS58 TSDIKELIPEFYYLPEMF-VNFNNYNLGVMDDGTVVSDVELPPWAKTSEEFVHINRLALE
2350 2360 2370 2380 2390 2400
530 540 550 560 570 580
pF1KE2 SNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLTQIL
:..:: .::.::::::::::.: .:: : :::. :::::.:.:::: :: . :. .::
CCDS58 SEFVSCQLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDPVLREAVEAQIR
2410 2420 2430 2440 2450 2460
590 600 610 620 630 640
pF1KE2 EFGQTPKQLFVTPHPRR-----ITP-KFKSLSQTSSYNASM--ADSPGEESFEDLTEESK
:::::.::.. ::: : ..: : . .: . . ..:: . .
CCDS58 SFGQTPSQLLIEPHPPRGSAMQVSPLMFTDKAQQDVIMVLKFPSNSPVTHVAANTQPGLA
2470 2480 2490 2500 2510 2520
650 660 670 680 690 700
pF1KE2 TLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTLKMFSKESKMLQRSIS-
: : ..: .: : :. . .: .. . . : ...... : .:.:.
CCDS58 TPAVITVTANRLFAVNKWHNLPAHQGAV-QDQPYQLPVEID---PLIASNTGMHRRQITD
2530 2540 2550 2560 2570
710 720 730 740 750
pF1KE2 ---FSNMALSSCLLLPGDAT--VITSSWDNNVYFYSIAFGRRQDTLMGHDDAVSKICWHD
: .. :.:... .: .. . ::.. :: :: ....:: :.:. . .
CCDS58 LLDQSIQVHSQCFVITSDNRYILVCGFWDKSFRVYSTDTGRLIQVVFGHWDVVTCLARSE
2580 2590 2600 2610 2620 2630
760 770 780 790 800
pF1KE2 NRL------YSASWDSTVKVW------SGVPAEMPGTKRHHFDLLAELEHDVSVDTISLN
. . :.: :.:. .: ::. .. :: .:. :: : ..
CCDS58 SYIGGNCYILSGSRDATLLLWYWNGKCSGI-GDNPGETAAPRAILTG--HDYEVTCAAVC
2640 2650 2660 2670 2680 2690
810 820 830 840 850 860
pF1KE2 AASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSR-HVLSTGTDGCLNV
: :..::..:: : ... . :.. . . . .. . . : . .: . .
CCDS58 AELGLVLSGSQEGPCLIHSMN-GDLLRTLEGPENCLKPKLIQASREGHCVIFYENGLFCT
2700 2710 2720 2730 2740 2750
870 880 890 900 910 920
pF1KE2 IDVQTGMLISSMTSDEPQRC--FVWDGNSVLSGSQSGELLVWDLLGAKISERIQGHTGAV
..:. : : ..: .:. : . ::. .:.:.. : ..: .. : : ...
CCDS58 FSVN-GKLQATMETDDNIRAIQLSRDGQYLLTGGDRGVVVVRQVSDLKQLFAYPGCDAGI
2760 2770 2780 2790 2800 2810
930 940
pF1KE2 TCIWMNEQCSSIITGGEDRQIIFWKLQY
. .. . ::.: . .:...
CCDS58 RAMALSYDQRCIISGMASGSIVLFYNDFNRWHHEYQTRY
2820 2830 2840 2850
>>CCDS3773.1 LRBA gene_id:987|Hs109|chr4 (2863 aa)
initn: 1033 init1: 441 opt: 982 Z-score: 864.5 bits: 172.9 E(33420): 8e-42
Smith-Waterman score: 1138; 30.7% identity (59.1% similar) in 845 aa overlap (165-944:2018-2848)
140 150 160 170 180 190
pF1KE2 GISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDK-L
.:.: .:. : : .: . : .. :
CCDS37 DLRRRRRFVRNPLGSTHPEATLKTAVEHVCIFKLRENSKATD--EDILAKGKQSIRSQAL
1990 2000 2010 2020 2030 2040
200 210 220 230 240 250
pF1KE2 GDQTAMITAILQSRLAR-TSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLY
:.:.. .:.. .: :.. ..:.. . . :..:.: :. : . .:...::
CCDS37 GNQNSENEILLEGDDDTLSSVDEKDLENLAGPVSLSTPAQLVAPSVVVKGTLSVTSSELY
2050 2060 2070 2080 2090 2100
260 270 280 290
pF1KE2 FQPLNGYPK-----PVV---------QITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCSD
:. . :. : . . . ..: :..::. :. .::.: ..
CCDS37 FEVDEEDPNFKKIDPKILAYTEGLHGKWLFTEIRSIFSRRYLLQNTALEIFMANR---VA
2110 2120 2130 2140 2150 2160
300 310 320 330 340
pF1KE2 IYLKFYEPQDRDDLYFY-----IATYL----EHHVAEHTAE-----SYMLQ-WQRGHLSN
....: .: . : ..: . .... . . : : : ::. ..::
CCDS37 VMFNFPDPATVKKVVNYLPRVGVGTSFGLPQTRRISLASPRQLFKASNMTQRWQHREISN
2170 2180 2190 2200 2210 2220
350 360 370 380 390 400
pF1KE2 YQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLE
..::. ::..: :: :::.:::::::.: .: : ::::. : .:::::::.:::: .:
CCDS37 FEYLMFLNTIAGRSYNDLNQYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAA
2230 2240 2250 2260 2270 2280
410 420 430 440 450
pF1KE2 RLLTRYQEMPE---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNS
. ::. . ::: ::.:::. ..:: .:.:: : :.: ::.:.::.::: :.:
CCDS37 FFAERYESWEDDQVPKFHYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSS
2290 2300 2310 2320 2330 2340
460 470 480 490 500 510
pF1KE2 IAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPE
:...:.: ..:.:::::::: : :: . .:: . : .:.::::::::.. :
CCDS37 ISRAWRNSQRDTSDIKELIPEFYYLPEMF-VNFNNYNLGVMDDGTVVSDVELPPWAKTSE
2350 2360 2370 2380 2390 2400
520 530 540 550 560 570
pF1KE2 DFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDP
.:.. .. ::::..:: .::.::::::::::.: .:: : :::. :::::.:.:::: ::
CCDS37 EFVHINRLALESEFVSCQLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDP
2410 2420 2430 2440 2450 2460
580 590 600 610 620 630
pF1KE2 DEKVAMLTQILEFGQTPKQLFVTPHPRR-----ITP-KFKSLSQTSSYNASM--ADSPGE
. :. .:: :::::.::.. ::: : ..: : . .: . . ..::
CCDS37 VLREAVEAQIRSFGQTPSQLLIEPHPPRGSAMQVSPLMFTDKAQQDVIMVLKFPSNSPVT
2470 2480 2490 2500 2510 2520
640 650 660 670 680 690
pF1KE2 ESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTLKMFSK
. . : : ..: .: : :. . .: .. . . : ....
CCDS37 HVAANTQPGLATPAVITVTANRLFAVNKWHNLPAHQGAV-QDQPYQLPVEIDP---LIAS
2530 2540 2550 2560 2570
700 710 720 730 740
pF1KE2 ESKMLQRSIS----FSNMALSSCLLLPGDAT--VITSSWDNNVYFYSIAFGRRQDTLMGH
.. : .:.:. : .. :.:... .: .. . ::.. :: :: ....::
CCDS37 NTGMHRRQITDLLDQSIQVHSQCFVITSDNRYILVCGFWDKSFRVYSTDTGRLIQVVFGH
2580 2590 2600 2610 2620 2630
750 760 770 780 790
pF1KE2 DDAVSKICWHDNRL------YSASWDSTVKVW------SGVPAEMPGTKRHHFDLLAELE
:.:. . .. . :.: :.:. .: ::. .. ::.. .
CCDS37 WDVVTCLARSESYIGGNCYILSGSRDATLLLWYWNGKCSGI-GDNPGSETAAPRAILT-G
2640 2650 2660 2670 2680 2690
800 810 820 830 840 850
pF1KE2 HDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSR-HV
:: : .. : :..::..:: : ... . :.. . . . .. . . :
CCDS37 HDYEVTCAAVCAELGLVLSGSQEGPCLIHSMN-GDLLRTLEGPENCLKPKLIQASREGHC
2700 2710 2720 2730 2740 2750
860 870 880 890 900
pF1KE2 LSTGTDGCLNVIDVQTGMLISSMTSDEPQRC--FVWDGNSVLSGSQSGELLVWDLLGAKI
. .: . ...:. : : ..: .:. : . ::. .:.:.. : ..: .. :
CCDS37 VIFYENGLFCTFSVN-GKLQATMETDDNIRAIQLSRDGQYLLTGGDRGVVVVRQVSDLKQ
2760 2770 2780 2790 2800 2810
910 920 930 940
pF1KE2 SERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY
: ... . .. . ::.: . .:...
CCDS37 LFAYPGCDAGIRAMALSYDQRCIISGMASGSIVLFYNDFNRWHHEYQTRY
2820 2830 2840 2850 2860
>>CCDS3609.1 WDFY3 gene_id:23001|Hs109|chr4 (3526 aa)
initn: 912 init1: 388 opt: 979 Z-score: 860.6 bits: 172.5 E(33420): 1.3e-41
Smith-Waterman score: 1060; 33.7% identity (58.5% similar) in 709 aa overlap (269-937:2612-3277)
240 250 260 270 280 290
pF1KE2 TNPGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTED-----
.:.....:::. :.:...::: .
CCDS36 LPPNMHEPIIPRGARQGPSQLKRTCSIFAYEDIKEVHKRRYLLQPIAVEVFSGDGRNYLL
2590 2600 2610 2620 2630 2640
300 310 320 330
pF1KE2 ----DLCSDIYLKFYE--PQDRDDLYFYIATYLEHHVAEHTA--------ESYMLQWQRG
. . .: .: :. :. . . : . .. .: .:.::
CCDS36 AFQKGIRNKVYQRFLAVVPSLTDSSESVSGQRPNTSVEQGSGLLSTLVGEKSVTQRWERG
2650 2660 2670 2680 2690 2700
340 350 360 370 380 390
pF1KE2 HLSNYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNK
..::.:::.:::.:: :: ::: ::::::::. ::.: :.::.:: :::.:.::.:: .
CCDS36 EISNFQYLMHLNTLAGRSYNDLMQYPVFPWILADYDSEEVDLTNPKTFRNLAKPMGAQTD
2710 2720 2730 2740 2750 2760
400 410 420 430 440 450
pF1KE2 ERLERLLTRYQEMPEPK-----FMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNA
::: . ::.. .:. . ::.:::: : ::::. : . .: ::.:.:: :
CCDS36 ERLAQYKKRYKDWEDPNGETPAYHYGTHYSSAMIVASYLVRMEPFTQIFLRLQGGHFDLA
2770 2780 2790 2800 2810 2820
460 470 480 490 500 510
pF1KE2 DRMFNSIAETWKNCLD-GATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELP
::::.:. :.: . . .: :::::::. :: :: ..::: .:.: . :: ::
CCDS36 DRMFHSVREAWYSASKHNMADVKELIPEFFYLP-EFLFNSNNFDLGCKQNGTKLGDVILP
2830 2840 2850 2860 2870 2880
520 530 540 550 560 570
pF1KE2 PWASS-PEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGV
:::.. :..:.. ..::: .::: ::::::::::::::.: :: : :::: : ::: :
CCDS36 PWAKGDPREFIRVHREALECDYVSAHLHEWIDLIFGYKQQGPAAVEAVNVFHHLFYEGQV
2890 2900 2910 2920 2930 2940
580 590 600 610 620 630
pF1KE2 DLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGE
:. .:.:: ...: . : .::: ::::: ::: :: . :. .. ::... ::
CCDS36 DIYNINDPLKETATIGFINNFGQIPKQLFKKPHP----PK-RVRSRLNGDNAGISVLPGS
2950 2960 2970 2980 2990
640 650 660 670 680 690
pF1KE2 ESFEDLTEESKTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTLKMFSK
: . . .. .: ..: . : :: : :. . .: .... :...:
CCDS36 TSDKIFFHHLDNLR-PSLTPV------KELKEPVGQIVCTDKG--ILAVEQNKVLI----
3000 3010 3020 3030 3040
700 710 720 730 740 750
pF1KE2 ESKMLQRSISFSNMALSSCLLLPGDATVITSSWDNNVYFYSIAFGRRQDTLMGHDDAVSK
....... :: : : : : :. . : . : . .
CCDS36 -PPTWNKTFAWGYADLS-CRL--G-----TYESDKAMTVY--------ECLSEWGQILCA
3050 3060 3070 3080
760 770 780 790 800
pF1KE2 ICWHDNRLYSASWDSTVKVWS-GVPAEMPGTKRHHFDLLAELEHDVSVDTISLNAASTLL
:: . . . ... ...: :: :. : : . ::.. . :. : :: : ..
CCDS36 ICPNPKLVITGGTSTVVCVWEMGTSKEKAKTVTLKQALLGHTD-TVTCATASL--AYHII
3090 3100 3110 3120 3130 3140
810 820 830 840 850 860
pF1KE2 VSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLS-TGTDGCLNVIDVQTG
:::... : ::::. ... :. : . : .. . ..: .:: ..: ... .
CCDS36 VSGSRDRTCIIWDLNKLSFLTQLRGHRAPVSALCINELTGDIVSCAGT--YIHVWSINGN
3150 3160 3170 3180 3190 3200
870 880 890 900 910
pF1KE2 MLISSMT-SDEPQR---CFV-----WDG-NSVLSGSQSGELLVWDLLGAKISERIQGHTG
..: : . . :. : . :: : ...: ..: . : . .. : . .
CCDS36 PIVSVNTFTGRSQQIICCCMSEMNEWDTQNVIVTGHSDGVVRFWRMEFLQVPETPAPEPA
3210 3220 3230 3240 3250 3260
920 930 940
pF1KE2 AVTCIWMNEQCSSIITGGEDRQIIFWKLQY
: . :.:.: : :
CCDS36 EV--LEMQEDCPEAQIGQEAQDEDSSDSEADEQSISQDPKDTPSQPSSTSHRPRAASCRA
3270 3280 3290 3300 3310
>>CCDS55894.1 NBEA gene_id:26960|Hs109|chr13 (739 aa)
initn: 1084 init1: 470 opt: 965 Z-score: 857.8 bits: 169.7 E(33420): 1.9e-41
Smith-Waterman score: 1090; 30.9% identity (60.4% similar) in 735 aa overlap (268-948:2-728)
240 250 260 270 280 290
pF1KE2 VTNPGHVCITDTNLYFQPLNGYPKPVVQITLQDVRRIYKRRHGLMPLGLEVFCTEDDLCS
....: ...::. :. .:::: .. .
CCDS55 MFSEIRAVFSRRYLLQNTALEVFMANR---T
10 20
300 310 320 330 340
pF1KE2 DIYLKFYEPQDRDDLYFYI------ATY---LEHHVAEHTAE-----SYMLQ-WQRGHLS
.....: . . . . ..: .... : . : : : ::: ..:
CCDS55 SVMFNFPDQATVKKVVYSLPRVGVGTSYGLPQARRISLATPRQLYKSSNMTQRWQRREIS
30 40 50 60 70 80
350 360 370 380 390 400
pF1KE2 NYQYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERL
:..::. ::..: :. :::.:::::::.. .: : ::::. ::.:::::::.:::: .:
CCDS55 NFEYLMFLNTIAGRTYNDLNQYPVFPWVLTNYESEELDLTLPGNFRDLSKPIGALNPKRA
90 100 110 120 130 140
410 420 430 440 450
pF1KE2 ERLLTRYQEMPE---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFN
::. . : . :..:::. .: .:::: : ..: ..:.::. :: :.
CCDS55 VFYAERYETWEDDQSPPYHYNTHYSTATSTLSWLVRIEPFTTFFLNANDGKFDHPDRTFS
150 160 170 180 190 200
460 470 480 490 500 510
pF1KE2 SIAETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSP
:.:..:.. ..: :::::::: : ::: .:: :. .:.::.:::::..:
CCDS55 SVARSWRTSQRDTSDVKELIPEFYYLPEMF-VNSNGYNLGVREDEVVVNDVDLPPWAKKP
210 220 230 240 250 260
520 530 540 550 560 570
pF1KE2 EDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQD
:::.. .. ::::..:: .::.::::::::::.: .:: : :::: :::::.:.:.:: :
CCDS55 EDFVRINRMALESEFVSCQLHQWIDLIFGYKQRGPEAVRALNVFHYLTYEGSVNLDSITD
270 280 290 300 310 320
580 590 600 610 620 630
pF1KE2 PDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLT
: . :: .:: .:::::.::.. ::: : . . : . :. .. . :
CCDS55 PVLREAMEAQIQNFGQTPSQLLIEPHPPRSSAMHLCFLPQSPL--MFKDQMQQDVIMVLK
330 340 350 360 370 380
640 650 660 670 680
pF1KE2 EESKT----LAWNNITKLQLHEHYKIHKEAVTGI-----TVSRNGSSVFTTSQDSTLK--
:.. .: :.. .: . . . .. ::. :. .. .: :
CCDS55 FPSNSPVTHVAANTLPHLTIPAVVTVTCSRLFAVNRWHNTVGLRGAPGYSLDQAHHLPIE
390 400 410 420 430 440
690 700 710 720 730
pF1KE2 ---MFSKESKMLQRSIS-FSNMAL---SSCLLLPGDAT--VITSSWDNNVYFYSIAFGRR
.....: . .:.:. . .... . :... .: .: . ::.. :: :.
CCDS55 MDPLIANNSGVNKRQITDLVDQSIQINAHCFVVTADNRYILICGFWDKSFRVYSTETGKL
450 460 470 480 490 500
740 750 760 770 780
pF1KE2 QDTLMGHDDAVSKICWH------DNRLYSASWDSTVKVW--SG---VPAEMPGTKRHHFD
. ..:: :.:. . : . :.: :.:. .: :: . .. :... .
CCDS55 TQIVFGHWDVVTCLARSESYIGGDCYIVSGSRDATLLLWYWSGRHHIIGDNPNSSDYPAP
510 520 530 540 550 560
790 800 810 820 830 840
pF1KE2 LLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSP
. :: : .:. : :..::.::: . .: . :.. . . . .:
CCDS55 RAVLTGHDHEVVCVSVCAELGLVISGAKEGPCLVHTIT-GDLLRALEGPENCLFPRLISV
570 580 590 600 610 620
850 860 870 880 890 900
pF1KE2 DSR-HVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVW--DGNSVLSGSQSGELLVWD
.:. : . : .. .... : :...: .. : .. ::.....:...: . ::.
CCDS55 SSEGHCIIYYERGRFSNFSIN-GKLLAQMEINDSTRAILLSSDGQNLVTGGDNGVVEVWQ
630 640 650 660 670 680
910 920 930 940
pF1KE2 LLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY
: : ... . .... ..::: . .:. .....
CCDS55 ACDFKQLYIYPGCDAGIRAMDLSHDQRTLITGMASGSIVAFNIDFNRWHYEHQNRY
690 700 710 720 730
>>CCDS45026.1 NBEA gene_id:26960|Hs109|chr13 (2946 aa)
initn: 1040 init1: 470 opt: 965 Z-score: 849.4 bits: 170.2 E(33420): 5.6e-41
Smith-Waterman score: 1132; 27.6% identity (57.5% similar) in 973 aa overlap (58-948:1983-2935)
30 40 50 60 70 80
pF1KE2 AHPEGRAGSGRGSRHASPGVRRGGFSLLLLNLEEYYFEQHRANHILHKGSHHERKI----
: :. ....::. . :: .. : .
CCDS45 QKNAGLAFIELINEGRLLCHAMKDHIVRVANEAEFILNRQRAEDV-HKHAEFESQCAQYA
1960 1970 1980 1990 2000 2010
90 100 110 120 130
pF1KE2 ---RGSLKICSK--SVIFEPDSISQPIIKIPLRDCIKIGKHGENGANRH-----FTKAKS
: :.:.. :. . : .. .: . . : .::: :: : : .
CCDS45 ADRREEEKMCDHLISAAKHRDHVTANQLKQKILN-ILTNKHGAWGAVSHSQLHDFWRLDY
2020 2030 2040 2050 2060 2070
140 150 160 170 180 190
pF1KE2 GGISLIFSQVYFIKEHNVVAPYKIERGKMEYVFELDVPGKVEDVVETLLQLHRASCLDKL
.: . . . . . . .. .:: : ::::.. .. . ...
CCDS45 WEDDLRRRRRFVRNAFGSTHAEALLKAAIEY-------GTEEDVVKSKKTFRSQAIVNQN
2080 2090 2100 2110 2120
200 210 220 230 240 250
pF1KE2 GDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLVTNPGHVCITDTNLYF
.. :. . . : . .......:.. . . :....:.:. : . :: :..::
CCDS45 AETELMLEG---DDDAVSLLQEKEIDNLAGPVVLSTPAQLIAPVVVAKGTLSITTTEIYF
2130 2140 2150 2160 2170 2180
260 270 280 290
pF1KE2 Q---PLNGYPKPVVQIT-----------LQDVRRIYKRRHGLMPLGLEVFCTEDDLCSDI
. ... : ... ....: ...::. :. .:::: .. ...
CCDS45 EVDEDDSAFKKIDTKVLAYTEGLHGKWMFSEIRAVFSRRYLLQNTALEVFMANR---TSV
2190 2200 2210 2220 2230
300 310 320 330 340
pF1KE2 YLKFYEPQDRDDLYFYI------ATY---LEHHVAEHTAE-----SYMLQ-WQRGHLSNY
...: . . . . ..: .... : . : : : ::: ..::.
CCDS45 MFNFPDQATVKKVVYSLPRVGVGTSYGLPQARRISLATPRQLYKSSNMTQRWQRREISNF
2240 2250 2260 2270 2280 2290
350 360 370 380 390 400
pF1KE2 QYLLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLER
.::. ::..: :. :::.:::::::.. .: : ::::. ::.:::::::.:::: .:
CCDS45 EYLMFLNTIAGRTYNDLNQYPVFPWVLTNYESEELDLTLPGNFRDLSKPIGALNPKRAVF
2300 2310 2320 2330 2340 2350
410 420 430 440 450
pF1KE2 LLTRYQEMPE---PKFMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRFDNADRMFNSI
::. . : . :..:::. .: .:::: : ..: ..:.::. :: :.:.
CCDS45 YAERYETWEDDQSPPYHYNTHYSTATSTLSWLVRIEPFTTFFLNANDGKFDHPDRTFSSV
2360 2370 2380 2390 2400 2410
460 470 480 490 500 510
pF1KE2 AETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDVELPPWASSPED
:..:.. ..: :::::::: : ::: .:: :. .:.::.:::::..:::
CCDS45 ARSWRTSQRDTSDVKELIPEFYYLPEMF-VNSNGYNLGVREDEVVVNDVDLPPWAKKPED
2420 2430 2440 2450 2460 2470
520 530 540 550 560 570
pF1KE2 FLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPD
:.. .. ::::..:: .::.::::::::::.: .:: : :::: :::::.:.:.:: ::
CCDS45 FVRINRMALESEFVSCQLHQWIDLIFGYKQRGPEAVRALNVFHYLTYEGSVNLDSITDPV
2480 2490 2500 2510 2520 2530
580 590 600 610 620 630
pF1KE2 EKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEE
. :: .:: .:::::.::.. ::: : . . : . :. .. . :
CCDS45 LREAMEAQIQNFGQTPSQLLIEPHPPRSSAMHLCFLPQSPLM--FKDQMQQDVIMVLKFP
2540 2550 2560 2570 2580 2590
640 650 660 670 680
pF1KE2 SKT----LAWNNITKLQLHEHYKIHKEAVTGI-----TVSRNGSSVFTTSQDSTLK----
:.. .: :.. .: . . . .. ::. :. .. .: :
CCDS45 SNSPVTHVAANTLPHLTIPAVVTVTCSRLFAVNRWHNTVGLRGAPGYSLDQAHHLPIEMD
2600 2610 2620 2630 2640 2650
690 700 710 720 730
pF1KE2 -MFSKESKMLQRSIS-FSNMAL---SSCLLLPGDAT--VITSSWDNNVYFYSIAFGRRQD
.....: . .:.:. . .... . :... .: .: . ::.. :: :. .
CCDS45 PLIANNSGVNKRQITDLVDQSIQINAHCFVVTADNRYILICGFWDKSFRVYSTETGKLTQ
2660 2670 2680 2690 2700 2710
740 750 760 770 780
pF1KE2 TLMGHDDAVSKICWH------DNRLYSASWDSTVKVW--SG---VPAEMPGTKRHHFDLL
..:: :.:. . : . :.: :.:. .: :: . .. :... .
CCDS45 IVFGHWDVVTCLARSESYIGGDCYIVSGSRDATLLLWYWSGRHHIIGDNPNSSDYPAPRA
2720 2730 2740 2750 2760 2770
790 800 810 820 830 840
pF1KE2 AELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDS
. :: : .:. : :..::.::: . .: . :.. . . . .: .:
CCDS45 VLTGHDHEVVCVSVCAELGLVISGAKEGPCLVHTIT-GDLLRALEGPENCLFPRLISVSS
2780 2790 2800 2810 2820 2830
850 860 870 880 890 900
pF1KE2 R-HVLSTGTDGCLNVIDVQTGMLISSMTSDEPQRCFVW--DGNSVLSGSQSGELLVWDLL
. : . : .. .... : :...: .. : .. ::.....:...: . ::.
CCDS45 EGHCIIYYERGRFSNFSIN-GKLLAQMEINDSTRAILLSSDGQNLVTGGDNGVVEVWQAC
2840 2850 2860 2870 2880 2890
910 920 930 940
pF1KE2 GAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY
: : ... . .... ..::: . .:. .....
CCDS45 DFKQLYIYPGCDAGIRAMDLSHDQRTLITGMASGSIVAFNIDFNRWHYEHQNRY
2900 2910 2920 2930 2940
>>CCDS46817.1 NBEAL2 gene_id:23218|Hs109|chr3 (2754 aa)
initn: 990 init1: 536 opt: 955 Z-score: 841.0 bits: 168.5 E(33420): 1.6e-40
Smith-Waterman score: 1048; 32.7% identity (57.6% similar) in 712 aa overlap (191-820:1894-2579)
170 180 190 200 210 220
pF1KE2 KMEYVFELDVPGKVEDVVETLLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQN
:.::.. : :.. . . .:..:
CCDS46 VPLTPTEEASLPLAVTKEAKVSTPPELLQEDQLGEDE---LAELETPMEAAELDEQR---
1870 1880 1890 1900 1910
230 240 250 260
pF1KE2 ISEKLHMECKAEMVTPLVTNPGHVCITDTNLYFQPLN----------GYP--KPVVQITL
::: . . ..:: ... :: . .: :.:: . :: .:..:.
CCDS46 --EKLVLSAECQLVTVVAVVPGLLEVTTQNVYFYDGSTERVETEEGIGYDFRRPLAQL--
1920 1930 1940 1950 1960 1970
270 280 290 300
pF1KE2 QDVRRIYKRRHGLMPLGLEVFCTEDDLCSDIYLKFY---------------EPQD-----
:... :: .: .::.: .. .. .:.: .::
CCDS46 ---REVHLRRFNLRRSALELFFIDQ---ANYFLNFPCKVGTTPVSSPSQTPRPQPGPIPP
1980 1990 2000 2010 2020
310 320 330 340 350
pF1KE2 ----RDDLYFYIAT-------YLEHHVAEHT--AESYMLQWQRGHLSNYQYLLHLNNLAD
:...: .. :: . .. : . .: . ..::..::..::..:
CCDS46 HTQVRNQVYSWLLRLRPPSQGYLSSRSPQEMLRASGLTQKWVQREISNFEYLMQLNTIAG
2030 2040 2050 2060 2070 2080
360 370 380 390 400 410
pF1KE2 RSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLLTRYQEMPEP
:. :::::::::::...:: : ::::::..:::::::.:..: .. . . .:. . .:
CCDS46 RTYNDLSQYPVFPWVLQDYVSPTLDLSNPAVFRDLSKPIGVVNPKHAQLVREKYESFEDP
2090 2100 2110 2120 2130 2140
420 430 440 450 460
pF1KE2 -----KFMYGSHYSSPGYVLFYLVRIAPEYMLC--LQNGRFDNADRMFNSIAETWKNCLD
:: ::.:::. . :. ::.:. : : ::.:::: .::.:.:.: .:. :.
CCDS46 AGTIDKFHYGTHYSNAAGVMHYLIRVEPFTSLHVQLQSGRFDCSDRQFHSVAAAWQARLE
2150 2160 2170 2180 2190 2200
470 480 490 500 510 520
pF1KE2 GATDFKELIPEF-YGDDVSFLVNSLKLDLGKRQ-GGQMVDDVELPPWASSPEDFLQKSKD
. .: ::::::: : : :: :. .::: : .. : :: :::::::::::.:. ..
CCDS46 SPADVKELIPEFFYFPD--FLENQNGFDLGCLQLTNEKVGDVVLPPWASSPEDFIQQHRQ
2210 2220 2230 2240 2250 2260
530 540 550 560 570 580
pF1KE2 ALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDPDEKVAMLT
::::.::: ::::::::::::::.: : : :::. ::::.:::. . : :. :.
CCDS46 ALESEYVSAHLHEWIDLIFGYKQRGPAAEEALNVFYYCTYEGAVDLDHVTDERERKALEG
2270 2280 2290 2300 2310 2320
590 600 610 620 630 640
pF1KE2 QILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADSPGEESFEDLTEESKTLAWN
: .::::: ::. ::: :.. .. ... . :. . :. : .: :.. .
CCDS46 IISNFGQTPCQLLKEPHPTRLS------AEEAAHRLARLDTNSPSIFQHL-DELKAFFAE
2330 2340 2350 2360 2370
650 660 670 680
pF1KE2 NITK-----LQLHEHYKIHKEAVTG-----ITVS--------------RNGSSVFTTSQD
.. : : : . :. . : .::: :: :. :. :.:
CCDS46 VVSDGVPLVLALVPHRQPHSFITQGSPDLLVTVSASGLLGTHSWLPYDRNISNYFSFSKD
2380 2390 2400 2410 2420 2430
690 700 710 720 730 740
pF1KE2 STLKMFSKESKMLQRSISFSNMALSSCLLLPGDATVITSS--WDNNVYFYSIAFGRRQDT
:. : ...:. .. . .. : . :. .. :. ::... .. :. .
CCDS46 PTMGSH-KTQRLLSGPWVPGSGVSGQALAVAPDGKLLFSGGHWDGSLRVTALPRGKLLSQ
2440 2450 2460 2470 2480 2490
750 760 770 780 790
pF1KE2 LMGHDDAVSKICWHDNRLY--SASWDSTVKVWSGVPAEMPGTKRHHFDLLAELEHDVSVD
: : :.:. . .: :.: :.: :: . .. . . : ..:.
CCDS46 LSCHLDVVTCLALDTCGIYLISGSRDTTCMVWRLLHQGGLSVGLAPKPVQVLYGHGAAVS
2500 2510 2520 2530 2540 2550
800 810 820 830 840 850
pF1KE2 TISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLSTGTDG
..... . :::...::: :
CCDS46 CVAISTELDMAVSGSEDGTVIIHTVRRGQFVAALRPLGATFPGPIFHLALGSEGQIVVQS
2560 2570 2580 2590 2600 2610
>>CCDS46495.1 NBEAL1 gene_id:65065|Hs109|chr2 (2694 aa)
initn: 968 init1: 527 opt: 945 Z-score: 832.4 bits: 166.9 E(33420): 4.9e-40
Smith-Waterman score: 1215; 32.6% identity (62.0% similar) in 800 aa overlap (209-942:1872-2652)
180 190 200 210 220 230
pF1KE2 ETLLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKNRFQNISEKLHMECKAEMVTPLV
::.. :... :. .::: . :..: .
CCDS46 SDTLLLEVVKQVKVSDMVEDKLDLPEEDITARVNVDEKEEQDQKEKLVLMEDCELITIID
1850 1860 1870 1880 1890 1900
240 250 260 270 280 290
pF1KE2 TNPGHVCITDTNLYFQPLNGYPKPVVQITLQ----DVRRIYKRRHGLMPLGLEVFCTEDD
. ::.. :: ..:: . . : . .. ..:.:. ::..: .::.: ...
CCDS46 VIPGRLEITTQHIYFYDGSIEKEDGVGFDFKWPHSQIREIHLRRYNLRRSALEIFHVDQ-
1910 1920 1930 1940 1950 1960
300 310 320 330 340
pF1KE2 LCSDIYLKFYEPQDRDDLYFYIAT-------YLEHHVAEHTAESYMLQ-WQRGHLSNYQY
:. .:.: . . :. .: . . : . : : . : : ..::..:
CCDS46 --SNYFLNF-KKEVRNKIYSRLLSLHSPNSYYGSRSPQELFKASGLTQKWVNREISNFDY
1970 1980 1990 2000 2010
350 360 370 380 390 400
pF1KE2 LLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLL
:...:..: :. :::.::::::::..::.: ::::.::..:::::::.:..:.. . .
CCDS46 LIQINTMAGRTYNDLAQYPVFPWILQDYTSEELDLNNPAVFRDLSKPIGVVNEKNAKAMR
2020 2030 2040 2050 2060 2070
410 420 430 440 450
pF1KE2 TRYQEMPEP-----KFMYGSHYSSPGYVLFYLVRIAPEYMLC--LQNGRFDNADRMFNSI
.:... .: :: ::.:::. . :. ::.:. : : ::.:::: :::.:.::
CCDS46 EKYENFEDPMGTIDKFHYGTHYSNSAGVMHYLIRVEPFTTLHIQLQSGRFDCADRQFHSI
2080 2090 2100 2110 2120 2130
460 470 480 490 500 510
pF1KE2 AETWKNCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQ-GGQMVDDVELPPWASSPE
::. .:. : :::::::. :: :. ...::. : . ..:.:: :: ::.: :
CCDS46 PATWQALMDNPYDVKELIPEFFYFP-EFLENQNQFNLGRLQISKELVNDVILPKWAKSAE
2140 2150 2160 2170 2180 2190
520 530 540 550 560 570
pF1KE2 DFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYEGGVDLNSIQDP
::. : . ::::.::: ::::::::::::::.: :: : :::. .:::.:::... :
CCDS46 DFIYKHRKALESEYVSAHLHEWIDLIFGYKQRGPAAVEALNVFYYCSYEGAVDLDALTDE
2200 2210 2220 2230 2240 2250
580 590 600 610 620 630
pF1KE2 DEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADS----PGEESF-
:. :. .: .::::: ::. ::: :.. . ..... .. ..: . : .::
CCDS46 KERKALEGMINNFGQTPCQLLKEPHPPRLSAE-EAVQKPTKIDTSTLNLFQHLPELKSFF
2260 2270 2280 2290 2300 2310
640 650 660 670
pF1KE2 -EDLTEESKTLAWNNITKLQLHEHYK---------IHKEAVTG----ITVSRNGSSVFTT
: ... . : .: : : . .. : . : : . .:: :. ::
CCDS46 IEGISD-GIPLLKATIPKNQYRSFMSQGSPELLITISMNYVIGTHGWLPYDRNISNYFTF
2320 2330 2340 2350 2360 2370
680 690 700 710 720 730
pF1KE2 SQDSTLKMFSKESKMLQRSI--SFS-NMALSSCLLLPG-DATVITSS--WDNNVYFYSIA
.:.:. . :::: ::. .. ..: :.. . :: .. :. :::.. .:..
CCDS46 IKDQTVT-----NPKTQRSINGSFAPGLEITSKLFVVSHDAKLLFSAGYWDNSIQVMSLT
2380 2390 2400 2410 2420
740 750 760 770 780
pF1KE2 FGRRQDTLMGHDDAVSKIC--WHDNRLYSASWDSTVKVWS-----GVPAEMPGTKRHHFD
:. . .. : : :. . . .: :.: :.: .:. :::. : . :.
CCDS46 KGKIISHIIRHMDIVTCLATDYCGIHLISGSRDTTCMIWQITQQGGVPV---GLASKPFQ
2430 2440 2450 2460 2470 2480
790 800 810 820 830 840
pF1KE2 LLAELEHDVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQI--PCHSGI---VCD
.: : : ...... . :::...::: : . . :. . ::.:.. . .
CCDS46 IL--YGHTNEVLSVGISTELDMAVSGSRDGTVIIHTIQKGQYMRTLRPPCESSLFLTIPN
2490 2500 2510 2520 2530 2540
850 860 870 880 890
pF1KE2 TAFSPDSRHVLSTGTD--------GCLNVIDVQTGMLISSMTSDEPQR-CFVWDGNSVLS
:.: ... :. ..:. . :...... .: :.. ... . :.. :. ...
CCDS46 LAISWEGHIVVYSSTEEKTTLKDKNALHLFSINGKYLGSQILKEQVSDICII--GEHIVT
2550 2560 2570 2580 2590 2600
900 910 920 930 940
pF1KE2 GSQSGELLVWDLLGAKISERIQGHTGAVTCIWMNEQCSSIITGGEDRQIIFWKLQY
:: .: : . :: . ..: . . :. .... : :..: :: ..:
CCDS46 GSIQGFLSIRDLHSLNLSINPLAMRLPIHCVCVTKEYSHILVGLEDGKLIVVGVGKPAEM
2610 2620 2630 2640 2650 2660
CCDS46 RSGQLSRKFWGSSKRLSQISAGETEYNTQDSK
2670 2680 2690
>>CCDS31062.1 LYST gene_id:1130|Hs109|chr1 (3801 aa)
initn: 552 init1: 220 opt: 620 Z-score: 544.6 bits: 114.1 E(33420): 5.3e-24
Smith-Waterman score: 925; 27.9% identity (56.5% similar) in 796 aa overlap (211-944:2999-3778)
190 200 210 220 230
pF1KE2 LLQLHRASCLDKLGDQTAMITAILQSRLARTSFDKN-RFQNISEKLHMECKAEMVTPLVT
.::... . . ::..... . :.:
CCDS31 IPNKYLLRDRQKSEDVVKPPLSYLFEDKTHSSFSSTVKDKAASESIRVNRRCISVAPSRE
2970 2980 2990 3000 3010 3020
240 250 260 270 280
pF1KE2 NPGHVCITDTNLYF-----------QPLNGYPKPV-VQITLQDVRRIYKRRHGLMPLGLE
. :.. . ..:: . :.: .:. . : .......:: : ..:
CCDS31 TAGELLLGKCGMYFVEDNASDTVESSSLQGELEPASFSWTYEEIKEVHKRWWQLRDNAVE
3030 3040 3050 3060 3070 3080
290 300 310 320 330 340
pF1KE2 VFCTEDDLCSDIYLKFYEPQDRDDLYFYIATYLEHHVAEHTAESYMLQ-WQRGHLSNYQY
.: :. . : : . . :::.: : : .. :. . . . : :...:..:
CCDS31 IFLTNG---RTLLLAFDNTKVRDDVYHNILTNNLPNLLEYGNITALTNLWYTGQITNFEY
3090 3100 3110 3120 3130 3140
350 360 370 380 390 400
pF1KE2 LLHLNNLADRSCNDLSQYPVFPWIIHDYSSSELDLSNPGTFRDLSKPVGALNKERLERLL
: :::. : :: ::: ::::::.:. :: : :::.. .:.::::... ::. .: .
CCDS31 LTHLNKHAGRSFNDLMQYPVFPFILADYVSETLDLNDLLIYRNLSKPIAVQYKEKEDRYV
3150 3160 3170 3180 3190 3200
410 420 430 440
pF1KE2 TRYQEM------------PEPK---FMYGSHYSSPGYVLFYLVRIAP--EYMLCLQNGRF
:. . : : . ::::::. : :: .:::. : ...: :. :
CCDS31 DTYKYLEEEYRKGAREDDPMPPVQPYHYGSHYSNSGTVLHFLVRMPPFTKMFLAYQDQSF
3210 3220 3230 3240 3250 3260
450 460 470 480 490 500
pF1KE2 DNADRMFNSIAETWK-NCLDGATDFKELIPEFYGDDVSFLVNSLKLDLGKRQGGQMVDDV
: :: :.: ::. . ... :: :::::::. :::: .:.: ::.:. :. :
CCDS31 DIPDRTFHSTNTTWRLSSFESMTDVKELIPEFFYLP-EFLVNREGFDFGVRQNGERVNHV
3270 3280 3290 3300 3310 3320
510 520 530 540 550 560
pF1KE2 ELPPWA-SSPEDFLQKSKDALESNYVSEHLHEWIDLIFGYKQKGSDAVGAHNVFHPLTYE
.::::: ..:. :. ..::::.:::... .::::.:::::::. .: : ::::: ::
CCDS31 NLPPWARNDPRLFILIHRQALESDYVSQNICQWIDLVFGYKQKGKASVQAINVFHPATYF
3330 3340 3350 3360 3370 3380
570 580 590 600 610 620
pF1KE2 GGVDLNSIQDPDEKVAMLTQILEFGQTPKQLFVTPHPRRITPKFKSLSQTSSYNASMADS
: .:.....:: .. :. :.: .::::.::: : : :.. .. . . ...
CCDS31 G-MDVSAVEDPVQRRALETMIKTYGQTPRQLFHMAHVSRPGAKLNIEGELPAAVGLLVQF
3390 3400 3410 3420 3430 3440
630 640 650 660 670 680
pF1KE2 PGEESFEDLTEES--KTLAWNNITKLQLHEHYKIHKEAVTGITVSRNGSSVFTTSQDSTL
.:. :.. : . . :.: : :. :. . : . :. . : . :
CCDS31 AFRETREQVKEITYPSPLSW--IKGLKWGEYVGSPSAPVPVVCFSQPHGERFGSLQALPT
3450 3460 3470 3480 3490 3500
690 700 710 720 730 740
pF1KE2 KMFSKESKMLQRSISFSN-MALSSCLLLPGDATVITSSW---DNNVYFYSIAFGRRQDTL
. . :. . ...:. ... : . ..: : : :: . . : . .
CCDS31 RAICGLSRNFCLLMTYSKEQGVRSMNSTDIQWSAILS-WGYADNILRLKSKQSEPPVNFI
3510 3520 3530 3540 3550 3560
750 760 770 780 790
pF1KE2 MGHDD-AVSKICWHDN--RLYSASWDSTVKVW-----SGVPAEMPGTKRHHFDLLAELEH
.. .. :.. : . .:...: ... .. :..:.:. . :. :
CCDS31 QSSQQYQVTSCAWVPDSCQLFTGSKCGVITAYTNRFTSSTPSEIEMETQIHL-----YGH
3570 3580 3590 3600 3610
800 810 820 830 840 850
pF1KE2 DVSVDTISLNAASTLLVSGTKEGTVNIWDLTTATLMHQIPCHSGIVCDTAFSPDSRHVLS
. .. . ..:.: ...:: ::::. .... :.. : .. : : . .
CCDS31 TEEITSLFVCKPYSILISVSRDGTCIIWDLNRLCYVQSLAGHKSPVTAVSASETSGDIAT
3620 3630 3640 3650 3660 3670
860 870 880 890 900
pF1KE2 T------GTDGCLNVID------VQTGMLISSMT-SDEPQRCFVWDGNSVLSGSQSGELL
. :.: : ... :. .: :.. :..:. . : . .: ..: .
CCDS31 VCDSAGGGSDLRLWTVNGDLVGHVHCREIICSVAFSNQPEGVSI---NVIAGGLENGIVR
3680 3690 3700 3710 3720 3730
910 920 930 940
pF1KE2 VWDLLGAKISERIQGHTGAVTCIWMNEQCSS--IITGGEDRQIIFWKLQY
.:. : ..: . : .. .:.. . :.. : .: :
CCDS31 LWSTWDLKPVREITFPKSNKPIISLTFSCDGHHLYTANSDGTVIAWCRKDQQRLKQPMFY
3740 3750 3760 3770 3780 3790
CCDS31 SFLSSYAAG
3800
948 residues in 1 query sequences
18921897 residues in 33420 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Oct 24 21:30:45 2019 done: Thu Oct 24 21:30:45 2019
Total Scan time: 2.110 Total Display time: 0.230
Function used was FASTA [36.3.4 Apr, 2011]