FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE9392, 1278 aa
1>>>pF1KE9392 1278 - 1278 aa - 1278 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.4887+/-0.000993; mu= -0.7818+/- 0.060
mean_var=229.2414+/-46.742, 0's: 0 Z-trim(112.7): 34 B-trim: 70 in 1/52
Lambda= 0.084709
statistics sampled from 13385 (13413) to 13385 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.412), width: 16
Scan time: 3.990
The best scores are: opt bits E(32554)
CCDS78510.1 AFF2 gene_id:2334|Hs108|chrX (1276) 8448 1046.1 0
CCDS76040.1 AFF2 gene_id:2334|Hs108|chrX (1276) 8400 1040.2 0
CCDS55521.1 AFF2 gene_id:2334|Hs108|chrX ( 952) 6150 765.2 0
CCDS14684.1 AFF2 gene_id:2334|Hs108|chrX (1311) 6048 752.8 1.3e-216
CCDS4164.1 AFF4 gene_id:27125|Hs108|chr5 (1163) 999 135.7 6.6e-31
CCDS42723.1 AFF3 gene_id:3899|Hs108|chr2 (1226) 771 107.9 1.7e-22
CCDS33258.1 AFF3 gene_id:3899|Hs108|chr2 (1251) 771 107.9 1.7e-22
CCDS54775.1 AFF1 gene_id:4299|Hs108|chr4 (1218) 761 106.7 3.9e-22
CCDS3616.1 AFF1 gene_id:4299|Hs108|chr4 (1210) 751 105.4 9.1e-22
>>CCDS78510.1 AFF2 gene_id:2334|Hs108|chrX (1276 aa)
initn: 6392 init1: 6392 opt: 8448 Z-score: 5587.5 bits: 1046.1 E(32554): 0
Smith-Waterman score: 8448; 99.8% identity (99.8% similar) in 1278 aa overlap (1-1278:1-1276)
10 20 30 40 50 60
pF1KE9 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKTNKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKTNKG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE9 DALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKNRIIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 DALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKNRIIP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE9 PHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNKMQTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 PHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNKMQTL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE9 TQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPEESEF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 TQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPEESEF
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE9 AVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPDISPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 AVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPDISPT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE9 LKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEILRES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 LKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEILRES
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE9 QHLTPGFTLQKWNDPTTRASTKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 QHLTPGFTLQKWNDPTTRASTKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQ
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE9 AVEKAKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 AVEKAKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE9 RVATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 RVATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE9 TNASQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQRTIGKKQPKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 TNASQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQRTIGKKQPKK
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE9 VEKNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIPLAPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 VEKNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIPLAPE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE9 KKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEICGAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 KKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEICGAS
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE9 LTLSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLLSRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 LTLSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLLSRV
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE9 PGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 PGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEE
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE9 ATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 ATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGN
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE9 NGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNTAIAT
:::::::::::::::::::::::::::::::::::: ::::::::::::::::::::::
CCDS78 NGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGIS--EGDTPKKASSATITVTNTAIAT
910 920 930 940 950
970 980 990 1000 1010 1020
pF1KE9 ATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALPLLSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 ATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALPLLSS
960 970 980 990 1000 1010
1030 1040 1050 1060 1070 1080
pF1KE9 SSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTECGNAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 SSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTECGNAM
1020 1030 1040 1050 1060 1070
1090 1100 1110 1120 1130 1140
pF1KE9 ERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLRMFKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 ERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLRMFKL
1080 1090 1100 1110 1120 1130
1150 1160 1170 1180 1190 1200
pF1KE9 KKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 KKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPV
1140 1150 1160 1170 1180 1190
1210 1220 1230 1240 1250 1260
pF1KE9 TIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSSMTNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS78 TIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSSMTNL
1200 1210 1220 1230 1240 1250
1270
pF1KE9 VRYVRQGLCWLRIDAHLL
::::::::::::::::::
CCDS78 VRYVRQGLCWLRIDAHLL
1260 1270
>>CCDS76040.1 AFF2 gene_id:2334|Hs108|chrX (1276 aa)
initn: 6246 init1: 5848 opt: 8400 Z-score: 5555.8 bits: 1040.2 E(32554): 0
Smith-Waterman score: 8400; 99.2% identity (99.2% similar) in 1282 aa overlap (1-1278:1-1276)
10 20 30 40 50
pF1KE9 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYK----
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKVAEY
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE9 TNKGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 TNKGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKN
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE9 RIIPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RIIPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE9 MQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPE
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE9 ESEFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ESEFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPD
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE9 ISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEI
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE9 LRESQHLTPGFTLQKWNDPTTRASTKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTAT
:::::::::::::::::::::::::: ::::::::::::::::::::::::::::
CCDS76 LRESQHLTPGFTLQKWNDPTTRASTK------MLEDDLKLSSDEDDLEPVKTLTTQCTAT
370 380 390 400 410
420 430 440 450 460 470
pF1KE9 ELYQAVEKAKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ELYQAVEKAKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSES
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE9 NEAPRVATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPMEVQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 NEAPRVATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPMEVQ
480 490 500 510 520 530
540 550 560 570 580 590
pF1KE9 MKVKTNASQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQRTIGKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MKVKTNASQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQRTIGKK
540 550 560 570 580 590
600 610 620 630 640 650
pF1KE9 QPKKVEKNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 QPKKVEKNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIP
600 610 620 630 640 650
660 670 680 690 700 710
pF1KE9 LAPEKKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LAPEKKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEI
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE9 CGASLTLSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 CGASLTLSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDL
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE9 LSRVPGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LSRVPGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQ
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE9 RLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 RLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRN
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE9 VSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 VSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNT
900 910 920 930 940 950
960 970 980 990 1000 1010
pF1KE9 AIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 AIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALP
960 970 980 990 1000 1010
1020 1030 1040 1050 1060 1070
pF1KE9 LLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTEC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 LLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTEC
1020 1030 1040 1050 1060 1070
1080 1090 1100 1110 1120 1130
pF1KE9 GNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 GNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLR
1080 1090 1100 1110 1120 1130
1140 1150 1160 1170 1180 1190
pF1KE9 MFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 MFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCN
1140 1150 1160 1170 1180 1190
1200 1210 1220 1230 1240 1250
pF1KE9 NGPVTIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 NGPVTIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSS
1200 1210 1220 1230 1240 1250
1260 1270
pF1KE9 MTNLVRYVRQGLCWLRIDAHLL
::::::::::::::::::::::
CCDS76 MTNLVRYVRQGLCWLRIDAHLL
1260 1270
>>CCDS55521.1 AFF2 gene_id:2334|Hs108|chrX (952 aa)
initn: 6148 init1: 6148 opt: 6150 Z-score: 4071.8 bits: 765.2 E(32554): 0
Smith-Waterman score: 6150; 99.0% identity (99.5% similar) in 946 aa overlap (333-1278:10-952)
310 320 330 340 350 360
pF1KE9 PSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEILRESQH
.:.: .. :::::::::::::::::::
CCDS55 MKFKRRHQAFPSFFKMK---VSLPSDPSCVEEILRESQH
10 20 30
370 380 390 400 410 420
pF1KE9 LTPGFTLQKWNDPTTRASTKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LTPGFTLQKWNDPTTRASTKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAV
40 50 60 70 80 90
430 440 450 460 470 480
pF1KE9 EKAKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 EKAKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRV
100 110 120 130 140 150
490 500 510 520 530 540
pF1KE9 ATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVKTN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ATPEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVKTN
160 170 180 190 200 210
550 560 570 580 590 600
pF1KE9 ASQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQRTIGKKQPKKVE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ASQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQRTIGKKQPKKVE
220 230 240 250 260 270
610 620 630 640 650 660
pF1KE9 KNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIPLAPEKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIPLAPEKK
280 290 300 310 320 330
670 680 690 700 710 720
pF1KE9 KYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEICGASLT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 KYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEICGASLT
340 350 360 370 380 390
730 740 750 760 770 780
pF1KE9 LSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LSTLMSSSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPG
400 410 420 430 440 450
790 800 810 820 830 840
pF1KE9 HSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEAT
460 470 480 490 500 510
850 860 870 880 890 900
pF1KE9 TICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNG
520 530 540 550 560 570
910 920 930 940 950 960
pF1KE9 PFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNTAIATAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 PFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNTAIATAT
580 590 600 610 620 630
970 980 990 1000 1010 1020
pF1KE9 VTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALPLLSSSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALPLLSSSS
640 650 660 670 680 690
1030 1040 1050 1060 1070 1080
pF1KE9 TNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTECGNAMER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 TNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTECGNAMER
700 710 720 730 740 750
1090 1100 1110 1120 1130 1140
pF1KE9 DPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKK
760 770 780 790 800 810
1150 1160 1170 1180 1190 1200
pF1KE9 DHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPVTI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 DHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPVTI
820 830 840 850 860 870
1210 1220 1230 1240 1250 1260
pF1KE9 PQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSSMTNLVR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 PQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSSMTNLVR
880 890 900 910 920 930
1270
pF1KE9 YVRQGLCWLRIDAHLL
::::::::::::::::
CCDS55 YVRQGLCWLRIDAHLL
940 950
>>CCDS14684.1 AFF2 gene_id:2334|Hs108|chrX (1311 aa)
initn: 6446 init1: 6048 opt: 6048 Z-score: 4002.2 bits: 752.8 E(32554): 1.3e-216
Smith-Waterman score: 8381; 97.5% identity (97.5% similar) in 1310 aa overlap (2-1278:2-1311)
10 20 30 40 50
pF1KE9 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYK----
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKVAEY
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE9 TNKGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 TNKGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKN
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE9 RIIPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 RIIPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE9 MQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPE
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE9 ESEFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ESEFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPD
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE9 ISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEI
310 320 330 340 350 360
360 370 380
pF1KE9 LRE-----------------------------SQHLTPGFTLQKWNDPTTRASTKSVSFK
::: ::::::::::::::::::::::::::::
CCDS14 LREMTHSWPTPLTSMHTAGHSEQSTFSIPGQESQHLTPGFTLQKWNDPTTRASTKSVSFK
370 380 390 400 410 420
390 400 410 420 430 440
pF1KE9 SMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNPVNPPLATPQPPPAVQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNPVNPPLATPQPPPAVQA
430 440 450 460 470 480
450 460 470 480 490 500
pF1KE9 SGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLNKVTSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLNKVTSQ
490 500 510 520 530 540
510 520 530 540 550 560
pF1KE9 NKSFICGQNETPMETISLPPPIIQPMEVQMKVKTNASQVPAEPKERPLLSLIREKARPRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NKSFICGQNETPMETISLPPPIIQPMEVQMKVKTNASQVPAEPKERPLLSLIREKARPRP
550 560 570 580 590 600
570 580 590 600 610 620
pF1KE9 TQKIPETKALKHKLSTTSETVSQRTIGKKQPKKVEKNTSTDEFTWPKPNITSSTPKEKES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 TQKIPETKALKHKLSTTSETVSQRTIGKKQPKKVEKNTSTDEFTWPKPNITSSTPKEKES
610 620 630 640 650 660
630 640 650 660 670 680
pF1KE9 VELHDPPRGRNKATAHKPAPRKEPRPNIPLAPEKKKYRGPGKIVPKSREFIETDSSTSDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VELHDPPRGRNKATAHKPAPRKEPRPNIPLAPEKKKYRGPGKIVPKSREFIETDSSTSDS
670 680 690 700 710 720
690 700 710 720 730 740
pF1KE9 NTDQEETLQIKVLPPCIISGGNTAKSKEICGASLTLSTLMSSSGSNNNLSISNEEPTFSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NTDQEETLQIKVLPPCIISGGNTAKSKEICGASLTLSTLMSSSGSNNNLSISNEEPTFSP
730 740 750 760 770 780
750 760 770 780 790 800
pF1KE9 IPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPGHSSLHAAPAKPDHKETATKPKRQTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 IPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPGHSSLHAAPAKPDHKETATKPKRQTA
790 800 810 820 830 840
810 820 830 840 850 860
pF1KE9 VTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEATTICLLPPCISPAPPHKPPNTRENNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEATTICLLPPCISPAPPHKPPNTRENNS
850 860 870 880 890 900
870 880 890 900 910 920
pF1KE9 SRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNGPFGQDKNIAMTGQITSTKPKRTEGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNGPFGQDKNIAMTGQITSTKPKRTEGK
910 920 930 940 950 960
930 940 950 960 970 980
pF1KE9 FCATFKGISVNEGDTPKKASSATITVTNTAIATATVTATAIVTTTVTATATATATTTTTT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 FCATFKGISVNEGDTPKKASSATITVTNTAIATATVTATAIVTTTVTATATATATTTTTT
970 980 990 1000 1010 1020
990 1000 1010 1020 1030 1040
pF1KE9 TTISTITSTITTGLMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDDSVHNADYYMQEAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 TTISTITSTITTGLMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDDSVHNADYYMQEAK
1030 1040 1050 1060 1070 1080
1050 1060 1070 1080 1090 1100
pF1KE9 KLKHKADALFEKFGKAVNYADAALSFTECGNAMERDPLEAKSPYTMYSETVELLRYAMRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 KLKHKADALFEKFGKAVNYADAALSFTECGNAMERDPLEAKSPYTMYSETVELLRYAMRL
1090 1100 1110 1120 1130 1140
1110 1120 1130 1140 1150 1160
pF1KE9 KNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQNASKVAQIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 KNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQNASKVAQIP
1150 1160 1170 1180 1190 1200
1170 1180 1190 1200 1210 1220
pF1KE9 SPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPVTIPQRIHHMAASHVNITSNVLRGYEHW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 SPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPVTIPQRIHHMAASHVNITSNVLRGYEHW
1210 1220 1230 1240 1250 1260
1230 1240 1250 1260 1270
pF1KE9 DMADKLTRENKEFFGDLDTLMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 DMADKLTRENKEFFGDLDTLMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL
1270 1280 1290 1300 1310
>>CCDS4164.1 AFF4 gene_id:27125|Hs108|chr5 (1163 aa)
initn: 1642 init1: 586 opt: 999 Z-score: 668.3 bits: 135.7 E(32554): 6.6e-31
Smith-Waterman score: 2051; 36.0% identity (60.6% similar) in 1316 aa overlap (20-1278:4-1162)
10 20 30 40 50
pF1KE9 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYK-TNK
.::..:. .: ::::::.:: .: : . ::.:::: :.:
CCDS41 MNREDRNVLRMKERERRNQEIQQGEDAFPPSSPLFAEPYKVTSK
10 20 30 40
60 70 80 90 100 110
pF1KE9 GDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKNRII
: :..:.:. ::::::::... ..: . ::.::: .:: . ..:..:.:: ::..
CCDS41 EDKLSSRIQSMLGNYDEMKDFIGDRSIPK-LVAIPKPTVPPSADEKSNPNFF-EQRHG--
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE9 PPHQDNT-HPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNKMQ
::.. : .: : : :. ..:...:. : : . :. ....::: . .
CCDS41 GSHQSSKWTPVGPAPSTSQSQKRSSGLQSGHSSQ----RTSAGSSS--GTNSSGQRHDRE
110 120 130 140 150
180 190 200 210 220 230
pF1KE9 TLTQDQSQAKLEDFFVYPAEQPQIGEVEESNP---SAKEDSNPNSSGEDAF-KEIFQSNS
. ... :... . . .:. . ..: :. ..:. : :.: :: .:.:
CCDS41 SYNNSGSSSRKKG--QHGSEHSKSRSSSPGKPQAVSSLNSSHSRSHGNDHHSKEHQRSKS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE9 PEESEFAVQAPGSPLVASSLLAPSSGL-SVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQ
:.. . ..: : . ::: :.:.:::.:. :.. :::::::::::::..
CCDS41 PRDPDANWDSP-------SRVPFSSGQHSTQSFPPSLMSKSNSMLQKPTAYVRPMDGQES
220 230 240 250 260
300 310 320 330 340 350
pF1KE9 APDISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTI-LQTSEVSLPSDPSC
. : :. .: :: .. . ::: ::..: :. : : ..: .: ::
CCDS41 ---MEPKLSSEHYSSQSHGN----SMTELKPS---SKAHLTKLKIPSQPLDASASGDVSC
270 280 290 300 310
360 370 380
pF1KE9 VEEILRESQHLTP-----------------------------GFTLQKWNDPTTRASTKS
:.:::.: : : : :: .:. ..:.
CCDS41 VDEILKEMTHSWPPPLTAIHTPCKTEPSKFPFPTKESQQSNFGTGEQKRYNPS-KTSNGH
320 330 340 350 360 370
390 400 410 420 430 440
pF1KE9 VSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNP-VNPPLATPQPP
: ::::.:::::::.:: .. : .:. ::..: : . .
CCDS41 QS-KSMLKDDLKLSSSED--------------SDGEQDCDKTMPRSTPGSNSEPSHHNSE
380 390 400 410
450 460 470 480 490 500
pF1KE9 PAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLN
: .. :.: : ::::: :::..:::..:::.:: . :.:::::: :::::::.:::
CCDS41 GADNSRDDSSSHSGSESSSGSDSESESSSSDSEANEPSQSASPEPEPPPTNKWQLDNWLN
420 430 440 450 460 470
510 520 530 540 550 560
pF1KE9 KVTSQNKSFICGQNETPMETISLPPPIIQPMEVQMKVK-TNASQVPAE-PKERPLLSLIR
::. .. : : ... : : .. . . . :. : . . ::: . :
CCDS41 KVNPHKVS--------PASSVDSNIPSSQGYKKEGREQGTGNSYTDTSGPKETSSATPGR
480 490 500 510 520 530
570 580 590 600 610
pF1KE9 EKARPRPTQKIPETKALKHKLSTTSETVSQR-TIGKKQPKKVEKNTSTDEFTWPKPN--I
.. . :: :. ..: . :....:: :.:::::::.:: .. . :. . :
CCDS41 DS---KTIQKGSESGRGRQKSPAQSDSTTQRRTVGKKQPKKAEKAAAEE----PRGGLKI
540 550 560 570 580
620 630 640 650 660 670
pF1KE9 TSSTPKEKESVELHDPPRGRNKAT---AHKPAPRKEPRPNIPLAPEKKKYRGPGKIVPKS
: :: . : . : .:.::. ..:: .:: . . . :::::.. .: ::
CCDS41 ESETPVDLAS----SMPSSRHKAATKGSRKPNIKKESKSSPRPTAEKKKYKSTSKSSQKS
590 600 610 620 630 640
680 690 700 710 720 730
pF1KE9 REFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEICGASLTLSTLMSSSGSNN
::.::::.:.::: :. :.: :: ...: : : . : .. :. ..
CCDS41 REIIETDTSSSDS--DESESL-----PP----SSQTPKYPE------SNRTPVKPSSVEE
650 660 670 680
740 750 760 770 780 790
pF1KE9 NLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPGHSSLHAAPAKPD
. :. .. :::. . :.:::: . .. : :::::.::.:.::. .. : : .
CCDS41 EDSFFRQR-MFSPME--EKELLSPLSEPDDRYPLIVKIDLNLLTRIPGKPYKETEPPKGE
690 700 710 720 730 740
800 810 820 830 840 850
pF1KE9 HKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEATTICLLPPCISPA
.:.. : :.. : :: . ::::::: . . :: . :. ..
CCDS41 KKNVPEKHTREAQKQASEKVSNKGKRKHKNEDDNRASESKKPKTEDKNSA----------
750 760 770 780 790
860 870 880 890 900 910
pF1KE9 PPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNGPFGQDKNIAMTG
::: ..::.... : ::. :.: : .:.: :. .. : . ..:....
CCDS41 -GHKPSSNRESSKQSAA---KEKDLLPSPAGPVPSKDPKTEHGS-------RKRTISQSS
800 810 820 830
920 930 940 950 960 970
pF1KE9 QITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNTAIATATVTATAIVTTTVT
.. :.. . : .: : : ..: :. .. : ... :
CCDS41 SLKSSSNSNKET------SGSSKNSSSTSKQKKTEGKTSSSSK--------------EVK
840 850 860 870
980 990 1000 1010 1020 1030
pF1KE9 ATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDD
: ..... .. : :.::. :: ::.:::
CCDS41 EKAPSSSSNCPPSA---------------------------PTLDSSKP--RRTKLVFDD
880 890 900 910
1040 1050 1060 1070 1080 1090
pF1KE9 SVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTECGNAMERDPLEAKSPYTMY
..::.:.::::::::.:::: ..: ::: : ::..:: :::::.:.. :.:::. ::
CCDS41 RNYSADHYLQEAKKLKHNADALSDRFEKAVYYLDAVVSFIECGNALEKNAQESKSPFPMY
920 930 940 950 960 970
1100 1110 1120 1130 1140 1150
pF1KE9 SETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLME
::::.:..:.:.:::. .: :. .::.:.::: :: ::::::.:::::..:.:::..: :
CCDS41 SETVDLIKYTMKLKNYLAPDATAADKRLTVLCLRCESLLYLRLFKLKKENALKYSKTLTE
980 990 1000 1010 1020 1030
1160 1170 1180 1190 1200
pF1KE9 YFKQNASKVAQIPSPWV-SNGKNTPSPVSLNNVSPINAMGNCNNGP---------VTIPQ
..: :. . .: ::: . :.. . ::::: ..:: :. :: ..: :::::
CCDS41 HLK-NSYNNSQAPSPGLGSKAVGMPSPVS-PKLSPGNS-GNYSSGASSASASGSSVTIPQ
1040 1050 1060 1070 1080
1210 1220 1230 1240 1250 1260
pF1KE9 RIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDTLMGPLTQHSS-MTNLVRY
.::.::::.:..::: : . : ::.:..:..:.::::..:: .:::: ..: ::.::::
CCDS41 KIHQMAASYVQVTSNFLYATEIWDQAEQLSKEQKEFFAELDKVMGPLIFNASIMTDLVRY
1090 1100 1110 1120 1130 1140
1270
pF1KE9 VRQGLCWLRIDAHLL
.:::: ::: ::.:.
CCDS41 TRQGLHWLRQDAKLIS
1150 1160
>>CCDS42723.1 AFF3 gene_id:3899|Hs108|chr2 (1226 aa)
initn: 2311 init1: 660 opt: 771 Z-score: 517.4 bits: 107.9 E(32554): 1.7e-22
Smith-Waterman score: 2490; 37.8% identity (60.6% similar) in 1357 aa overlap (1-1277:1-1225)
10 20 30 40 50
pF1KE9 MDLFDF--FRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKTN
:: ::. ...::::. : :: ::.::...: ::::::.::.: :.:...::.::::::
CCDS42 MDSFDLALLQEWDLESLCVYEPDRNALRRKERERRNQETQQDDGTFNSSYSLFSEPYKTN
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE9 KGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKNRI
::: :.::.:::::::::::..::..:::.::::.:: .:::.: :: . : ... .
CCDS42 KGDELSNRIQNTLGNYDEMKDFLTDRSNQSHLVGVPKPGVPQTPVNKIDEHFVADSRAQN
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE9 IPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNKMQ
: .: :.: : ....... :.. .: :: ..: . : ....
CCDS42 QPSSICSTTTSTPAAVP---------VQQSKRGTMGWQKAGHPPSD--GQQRATQQGSLR
130 140 150 160
180 190 200 210 220 230
pF1KE9 TLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPEES
:: : .:. ..: ::. :
CCDS42 TLLGDG-----------------VGR---QQPRAKQVCN--------------------V
170 180
240 250 260 270 280 290
pF1KE9 EFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPDIS
: ..:. : : . ::: ::::::.: : :. ::::::::::::::::::: :
CCDS42 EVGLQTQERP-PAMAAKHSSSGHCVQNFPPSLASKPSLVQQKPTAYVRPMDGQDQAPDES
190 200 210 220 230 240
300 310 320 330 340 350
pF1KE9 PTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDP-SCVEEIL
: :: : : .: :. . .:: : .:.:: ::.: . .: : .. ::::::.
CCDS42 PKLKSSSE--TSVHCTSYRGVPASKPEPARAKAKLSKFSIPKQGEESRSGETNSCVEEII
250 260 270 280 290 300
360 370 380 390
pF1KE9 RE---------------------------SQHLTPGFTLQKWNDPTTRASTKSVSFKSML
:: :: .. : . : .: .. ...: :::
CCDS42 REMTWLPPLSAIQAPGKVEPTKFPFPNKDSQLVSSGHNNPKKGDAEPESPDNGTSNTSML
310 320 330 340 350 360
400 410 420 430 440 450
pF1KE9 EDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNPVNPPLATPQPPPAVQASGG
::::::::::.. : . : : .:.. . :.. . . . . ..::.
CCDS42 EDDLKLSSDEEENEQQAAQRTALRALSDSAVVQQPNCRTS-----VPSSKGSSSSSSSGS
370 380 390 400 410 420
460 470 480 490 500 510
pF1KE9 SGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLNKVTSQNKS
:.:::.::::: :::.::::...::... :. ..:: :: :.:::::::::::: . .:
CCDS42 SSSSSDSESSSGSDSETESSSSESEGSKPPHFSSPEAEPASSNKWQLDKWLNKV-NPHKP
430 440 450 460 470 480
520 530 540 550 560
pF1KE9 FICGQNETP-METISLPPPIIQPMEVQMKVKTNASQVPAEPKERPLLSLIREKARPRPTQ
: :::. :. . :. . .. :: .. : :. .:. . : .:. ::: ..
CCDS42 PILIQNESHGSESNQYYNPVKEDVQDCGKVP-DVCQ-PSL-REKEIKSTCKEEQRPRTAN
490 500 510 520 530
570 580 590 600
pF1KE9 KIPETKALKHKLSTTSETVS----------------------QRTIGKKQPKKVEKNTST
: : .:..:.: .. .:. .:. ::: ...:....
CCDS42 KAPGSKGVKQKSPPAAVAVAVSAAAPPPAVPCAPAENAPAPARRSAGKKPTRRTERTSAG
540 550 560 570 580 590
610 620 630 640 650 660
pF1KE9 DEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIPLAPEKKKYRGP
: . .:. ... :: . : .. . ::: : .. ::.. ::
CCDS42 DGANCHRPEEPAAADALGTSVVVPPEPTKTRPCGNNRASHRKELRSSVTC--EKRRTRGL
600 610 620 630 640 650
670 680 690 700 710
pF1KE9 GKIVPKSREFIETDSSTSDSNTD------QEE-TLQIKVLPPCIISGGNTAKSKEIC--G
..:::::.:::::.::.:.:..: ::: :. :.:: . :: :
CCDS42 SRIVPKSKEFIETESSSSSSSSDSDLESEQEEYPLSKAQTVAASASSGNDQRLKEAAANG
660 670 680 690 700 710
720 730 740 750 760 770
pF1KE9 ASLTLSTLMS-SSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDLL
.: . . : .. ...... :: .. .: ..:.::::.: .....::::::: ::
CCDS42 GSGPRAPVGSINARTTSDIAKELEEQFYTLVPFGRNELLSPLKDSDEIRSLWVKIDLTLL
720 730 740 750 760 770
780 790 800 810 820 830
pF1KE9 SRVPGHSSLHAAP---AKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEK
::.: : : : . : :.. . : .:. : .:: ::.:::.: . . :
CCDS42 SRIPEH--LPQEPGVLSAPATKDSESAPPSHTSDTPAEKALPKSKRKRK-CDNEDDYREI
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE9 KQRLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRR
:. : . : : . . : :. . : :.::.. :.::: . ..
CCDS42 KKSQGEKDSSSRLATSTSNTLSANHCNMNINSVAIPIN--KNEKMLRSPISPLSDASKHK
840 850 860 870 880 890
900 910 920 930 940 950
pF1KE9 ---RNVSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATI
....... : : : .:. .: ::: . .. . :: : : . .
CCDS42 YTSEDLTSSSRPNG---NSLFTSASSSKKPKAD--------SQLQPHGGDLTKAAHNNSE
900 910 920 930
960 970 980 990 1000 1010
pF1KE9 TVTNTAIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTS
.. . .:. .
CCDS42 NIP-----------------------------------------------LHKSRPQTKP
940 950
1020 1030 1040 1050 1060 1070
pF1KE9 WAALPLLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAAL
:. : :.. . .: ::.::: ..:::.:::::..::::::. ::::::.:::.:::
CCDS42 WS--PG-SNGHRDCKRQKLVFDDMPRSADYFMQEAKRMKHKADAMVEKFGKALNYAEAAL
960 970 980 990 1000
1080 1090 1100 1110 1120 1130
pF1KE9 SFTECGNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLS
:: :::::::. :.:.:::::::::::::.:::::::. ..: :. ::.::.::::::.
CCDS42 SFIECGNAMEQGPMESKSPYTMYSETVELIRYAMRLKTHSGPNATPEDKQLAALCYRCLA
1010 1020 1030 1040 1050 1060
1140 1150 1160 1170 1180
pF1KE9 LLYLRMFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNT--PSPVSLNN--VS
::: :::.::.:::.:::..:..::: :.::.:: :::: ..::.: :::.: : .:
CCDS42 LLYWRMFRLKRDHAVKYSKALIDYFK-NSSKAAQAPSPWGASGKSTGTPSPMSPNPSPAS
1070 1080 1090 1100 1110 1120
1190 1200 1210 1220 1230 1240
pF1KE9 PINAMGNCNNG----P---VTIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEF
....:. .:. : :.::::::.:::.::.::...:..:..:.:::.:..::.::
CCDS42 SVGSQGSLSNASALSPSTIVSIPQRIHQMAANHVSITNSILHSYDYWEMADNLAKENREF
1130 1140 1150 1160 1170 1180
1250 1260 1270
pF1KE9 FGDLDTLMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL
:.::: ::::.: :::: .::.: .::: ::: .:::
CCDS42 FNDLDLLMGPVTLHSSMEHLVQYSQQGLHWLRNSAHLS
1190 1200 1210 1220
>>CCDS33258.1 AFF3 gene_id:3899|Hs108|chr2 (1251 aa)
initn: 2265 init1: 660 opt: 771 Z-score: 517.2 bits: 107.9 E(32554): 1.7e-22
Smith-Waterman score: 2430; 37.7% identity (60.5% similar) in 1338 aa overlap (18-1277:45-1250)
10 20 30 40
pF1KE9 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSG
:: ::.::...: ::::::.::.: :.:.
CCDS33 ESLWGEDILNQRNDSLVVEFQSSASRCRSVYEPDRNALRRKERERRNQETQQDDGTFNSS
20 30 40 50 60 70
50 60 70 80 90 100
pF1KE9 FDLFGEPYKTNKGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNE
..::.::::::::: :.::.:::::::::::..::..:::.::::.:: .:::.: :: .
CCDS33 YSLFSEPYKTNKGDELSNRIQNTLGNYDEMKDFLTDRSNQSHLVGVPKPGVPQTPVNKID
80 90 100 110 120 130
110 120 130 140 150 160
pF1KE9 PSFFPEQKNRIIPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLA
: ... . : .: :.: : ....... :.. .: :: .
CCDS33 EHFVADSRAQNQPSSICSTTTSTPAAVP---------VQQSKRGTMGWQKAGHPPSD--G
140 150 160 170 180
170 180 190 200 210 220
pF1KE9 SQASGQPNKMQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFK
.: . : ....:: : .:. ..: ::. :
CCDS33 QQRATQQGSLRTLLGDG-----------------VGR---QQPRAKQVCN----------
190 200 210
230 240 250 260 270 280
pF1KE9 EIFQSNSPEESEFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRP
: ..:. : : . ::: ::::::.: : :. ::::::::::
CCDS33 ----------VEVGLQTQERP-PAMAAKHSSSGHCVQNFPPSLASKPSLVQQKPTAYVRP
220 230 240 250 260
290 300 310 320 330 340
pF1KE9 MDGQDQAPDISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLP
::::::::: :: :: : :.: :. . .:: : .:.:: ::.: . .: :
CCDS33 MDGQDQAPDESPKLKSSS--ETSVHCTSYRGVPASKPEPARAKAKLSKFSIPKQGEESRS
270 280 290 300 310 320
350 360 370
pF1KE9 SDP-SCVEEILRE---------------------------SQHLTPGFTLQKWNDPTTRA
.. ::::::.:: :: .. : . : .: ..
CCDS33 GETNSCVEEIIREMTWLPPLSAIQAPGKVEPTKFPFPNKDSQLVSSGHNNPKKGDAEPES
330 340 350 360 370 380
380 390 400 410 420 430
pF1KE9 STKSVSFKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNPVNPPLATP
...: :::::::::::::.. : . : : .:.. . :.. . .
CCDS33 PDNGTSNTSMLEDDLKLSSDEEENEQQAAQRTALRALSDSAVVQQPNCRTS-----VPSS
390 400 410 420 430
440 450 460 470 480 490
pF1KE9 QPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDK
. . ..::.:.:::.::::: :::.::::...::... :. ..:: :: :.:::::::
CCDS33 KGSSSSSSSGSSSSSSDSESSSGSDSETESSSSESEGSKPPHFSSPEAEPASSNKWQLDK
440 450 460 470 480 490
500 510 520 530 540 550
pF1KE9 WLNKVTSQNKSFICGQNETP-METISLPPPIIQPMEVQMKVKTNASQVPAEPKERPLLSL
::::: . .: : :::. :. . :. . .. :: .. : :. .:. . :
CCDS33 WLNKV-NPHKPPILIQNESHGSESNQYYNPVKEDVQDCGKVP-DVCQ-PSL-REKEIKST
500 510 520 530 540 550
560 570 580 590
pF1KE9 IREKARPRPTQKIPETKALKHKLSTTSETVS----------------------QRTIGKK
.:. ::: ..: : .:..:.: .. .:. .:. :::
CCDS33 CKEEQRPRTANKAPGSKGVKQKSPPAAVAVAVSAAAPPPAVPCAPAENAPAPARRSAGKK
560 570 580 590 600 610
600 610 620 630 640 650
pF1KE9 QPKKVEKNTSTDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIP
...:.... : . .:. ... :: . : .. . ::: : ..
CCDS33 PTRRTERTSAGDGANCHRPEEPAAADALGTSVVVPPEPTKTRPCGNNRASHRKELRSSVT
620 630 640 650 660 670
660 670 680 690 700
pF1KE9 LAPEKKKYRGPGKIVPKSREFIETDSSTSDSNTD------QEE-TLQIKVLPPCIISGGN
::.. :: ..:::::.:::::.::.:.:..: ::: :. :.::
CCDS33 C--EKRRTRGLSRIVPKSKEFIETESSSSSSSSDSDLESEQEEYPLSKAQTVAASASSGN
680 690 700 710 720
710 720 730 740 750 760
pF1KE9 TAKSKEIC--GASLTLSTLMS-SSGSNNNLSISNEEPTFSPIPVMQTEILSPLRDHENLK
. :: :.: . . : .. ...... :: .. .: ..:.::::.: ....
CCDS33 DQRLKEAAANGGSGPRAPVGSINARTTSDIAKELEEQFYTLVPFGRNELLSPLKDSDEIR
730 740 750 760 770 780
770 780 790 800 810 820
pF1KE9 NLWVKIDLDLLSRVPGHSSLHAAP---AKPDHKETATKPKRQTAVTAVEKPAPKGKRKHK
.::::::: ::::.: : : : . : :.. . : .:. : .:: ::.:::.:
CCDS33 SLWVKIDLTLLSRIPEH--LPQEPGVLSAPATKDSESAPPSHTSDTPAEKALPKSKRKRK
790 800 810 820 830 840
830 840 850 860 870 880
pF1KE9 PIEVAEKIPEKKQRLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPP
. . : :. : . : : . . : :. . : :.::.. :
CCDS33 -CDNEDDYREIKKSQGEKDSSSRLATSTSNTLSANHCNMNINSVAIPIN--KNEKMLRSP
850 860 870 880 890 900
890 900 910 920 930 940
pF1KE9 LSPLPEDPPRR---RNVSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEG
.::: . .. ....... : : : .:. .: ::: . .. . :
CCDS33 ISPLSDASKHKYTSEDLTSSSRPNG---NSLFTSASSSKKPKAD--------SQLQPHGG
910 920 930 940 950
950 960 970 980 990 1000
pF1KE9 DTPKKASSATITVTNTAIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTG
: : : . . ..
CCDS33 DLTKAAHNNSENIP----------------------------------------------
960
1010 1020 1030 1040 1050 1060
pF1KE9 LMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKF
. .:. . :. : :.. . .: ::.::: ..:::.:::::..::::::. :::
CCDS33 -LHKSRPQTKPWS--PG-SNGHRDCKRQKLVFDDMPRSADYFMQEAKRMKHKADAMVEKF
970 980 990 1000 1010 1020
1070 1080 1090 1100 1110 1120
pF1KE9 GKAVNYADAALSFTECGNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDK
:::.:::.::::: :::::::. :.:.:::::::::::::.:::::::. ..: :. ::
CCDS33 GKALNYAEAALSFIECGNAMEQGPMESKSPYTMYSETVELIRYAMRLKTHSGPNATPEDK
1030 1040 1050 1060 1070 1080
1130 1140 1150 1160 1170
pF1KE9 KLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNT--P
.::.::::::.::: :::.::.:::.:::..:..::: :.::.:: :::: ..::.: :
CCDS33 QLAALCYRCLALLYWRMFRLKRDHAVKYSKALIDYFK-NSSKAAQAPSPWGASGKSTGTP
1090 1100 1110 1120 1130 1140
1180 1190 1200 1210 1220
pF1KE9 SPVSLNN--VSPINAMGNCNNG----P---VTIPQRIHHMAASHVNITSNVLRGYEHWDM
::.: : .: ....:. .:. : :.::::::.:::.::.::...:..:..:.:
CCDS33 SPMSPNPSPASSVGSQGSLSNASALSPSTIVSIPQRIHQMAANHVSITNSILHSYDYWEM
1150 1160 1170 1180 1190 1200
1230 1240 1250 1260 1270
pF1KE9 ADKLTRENKEFFGDLDTLMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL
::.:..::.:::.::: ::::.: :::: .::.: .::: ::: .:::
CCDS33 ADNLAKENREFFNDLDLLMGPVTLHSSMEHLVQYSQQGLHWLRNSAHLS
1210 1220 1230 1240 1250
>>CCDS54775.1 AFF1 gene_id:4299|Hs108|chr4 (1218 aa)
initn: 1446 init1: 389 opt: 761 Z-score: 510.8 bits: 106.7 E(32554): 3.9e-22
Smith-Waterman score: 1608; 30.2% identity (55.7% similar) in 1329 aa overlap (18-1272:15-1212)
10 20 30 40 50 60
pF1KE9 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKTNKG
:..::. :. :: ::::::..:: . : . :::::::: ::
CCDS54 MAFTERVNSSGNSLYNDDRNLLRIREKERRNQEAHQEKEAFPEKIPLFGEPYKTAKG
10 20 30 40 50
70 80 90 100 110
pF1KE9 DALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSV--PQNPNNKNEPSFFPEQKNRI
: :..:.:: ::::.:.:..:...:. .: . .: . :. : .. : .: .. .
CCDS54 DELSSRIQNMLGNYEEVKEFLSTKSH-THRLDASENRLGKPKYPLIPDKGSSIPSSSFHT
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE9 IPPHQDNTHP-SAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNP--STVLASQASGQP-
::. : :.:. .. : . . . : : .: : :... ::
CCDS54 SVHHQSIHTPASGPLSVGNIS-HNPKMAQPRTEPMPSLHAKSCGPPDSQHLTQDRLGQEG
120 130 140 150 160 170
180 190 200 210
pF1KE9 ---------------NKMQTLTQDQSQAKLEDFFVYPAEQPQIGEV---EESNPSAKEDS
.. ..:.. . .: .. :. : .. . ... : .. .:
CCDS54 FGSSHHKKGDRRADGDHCASVTDSAPERELSPLISLPSPVPPLSPIHSNQQTLPRTQGSS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE9 NPNSSGEDAFKEIFQSNSPEESEFAVQAPGSPLVASSLLAPSSGLSVQNFPP-GLYCKTS
. ..:.... : ..::.. :. .: .::.::.. : :.::: .: :.
CCDS54 KVHGSSNNS-KGYCPAKSPKDLAVKVHDKETP--QDSLVAPAQPPS-QTFPPPSLPSKSV
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE9 MGQQKPTAYVRPMDGQDQAPDISPTLKPSIEFENSFGNLSF-GTLLDGKPSAASSKTKLP
::::::::::::::::::. :: ::: : .. . .: : : .: .: :.:
CCDS54 AMQQKPTAYVRPMDGQDQAPSESPELKPLPE---DYRQQTFEKTDLKVPAKAKLTKLKMP
300 310 320 330 340
340 350 360
pF1KE9 KFTILQTSEVSLPSDPSCVEEILRE-----------------------------SQHLTP
. :. : . .. ::::::.: :::..
CCDS54 S----QSVEQTYSNEVHCVEEILKEMTHSWPPPLTAIHTPSTAEPSKFPFPTKDSQHVSS
350 360 370 380 390 400
370 380 390 400 410 420
pF1KE9 GFTLQKWNDPTTRASTKSVS-FKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEK
:: : .... ..: . .:::::::.::..:: .. :. ::
CCDS54 VTQNQKQYDTSSKTHSNSQQGTSSMLEDDLQLSDSED--------------SDSEQTPEK
410 420 430 440 450
430 440 450 460 470 480
pF1KE9 AKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRVAT
. : . : . :.: ....:.. : : :.:.: :::..:::..::: :: .. .
CCDS54 PPSSSAPPSAPQSLPEPVASAHSSSAE-SESTSDSDSSSDSESESSSSDSEENEPLETPA
460 470 480 490 500
490 500 510 520 530 540
pF1KE9 PEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETI-SLPPPIIQPMEVQMKVKTNA
::::::.:::::::.::.::. : .: : : :: .: : . . . .
CCDS54 PEPEPPTTNKWQLDNWLTKVS---------QPAAPPEGPRSTEPPRRHP-ESKGSSDSAT
510 520 530 540 550
550 560 570 580 590 600
pF1KE9 SQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQR-TIGKKQPKKVE
:: .: :. : : :: :: . :. . . : ... :: :.: :::::
CCDS54 SQEHSESKDPPPKS--SSKA-PRAPPEAPHPGKRSCQKSPAQQEPPQRQTVGTKQPKKPV
560 570 580 590 600 610
610 620 630 640 650
pF1KE9 KNTS-----TDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIPL
: .. :. .:.. ... : .: :. ..:. . : .::.: .:
CCDS54 KASARAGSRTSLQGEREPGLLPYGSRDQTS---KDKPKVKTKGRP-RAAASNEPKPAVPP
620 630 640 650 660 670
660 670 680 690 700 710
pF1KE9 APEKKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEIC
. ::::... .: . . ..:. :. : . .: : : : ...
CCDS54 SSEKKKHKSS---LPAPSKALSGPEPAKDNVEDR--TPEHFALVPLTESQGPPHSGS---
680 690 700 710 720
720 730 740 750 760 770
pF1KE9 GASLTLSTLMSSSGSNNNLSISNE-EPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDL
:. .:: . . .... . :.:. .:..:::::: ..: ::: :::
CCDS54 GSR--------TSGCRQAVVVQEDSRKDRLPLPLRDTKLLSPLRDTPPPQSLMVKITLDL
730 740 750 760 770
780 790 800 810 820 830
pF1KE9 LSRVPGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQ
:::.: . . : . :. . :... . .. . .:... :. . .::
CCDS54 LSRIPQPPGKGSRQRKAEDKQPPAGKKHSSEKRSSDSSSKLAKKRKG--EAERDCDNKKI
780 790 800 810 820 830
840 850 860 870 880 890
pF1KE9 RLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRN
:::. . : . :: ... . : .. :.: : :::.: . : .
CCDS54 RLEKE----IKSQSSSSSSSHKE-SSKTKPSRPSSQSSKKEMLPPPPVSSSSQKPAK---
840 850 860 870 880
900 910 920 930 940 950
pF1KE9 VSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNT
: . : .: :. :. : ::.::: :..
CCDS54 ------P--------------ALKRSRREADTCGQ---------DPPKSASS-----TKS
890 900 910
960 970 980 990 1000 1010
pF1KE9 AIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALP
... : . ... .. :.. . :
CCDS54 NHKDSSIPKQRRVEGKGSRSSSEHKGSSGDTANPFPV----------------------P
920 930 940 950
1020 1030 1040 1050 1060 1070
pF1KE9 LLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTEC
: ..... .:.. :: ..:: .:.::::.:.::. . .. ::: .: .:.::: ::
CCDS54 SLPNGNSKPGKPQVKFDK--QQADLHMREAKKMKQKAELMTDRVGKAFKYLEAVLSFIEC
960 970 980 990 1000
1080 1090 1100 1110 1120 1130
pF1KE9 GNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLR
: : : . .:: :..:::::.:... : ::.:.. : .: .::::.:: :.: .
CCDS54 GIATESESQSSKSAYSVYSETVDLIKFIMSLKSFSDATAPTQEKIFAVLCMRCQSILNMA
1010 1020 1030 1040 1050 1060
1140 1150 1160 1170 1180 1190
pF1KE9 MFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCN
::. ::: :.::::.: ..: ...::::: ::: .. . .::::.: :: ...:. .
CCDS54 MFRCKKDIAIKYSRTLNKHF-ESSSKVAQAPSPCIARSTGTPSPLS-PMPSPASSVGSQS
1070 1080 1090 1100 1110 1120
1200 1210 1220 1230 1240
pF1KE9 NG----------PVTIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDT
.. .. : :..:..:.:.:::.:: ... :..:. :::.:::::. :.:
CCDS54 SAGSVGSSGVAATISTPVTIQNMTSSYVTITSHVLTAFDLWEQAEALTRKNKEFFARLST
1130 1140 1150 1160 1170 1180
1250 1260 1270
pF1KE9 LMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL
. :. .::...::.:.:::. :.
CCDS54 NVCTLALNSSLVDLVHYTRQGFQQLQELTKTP
1190 1200 1210
>>CCDS3616.1 AFF1 gene_id:4299|Hs108|chr4 (1210 aa)
initn: 1380 init1: 395 opt: 751 Z-score: 504.3 bits: 105.4 E(32554): 9.1e-22
Smith-Waterman score: 1601; 30.2% identity (55.7% similar) in 1333 aa overlap (14-1272:4-1204)
10 20 30 40 50 60
pF1KE9 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKTNKG
:. :..::. :. :: ::::::..:: . : . :::::::: ::
CCDS36 MAAQSSLYNDDRNLLRIREKERRNQEAHQEKEAFPEKIPLFGEPYKTAKG
10 20 30 40 50
70 80 90 100 110
pF1KE9 DALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSV--PQNPNNKNEPSFFPEQKNRI
: :..:.:: ::::.:.:..:...:. .: . .: . :. : .. : .: .. .
CCDS36 DELSSRIQNMLGNYEEVKEFLSTKSH-THRLDASENRLGKPKYPLIPDKGSSIPSSSFHT
60 70 80 90 100
120 130 140 150 160 170
pF1KE9 IPPHQDNTHP-SAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNP--STVLASQASGQP-
::. : :.:. .. : . . . : : .: : :... ::
CCDS36 SVHHQSIHTPASGPLSVGNIS-HNPKMAQPRTEPMPSLHAKSCGPPDSQHLTQDRLGQEG
110 120 130 140 150 160
180 190 200 210
pF1KE9 ---------------NKMQTLTQDQSQAKLEDFFVYPAEQPQIGEV---EESNPSAKEDS
.. ..:.. . .: .. :. : .. . ... : .. .:
CCDS36 FGSSHHKKGDRRADGDHCASVTDSAPERELSPLISLPSPVPPLSPIHSNQQTLPRTQGSS
170 180 190 200 210 220
220 230 240 250 260 270
pF1KE9 NPNSSGEDAFKEIFQSNSPEESEFAVQAPGSPLVASSLLAPSSGLSVQNFPP-GLYCKTS
. ..:.... : ..::.. :. .: .::.::.. : :.::: .: :.
CCDS36 KVHGSSNNS-KGYCPAKSPKDLAVKVHDKETP--QDSLVAPAQPPS-QTFPPPSLPSKSV
230 240 250 260 270 280
280 290 300 310 320 330
pF1KE9 MGQQKPTAYVRPMDGQDQAPDISPTLKPSIEFENSFGNLSF-GTLLDGKPSAASSKTKLP
::::::::::::::::::. :: ::: . ... . .: : : .: .: :.:
CCDS36 AMQQKPTAYVRPMDGQDQAPSESPELKP---LPEDYRQQTFEKTDLKVPAKAKLTKLKMP
290 300 310 320 330 340
340 350 360
pF1KE9 KFTILQTSEVSLPSDPSCVEEILRE-----------------------------SQHLTP
. :. : . .. ::::::.: :::..
CCDS36 S----QSVEQTYSNEVHCVEEILKEMTHSWPPPLTAIHTPSTAEPSKFPFPTKDSQHVSS
350 360 370 380 390
370 380 390 400 410 420
pF1KE9 GFTLQKWNDPTTRASTKSVS-FKSMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEK
:: : .... ..: . .:::::::.::..:: .. :. ::
CCDS36 VTQNQKQYDTSSKTHSNSQQGTSSMLEDDLQLSDSED--------------SDSEQTPEK
400 410 420 430 440
430 440 450 460 470 480
pF1KE9 AKPRNNPVNPPLATPQPPPAVQASGGSGSSSESESSSESDSDTESSTTDSESNEAPRVAT
. : . : . :.: ....:.. : : :.:.: :::..:::..::: :: .. .
CCDS36 PPSSSAPPSAPQSLPEPVASAHSSSAE-SESTSDSDSSSDSESESSSSDSEENEPLETPA
450 460 470 480 490 500
490 500 510 520 530 540
pF1KE9 PEPEPPSTNKWQLDKWLNKVTSQNKSFICGQNETPMETI-SLPPPIIQPMEVQMKVKTNA
::::::.:::::::.::.::. : .: : : :: .: : . . . .
CCDS36 PEPEPPTTNKWQLDNWLTKVS---------QPAAPPEGPRSTEPPRRHP-ESKGSSDSAT
510 520 530 540 550
550 560 570 580 590 600
pF1KE9 SQVPAEPKERPLLSLIREKARPRPTQKIPETKALKHKLSTTSETVSQR-TIGKKQPKKVE
:: .: :. : : :: :: . :. . . : ... :: :.: :::::
CCDS36 SQEHSESKDPPPKS--SSKA-PRAPPEAPHPGKRSCQKSPAQQEPPQRQTVGTKQPKKPV
560 570 580 590 600
610 620 630 640 650
pF1KE9 KNTS-----TDEFTWPKPNITSSTPKEKESVELHDPPRGRNKATAHKPAPRKEPRPNIPL
: .. :. .:.. ... : .: :. ..:. . : .::.: .:
CCDS36 KASARAGSRTSLQGEREPGLLPYGSRDQTS---KDKPKVKTKGRP-RAAASNEPKPAVPP
610 620 630 640 650 660
660 670 680 690 700 710
pF1KE9 APEKKKYRGPGKIVPKSREFIETDSSTSDSNTDQEETLQIKVLPPCIISGGNTAKSKEIC
. ::::... .: . . ..:. :. : . .: : : : ...
CCDS36 SSEKKKHKSS---LPAPSKALSGPEPAKDNVEDR--TPEHFALVPLTESQGPPHSGS---
670 680 690 700 710
720 730 740 750 760 770
pF1KE9 GASLTLSTLMSSSGSNNNLSISNE-EPTFSPIPVMQTEILSPLRDHENLKNLWVKIDLDL
:. .:: . . .... . :.:. .:..:::::: ..: ::: :::
CCDS36 GSR--------TSGCRQAVVVQEDSRKDRLPLPLRDTKLLSPLRDTPPPQSLMVKITLDL
720 730 740 750 760
780 790 800 810 820 830
pF1KE9 LSRVPGHSSLHAAPAKPDHKETATKPKRQTAVTAVEKPAPKGKRKHKPIEVAEKIPEKKQ
:::.: . . : . :. . :... . .. . .:... :. . .::
CCDS36 LSRIPQPPGKGSRQRKAEDKQPPAGKKHSSEKRSSDSSSKLAKKRKG--EAERDCDNKKI
770 780 790 800 810 820
840 850 860 870 880 890
pF1KE9 RLEEATTICLLPPCISPAPPHKPPNTRENNSSRRANRRKEEKLFPPPLSPLPEDPPRRRN
:::. . : . :: ... . : .. :.: : :::.: . : .
CCDS36 RLEKE----IKSQSSSSSSSHKE-SSKTKPSRPSSQSSKKEMLPPPPVSSSSQKPAK---
830 840 850 860 870
900 910 920 930 940 950
pF1KE9 VSGNNGPFGQDKNIAMTGQITSTKPKRTEGKFCATFKGISVNEGDTPKKASSATITVTNT
: . : .: :. :. : ::.::: :..
CCDS36 ------P--------------ALKRSRREADTCGQ---------DPPKSASS-----TKS
880 890 900
960 970 980 990 1000 1010
pF1KE9 AIATATVTATAIVTTTVTATATATATTTTTTTTISTITSTITTGLMDSSHLEMTSWAALP
... : . ... .. :.. . :
CCDS36 NHKDSSIPKQRRVEGKGSRSSSEHKGSSGDTANPFPV----------------------P
910 920 930 940
1020 1030 1040 1050 1060 1070
pF1KE9 LLSSSSTNVRRPKLTFDDSVHNADYYMQEAKKLKHKADALFEKFGKAVNYADAALSFTEC
: ..... .:.. :: ..:: .:.::::.:.::. . .. ::: .: .:.::: ::
CCDS36 SLPNGNSKPGKPQVKFDK--QQADLHMREAKKMKQKAELMTDRVGKAFKYLEAVLSFIEC
950 960 970 980 990 1000
1080 1090 1100 1110 1120 1130
pF1KE9 GNAMERDPLEAKSPYTMYSETVELLRYAMRLKNFASPLASDGDKKLAVLCYRCLSLLYLR
: : : . .:: :..:::::.:... : ::.:.. : .: .::::.:: :.: .
CCDS36 GIATESESQSSKSAYSVYSETVDLIKFIMSLKSFSDATAPTQEKIFAVLCMRCQSILNMA
1010 1020 1030 1040 1050 1060
1140 1150 1160 1170 1180 1190
pF1KE9 MFKLKKDHAMKYSRSLMEYFKQNASKVAQIPSPWVSNGKNTPSPVSLNNVSPINAMGNCN
::. ::: :.::::.: ..: ...::::: ::: ... .::::.: :: ...:. .
CCDS36 MFRCKKDIAIKYSRTLNKHF-ESSSKVAQAPSPCIAS-TGTPSPLS-PMPSPASSVGSQS
1070 1080 1090 1100 1110
1200 1210 1220 1230 1240
pF1KE9 NG----------PVTIPQRIHHMAASHVNITSNVLRGYEHWDMADKLTRENKEFFGDLDT
.. .. : :..:..:.:.:::.:: ... :..:. :::.:::::. :.:
CCDS36 SAGSVGSSGVAATISTPVTIQNMTSSYVTITSHVLTAFDLWEQAEALTRKNKEFFARLST
1120 1130 1140 1150 1160 1170
1250 1260 1270
pF1KE9 LMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL
. :. .::...::.:.:::. :.
CCDS36 NVCTLALNSSLVDLVHYTRQGFQQLQELTKTP
1180 1190 1200 1210
1278 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 10:23:47 2016 done: Tue Nov 8 10:23:48 2016
Total Scan time: 3.990 Total Display time: 0.410
Function used was FASTA [36.3.4 Apr, 2011]