FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KA1122, 1028 aa
1>>>pF1KA1122 1028 - 1028 aa - 1028 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.0751+/-0.00114; mu= 14.3920+/- 0.069
mean_var=125.3004+/-24.963, 0's: 0 Z-trim(106.2): 68 B-trim: 16 in 1/50
Lambda= 0.114577
statistics sampled from 8772 (8837) to 8772 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.616), E-opt: 0.2 (0.271), width: 16
Scan time: 3.430
The best scores are: opt bits E(32554)
CCDS47101.1 SMARCAD1 gene_id:56916|Hs108|chr4 (1028) 6713 1121.9 0
CCDS3639.1 SMARCAD1 gene_id:56916|Hs108|chr4 (1026) 6689 1117.9 0
CCDS58914.1 SMARCAD1 gene_id:56916|Hs108|chr4 ( 596) 3907 657.9 1.8e-188
CCDS7419.1 BTAF1 gene_id:9044|Hs108|chr10 (1849) 874 156.9 3.7e-37
CCDS35329.1 ERCC6L gene_id:54821|Hs108|chrX (1250) 730 133.0 4e-30
CCDS73164.1 HELLS gene_id:3070|Hs108|chr10 ( 700) 675 123.7 1.3e-27
CCDS73165.1 HELLS gene_id:3070|Hs108|chr10 ( 714) 674 123.5 1.5e-27
CCDS7434.1 HELLS gene_id:3070|Hs108|chr10 ( 838) 674 123.6 1.8e-27
CCDS35072.1 ERCC6L2 gene_id:375748|Hs108|chr9 ( 712) 600 111.3 7.4e-24
CCDS73162.1 HELLS gene_id:3070|Hs108|chr10 ( 884) 567 105.9 3.9e-22
CCDS10071.1 INO80 gene_id:54617|Hs108|chr15 (1556) 521 98.5 1.2e-19
CCDS10689.2 SRCAP gene_id:10847|Hs108|chr16 (3230) 526 99.5 1.2e-19
CCDS73163.1 HELLS gene_id:3070|Hs108|chr10 ( 740) 505 95.6 4.1e-19
CCDS3761.1 SMARCA5 gene_id:8467|Hs108|chr4 (1052) 461 88.4 8.4e-17
CCDS76018.1 SMARCA1 gene_id:6594|Hs108|chrX (1058) 453 87.1 2.1e-16
CCDS45081.1 CHD8 gene_id:57680|Hs108|chr14 (2302) 453 87.3 3.9e-16
CCDS53885.1 CHD8 gene_id:57680|Hs108|chr14 (2581) 453 87.4 4.3e-16
CCDS76510.1 CHD4 gene_id:1108|Hs108|chr12 (1905) 445 86.0 8.5e-16
CCDS8552.1 CHD4 gene_id:1108|Hs108|chr12 (1912) 445 86.0 8.5e-16
CCDS34204.1 CHD1 gene_id:1105|Hs108|chr5 (1710) 440 85.1 1.4e-15
CCDS10374.2 CHD2 gene_id:1106|Hs108|chr15 (1828) 439 85.0 1.6e-15
CCDS7229.1 ERCC6 gene_id:2074|Hs108|chr10 (1493) 436 84.4 1.9e-15
CCDS57.1 CHD5 gene_id:26038|Hs108|chr1 (1954) 435 84.3 2.7e-15
CCDS54218.1 SMARCA4 gene_id:6597|Hs108|chr19 (1613) 431 83.6 3.7e-15
CCDS54217.1 SMARCA4 gene_id:6597|Hs108|chr19 (1614) 431 83.6 3.7e-15
CCDS45973.1 SMARCA4 gene_id:6597|Hs108|chr19 (1616) 431 83.6 3.7e-15
CCDS45972.1 SMARCA4 gene_id:6597|Hs108|chr19 (1617) 431 83.6 3.7e-15
CCDS12253.1 SMARCA4 gene_id:6597|Hs108|chr19 (1647) 431 83.6 3.7e-15
CCDS47865.1 CHD7 gene_id:55636|Hs108|chr8 (2997) 435 84.4 3.8e-15
CCDS32555.1 CHD3 gene_id:1107|Hs108|chr17 (1966) 431 83.7 4.3e-15
CCDS32554.1 CHD3 gene_id:1107|Hs108|chr17 (2000) 431 83.7 4.4e-15
CCDS32553.2 CHD3 gene_id:1107|Hs108|chr17 (2059) 431 83.7 4.5e-15
CCDS13317.1 CHD6 gene_id:84181|Hs108|chr20 (2715) 428 83.2 7.9e-15
CCDS45485.1 CHD9 gene_id:80205|Hs108|chr16 (2881) 427 83.1 9.3e-15
CCDS76865.1 CHD9 gene_id:80205|Hs108|chr16 (2897) 427 83.1 9.3e-15
CCDS83338.1 SMARCA2 gene_id:6595|Hs108|chr9 (1514) 420 81.8 1.2e-14
CCDS34978.1 SMARCA2 gene_id:6595|Hs108|chr9 (1572) 420 81.8 1.3e-14
CCDS34977.1 SMARCA2 gene_id:6595|Hs108|chr9 (1590) 420 81.8 1.3e-14
CCDS58022.1 CHD1L gene_id:9557|Hs108|chr1 ( 616) 408 79.5 2.3e-14
CCDS58021.1 CHD1L gene_id:9557|Hs108|chr1 ( 693) 408 79.6 2.6e-14
CCDS72882.1 CHD1L gene_id:9557|Hs108|chr1 ( 797) 408 79.6 2.9e-14
CCDS927.1 CHD1L gene_id:9557|Hs108|chr1 ( 897) 408 79.6 3.2e-14
CCDS31929.2 EP400 gene_id:57634|Hs108|chr12 (3123) 382 75.7 1.7e-12
CCDS75768.1 RAD54B gene_id:25788|Hs108|chr8 ( 726) 368 73.0 2.6e-12
CCDS6262.1 RAD54B gene_id:25788|Hs108|chr8 ( 910) 368 73.0 3.2e-12
CCDS532.1 RAD54L gene_id:8438|Hs108|chr1 ( 747) 364 72.3 4.2e-12
>>CCDS47101.1 SMARCAD1 gene_id:56916|Hs108|chr4 (1028 aa)
initn: 6713 init1: 6713 opt: 6713 Z-score: 6000.6 bits: 1121.9 E(32554): 0
Smith-Waterman score: 6713; 100.0% identity (100.0% similar) in 1028 aa overlap (1-1028:1-1028)
10 20 30 40 50 60
pF1KA1 MNLFNLDRFRFEKRNKIEEAPEATPQPSQPGPSSPISLSAEEENAEGEVSRANTPDSDIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MNLFNLDRFRFEKRNKIEEAPEATPQPSQPGPSSPISLSAEEENAEGEVSRANTPDSDIT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 EKTEDSSVPETPDNERKASISYFKNQRGIQYIDLSSDSEDVVSPNCSNTVQEKTFNKDTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EKTEDSSVPETPDNERKASISYFKNQRGIQYIDLSSDSEDVVSPNCSNTVQEKTFNKDTV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 IIVSEPSEDEESQGLPTMARRNDDISELEDLSELEDLKDAKLQTLKELFPQRSDNDLLKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 IIVSEPSEDEESQGLPTMARRNDDISELEDLSELEDLKDAKLQTLKELFPQRSDNDLLKL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 IESTSTMDGAIAAALLMFGDAGGGPRKRKLSSSSEPYEEDEFNDDQSIKKTRLDHGEESN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 IESTSTMDGAIAAALLMFGDAGGGPRKRKLSSSSEPYEEDEFNDDQSIKKTRLDHGEESN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 ESAESSSNWEKQESIVLKLQKEFPNFDKQELREVLKEHEWMYTEALESLKVFAEDQDMQY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ESAESSSNWEKQESIVLKLQKEFPNFDKQELREVLKEHEWMYTEALESLKVFAEDQDMQY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 VSQSEVPNGKEVSSRSQNYPKNATKTKLKQKFSMKAQNGFNKKRKKNVFNPKRVVEDSEY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VSQSEVPNGKEVSSRSQNYPKNATKTKLKQKFSMKAQNGFNKKRKKNVFNPKRVVEDSEY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 DSGSDVGSSLDEDYSSGEEVMEDGYKGKILHFLQDASIGELTLIPQCSQKKAQKITELRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DSGSDVGSSLDEDYSSGEEVMEDGYKGKILHFLQDASIGELTLIPQCSQKKAQKITELRP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 FNSWEALFTKMSKTNGLSEDLIWHCKTLIQERDVVIRLMNKCEDISNKLTKQVTMLTGNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 FNSWEALFTKMSKTNGLSEDLIWHCKTLIQERDVVIRLMNKCEDISNKLTKQVTMLTGNG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 GGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLNGILADEMGLGKTIQAIAFLAYLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLNGILADEMGLGKTIQAIAFLAYLY
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 QEGNNGPHLIVVPASTIDNWLREVNLWCPTLKVLCYYGSQEERKQIRFNIHSRYEDYNVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QEGNNGPHLIVVPASTIDNWLREVNLWCPTLKVLCYYGSQEERKQIRFNIHSRYEDYNVI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 VTTYNCAISSSDDRSLFRRLKLNYAIFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 VTTYNCAISSSDDRSLFRRLKLNYAIFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 QNNLLELMSLLNFVMPHMFSSSTSEIRRMFSSKTKSADEQSIYEKERIAHAKQIIKPFIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QNNLLELMSLLNFVMPHMFSSSTSEIRRMFSSKTKSADEQSIYEKERIAHAKQIIKPFIL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 RRVKEEVLKQLPPKKDRIELCAMSEKQEQLYLGLFNRLKKSINNLVTEKNTEMCNVMMQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RRVKEEVLKQLPPKKDRIELCAMSEKQEQLYLGLFNRLKKSINNLVTEKNTEMCNVMMQL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KA1 RKMANHPLLHRQYYTAEKLKEMSQLMLKEPTHCEANPDLIFEDMEVMTDFELHVLCKQYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RKMANHPLLHRQYYTAEKLKEMSQLMLKEPTHCEANPDLIFEDMEVMTDFELHVLCKQYR
790 800 810 820 830 840
850 860 870 880 890 900
pF1KA1 HINNFQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 HINNFQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYL
850 860 870 880 890 900
910 920 930 940 950 960
pF1KA1 RLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 RLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQ
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KA1 AEDRCHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 AEDRCHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIAT
970 980 990 1000 1010 1020
pF1KA1 LLKTSMGL
::::::::
CCDS47 LLKTSMGL
>>CCDS3639.1 SMARCAD1 gene_id:56916|Hs108|chr4 (1026 aa)
initn: 6689 init1: 4987 opt: 6689 Z-score: 5979.1 bits: 1117.9 E(32554): 0
Smith-Waterman score: 6689; 99.8% identity (99.8% similar) in 1028 aa overlap (1-1028:1-1026)
10 20 30 40 50 60
pF1KA1 MNLFNLDRFRFEKRNKIEEAPEATPQPSQPGPSSPISLSAEEENAEGEVSRANTPDSDIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 MNLFNLDRFRFEKRNKIEEAPEATPQPSQPGPSSPISLSAEEENAEGEVSRANTPDSDIT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KA1 EKTEDSSVPETPDNERKASISYFKNQRGIQYIDLSSDSEDVVSPNCSNTVQEKTFNKDTV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 EKTEDSSVPETPDNERKASISYFKNQRGIQYIDLSSDSEDVVSPNCSNTVQEKTFNKDTV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KA1 IIVSEPSEDEESQGLPTMARRNDDISELEDLSELEDLKDAKLQTLKELFPQRSDNDLLKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 IIVSEPSEDEESQGLPTMARRNDDISELEDLSELEDLKDAKLQTLKELFPQRSDNDLLKL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KA1 IESTSTMDGAIAAALLMFGDAGGGPRKRKLSSSSEPYEEDEFNDDQSIKKTRLDHGEESN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 IESTSTMDGAIAAALLMFGDAGGGPRKRKLSSSSEPYEEDEFNDDQSIKKTRLDHGEESN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KA1 ESAESSSNWEKQESIVLKLQKEFPNFDKQELREVLKEHEWMYTEALESLKVFAEDQDMQY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 ESAESSSNWEKQESIVLKLQKEFPNFDKQELREVLKEHEWMYTEALESLKVFAEDQDMQY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KA1 VSQSEVPNGKEVSSRSQNYPKNATKTKLKQKFSMKAQNGFNKKRKKNVFNPKRVVEDSEY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 VSQSEVPNGKEVSSRSQNYPKNATKTKLKQKFSMKAQNGFNKKRKKNVFNPKRVVEDSEY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KA1 DSGSDVGSSLDEDYSSGEEVMEDGYKGKILHFLQDASIGELTLIPQCSQKKAQKITELRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 DSGSDVGSSLDEDYSSGEEVMEDGYKGKILHFLQDASIGELTLIPQCSQKKAQKITELRP
370 380 390 400 410 420
430 440 450 460 470 480
pF1KA1 FNSWEALFTKMSKTNGLSEDLIWHCKTLIQERDVVIRLMNKCEDISNKLTKQVTMLTGNG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 FNSWEALFTKMSKTNGLSEDLIWHCKTLIQERDVVIRLMNKCEDISNKLTKQVTMLTGNG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KA1 GGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLNGILADEMGLGKTIQAIAFLAYLY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 GGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLNGILADEMGLGKTIQAIAFLAYLY
490 500 510 520 530 540
550 560 570 580 590 600
pF1KA1 QEGNNGPHLIVVPASTIDNWLREVNLWCPTLKVLCYYGSQEERKQIRFNIHSRYEDYNVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 QEGNNGPHLIVVPASTIDNWLREVNLWCPTLKVLCYYGSQEERKQIRFNIHSRYEDYNVI
550 560 570 580 590 600
610 620 630 640 650 660
pF1KA1 VTTYNCAISSSDDRSLFRRLKLNYAIFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 VTTYNCAISSSDDRSLFRRLKLNYAIFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPV
610 620 630 640 650 660
670 680 690 700 710 720
pF1KA1 QNNLLELMSLLNFVMPHMFSSSTSEIRRMFSSKTKSADEQSIYEKERIAHAKQIIKPFIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 QNNLLELMSLLNFVMPHMFSSSTSEIRRMFSSKTKSADEQSIYEKERIAHAKQIIKPFIL
670 680 690 700 710 720
730 740 750 760 770 780
pF1KA1 RRVKEEVLKQLPPKKDRIELCAMSEKQEQLYLGLFNRLKKSINNLVTEKNTEMCNVMMQL
::::::::::::::::::::::::::::::::::::::::::::: :::::::::::::
CCDS36 RRVKEEVLKQLPPKKDRIELCAMSEKQEQLYLGLFNRLKKSINNL--EKNTEMCNVMMQL
730 740 750 760 770
790 800 810 820 830 840
pF1KA1 RKMANHPLLHRQYYTAEKLKEMSQLMLKEPTHCEANPDLIFEDMEVMTDFELHVLCKQYR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 RKMANHPLLHRQYYTAEKLKEMSQLMLKEPTHCEANPDLIFEDMEVMTDFELHVLCKQYR
780 790 800 810 820 830
850 860 870 880 890 900
pF1KA1 HINNFQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 HINNFQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYL
840 850 860 870 880 890
910 920 930 940 950 960
pF1KA1 RLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 RLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQ
900 910 920 930 940 950
970 980 990 1000 1010 1020
pF1KA1 AEDRCHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS36 AEDRCHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIAT
960 970 980 990 1000 1010
pF1KA1 LLKTSMGL
::::::::
CCDS36 LLKTSMGL
1020
>>CCDS58914.1 SMARCAD1 gene_id:56916|Hs108|chr4 (596 aa)
initn: 3907 init1: 2205 opt: 3907 Z-score: 3497.3 bits: 657.9 E(32554): 1.8e-188
Smith-Waterman score: 3907; 99.7% identity (99.7% similar) in 598 aa overlap (431-1028:1-596)
410 420 430 440 450 460
pF1KA1 LTLIPQCSQKKAQKITELRPFNSWEALFTKMSKTNGLSEDLIWHCKTLIQERDVVIRLMN
::::::::::::::::::::::::::::::
CCDS58 MSKTNGLSEDLIWHCKTLIQERDVVIRLMN
10 20 30
470 480 490 500 510 520
pF1KA1 KCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLNGIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 KCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLNGIL
40 50 60 70 80 90
530 540 550 560 570 580
pF1KA1 ADEMGLGKTIQAIAFLAYLYQEGNNGPHLIVVPASTIDNWLREVNLWCPTLKVLCYYGSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 ADEMGLGKTIQAIAFLAYLYQEGNNGPHLIVVPASTIDNWLREVNLWCPTLKVLCYYGSQ
100 110 120 130 140 150
590 600 610 620 630 640
pF1KA1 EERKQIRFNIHSRYEDYNVIVTTYNCAISSSDDRSLFRRLKLNYAIFDEGHMLKNMGSIR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 EERKQIRFNIHSRYEDYNVIVTTYNCAISSSDDRSLFRRLKLNYAIFDEGHMLKNMGSIR
160 170 180 190 200 210
650 660 670 680 690 700
pF1KA1 YQHLMTINANNRLLLTGTPVQNNLLELMSLLNFVMPHMFSSSTSEIRRMFSSKTKSADEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 YQHLMTINANNRLLLTGTPVQNNLLELMSLLNFVMPHMFSSSTSEIRRMFSSKTKSADEQ
220 230 240 250 260 270
710 720 730 740 750 760
pF1KA1 SIYEKERIAHAKQIIKPFILRRVKEEVLKQLPPKKDRIELCAMSEKQEQLYLGLFNRLKK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SIYEKERIAHAKQIIKPFILRRVKEEVLKQLPPKKDRIELCAMSEKQEQLYLGLFNRLKK
280 290 300 310 320 330
770 780 790 800 810 820
pF1KA1 SINNLVTEKNTEMCNVMMQLRKMANHPLLHRQYYTAEKLKEMSQLMLKEPTHCEANPDLI
::::: :::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SINNL--EKNTEMCNVMMQLRKMANHPLLHRQYYTAEKLKEMSQLMLKEPTHCEANPDLI
340 350 360 370 380
830 840 850 860 870 880
pF1KA1 FEDMEVMTDFELHVLCKQYRHINNFQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 FEDMEVMTDFELHVLCKQYRHINNFQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQ
390 400 410 420 430 440
890 900 910 920 930 940
pF1KA1 FTMMLDILEVLLKHHQHRYLRLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 FTMMLDILEVLLKHHQHRYLRLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINL
450 460 470 480 490 500
950 960 970 980 990 1000
pF1KA1 TSANVVILHDIDCNPYNDKQAEDRCHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 TSANVVILHDIDCNPYNDKQAEDRCHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLE
510 520 530 540 550 560
1010 1020
pF1KA1 QDMTTVDEGDEGSMPADIATLLKTSMGL
::::::::::::::::::::::::::::
CCDS58 QDMTTVDEGDEGSMPADIATLLKTSMGL
570 580 590
>>CCDS7419.1 BTAF1 gene_id:9044|Hs108|chr10 (1849 aa)
initn: 839 init1: 305 opt: 874 Z-score: 780.6 bits: 156.9 E(32554): 3.7e-37
Smith-Waterman score: 874; 33.9% identity (61.8% similar) in 558 aa overlap (484-1017:1255-1792)
460 470 480 490 500 510
pF1KA1 VVIRLMNKCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWLALVHK
: . : .: : . ::. :.::::...:
CCDS74 DPPNMSAELIQLKAKERHFLEQLLDGKKLENYKIPVPINAEL--RKYQQDGVNWLAFLNK
1230 1240 1250 1260 1270 1280
520 530 540 550 560
pF1KA1 HGLNGILADEMGLGKTIQAIAFLA----YLYQEGNNG--------PHLIVVPASTIDNWL
. :.::: :.::::::.:.: .:: . :: . : :.: : . .:.
CCDS74 YKLHGILCDDMGLGKTLQSICILAGDHCHRAQEYARSKLAECMPLPSLVVCPPTLTGHWV
1290 1300 1310 1320 1330 1340
570 580 590 600 610
pF1KA1 REVNLWCPT--LKVLCYYGSQEERKQIRFNIHSRYEDYNVIVTTYNCAISSSDDRSLFRR
::. .: :. : : : :: ... .. . .:.::..:. . .: ..::
CCDS74 DEVGKFCSREYLNPLHYTGPPTERIRLQHQV----KRHNLIVASYDVV---RNDIDFFRN
1350 1360 1370 1380 1390
620 630 640 650 660 670
pF1KA1 LKLNYAIFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPVQNNLLELMSLLNFVMPHMF
.:.:: :.::::..:: . . . ..:: :..:.:::.:::.::: ::..:.:: ..
CCDS74 IKFNYCILDEGHVIKNGKTKLSKAVKQLTANYRIILSGTPIQNNVLELWSLFDFLMPGFL
1400 1410 1420 1430 1440 1450
680 690 700 710 720 730
pF1KA1 SSSTSEIRRMFSSKTKSADEQSIYEKERI------AHAKQIIKPFILRRVKEEVLKQLPP
.. . :. . : : .: .... : .:.. ::.:::.::.::..:::
CCDS74 GTERQFAARYGKPILASRDARSSSREQEAGVLAMDALHRQVL-PFLLRRMKEDVLQDLPP
1460 1470 1480 1490 1500 1510
740 750 760 770 780 790
pF1KA1 KKDRIELCAMSEKQEQLYLGLF-NRLKKSINNLVTEKNTEMCNVMMQLRKMANHPLLHRQ
: . :..: : ::: . .: : .... :. . . .: : ..: . :
CCDS74 KIIQDYYCTLSPLQVQLYEDFAKSRAKCDVDETVSSATLSEETEKPKL-KATGHVFQALQ
1520 1530 1540 1550 1560 1570
800 810 820 830 840 850
pF1KA1 YYTAEKLKEMSQLMLKEPTHCEANPDLIFEDMEVMTDFELHVLCKQYRHINNFQLDMDLI
: .:: . :.: : : : . : . :... :: . . . :: .:
CCDS74 YL--RKLCNHPALVLT-PQHPEFKTTA--EKLAVQNS-SLHDIQHAPKLSALKQLLLDCG
1580 1590 1600 1610 1620
860 870 880 890 900
pF1KA1 LDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEV-LLKHHQHR--YLRLDGKTQIS
: .:. : .: :...: :. ::::.: ::: : ::::::. .
CCDS74 LGNGSTSESG---TESVVAQHRILIFCQLKSMLDIVEHDLLKPHLPSVTYLRLDGSIPPG
1630 1640 1650 1660 1670 1680
910 920 930 940 950 960
pF1KA1 ERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQAEDRCHRVG
.: ....::.: .: :.::.:..::::.:::.:..:.. . : ::. : :: :: ::.:
CCDS74 QRHSIVSRFNNDPSIDVLLLTTHVGGLGLNLTGADTVVFVEHDWNPMRDLQAMDRAHRIG
1690 1700 1710 1720 1730 1740
970 980 990 1000 1010 1020
pF1KA1 QTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIATLLKTSMGL
: . : : .::..::.::... ... :... . . . .... :: .:
CCDS74 QKRVVNVYRLITRGTLEEKIMGLQKFKMNIANTVISQENSSLQSMGTDQLLDLFTLDKDG
1750 1760 1770 1780 1790 1800
CCDS74 KAEKADTSTSGKASMKSILENLSDLWDQEQYDSEYSLENFMHSLK
1810 1820 1830 1840
>>CCDS35329.1 ERCC6L gene_id:54821|Hs108|chrX (1250 aa)
initn: 697 init1: 307 opt: 730 Z-score: 654.4 bits: 133.0 E(32554): 4e-30
Smith-Waterman score: 749; 32.4% identity (61.7% similar) in 527 aa overlap (500-991:99-596)
470 480 490 500 510 520
pF1KA1 TKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLNG-ILADEMGLGK
.:: :. .: ... : .: ::::.:::::
CCDS35 ELAEQGDDEFTDVCNSGLLLYRELHNQLFEHQKEGIAFLYSLYRDGRKGGILADDMGLGK
70 80 90 100 110 120
530 540 550 560 570 580
pF1KA1 TIQAIAFLAYLYQEGNNGPHLIVVPASTIDNWLREVNLWCPTLKVLCYYG-SQEERKQIR
:.: ::::. ... . . :...:.. :..:..: : : ..: ..: :..:: .
CCDS35 TVQIIAFLSGMFDASLVNHVLLIMPTNLINTWVKEFIKWTPGMRVKTFHGPSKDERTR--
130 140 150 160 170 180
590 600 610 620 630 640
pF1KA1 FNIHSRYEDYNVIVTTYNCAISSSDDRSLFRRLKL--NYAIFDEGHMLKNMGSIRYQHLM
:.. . .::.:::. :.. .. : :: .. .:.:.::.: .:. ..
CCDS35 -NLNRIQQRNGVIITTYQMLINNWQQLSSFRGQEFVWDYVILDEAHKIKTSSTKSAICAR
190 200 210 220 230 240
650 660 670 680 690 700
pF1KA1 TINANNRLLLTGTPVQNNLLELMSLLNFVMPHMFSSSTSEIRRMFSSKTKSADEQSIYEK
.: :.:::::::::.:::: :: ::..:. . .. . .. . . : :..
CCDS35 AIPASNRLLLTGTPIQNNLQELWSLFDFACQGSLLGTLKTFKMEYENPITRAREKDATPG
250 260 270 280 290 300
710 720 730 740
pF1KA1 ERIAHAK------QIIKPFILRRVKEEVLKQL---P--------PKKDRI-ELCAMSEK-
:. : ::::..:::.::.: :. : : : : :. ..:.:
CCDS35 EKALGFKISENLMAIIKPYFLRRTKEDVQKKKSSNPEARLNEKNPDVDAICEMPSLSRKN
310 320 330 340 350 360
750 760 770 780 790
pF1KA1 -----------QEQLYLGLFNRLKKSINNLVTEKNTEMCNVMMQLRKMANHPLLHRQYYT
::..: : : . :..:. : . . .. . :.:. .:: :
CCDS35 DLIIWIRLVPLQEEIYRK-FVSLDH-IKELLMETRSPLAELGV-LKKLCDHPRLLSA--R
370 380 390 400 410 420
800 810 820 830 840 850
pF1KA1 AEKLKEMSQLMLKEPTHCEANPDLIFEDMEVMTDFELHVLCKQYRHINNFQLDMDLILDS
: : ... . .. .. : .::. : ::.. : :. .:
CCDS35 ACCLLNLGTFSAQDGNEGEDSPDV---------D-----------HIDQVTDDT-LMEES
430 440 450
860 870 880 890 900 910
pF1KA1 GKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYLRLDGK-TQISERIHL
::. : .:..:...: ....::: ..:.:.: :::... . ::.:: :.. :: .
CCDS35 GKMIFLMDLLKRLRDEGHQTLVFSQSRQILNIIERLLKNRHFKTLRIDGTVTHLLEREKR
460 470 480 490 500 510
920 930 940 950 960 970
pF1KA1 IDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQAEDRCHRVGQTKEV
:. :. . : ::::.:..::.:..::.:. :.. : . :: .: :: :: .:.:: ..:
CCDS35 INLFQQNKDYSVFLLTTQVGGVGLTLTAATRVVIFDPSWNPATDAQAVDRVYRIGQKENV
520 530 540 550 560 570
980 990 1000 1010 1020
pF1KA1 LVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIATLLKTSMGL
.: .::. ::.::.. .
CCDS35 VVYRLITCGTVEEKIYRRQVFKDSLIRQTTGEKKNPFRYFSKQELRELFTIEDLQNSVTQ
580 590 600 610 620 630
>>CCDS73164.1 HELLS gene_id:3070|Hs108|chr10 (700 aa)
initn: 1136 init1: 508 opt: 675 Z-score: 608.9 bits: 123.7 E(32554): 1.3e-27
Smith-Waterman score: 1139; 36.2% identity (64.9% similar) in 619 aa overlap (410-1001:4-606)
380 390 400 410 420 430
pF1KA1 VMEDGYKGKILHFLQDASIGELTLIPQCSQKKAQKITELRPFNSWEALFTKMSKTNGLSE
:..:.: . :. : . :.:: :
CCDS73 MQVKRSQEILSVAKKNKKENEDENSSSTNLCVE
10 20 30
440 450 460 470 480 490
pF1KA1 DLIWH--CKTLIQER-DVVIRLMNKCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLS
:: . ...:..: . ..: .: . . . : :: ..::. .. ..
CCDS73 DLQKNKDSNSIIKDRLSETVRQNTKF--FFDPVRKC------NGQPVPFQQPKHFTGGV-
40 50 60 70 80
500 510 520 530 540 550
pF1KA1 LKPYQKVGLNWLALVHKHGLNGILADEMGLGKTIQAIAFLAYLYQEGNNGPHLIVVPAST
.. :: :..:: .. ..:.:::::::::::::.: :: .: . :.: :: :. : ::
CCDS73 MRWYQVEGMEWLRMLWENGINGILADEMGLGKTVQCIATIALMIQRGVPGPFLVCGPLST
90 100 110 120 130 140
560 570 580 590 600 610
pF1KA1 IDNWLREVNLWCPTLKVLCYYGSQEERKQIRFNIHSR---YEDYNVIVTTYNCAISSSDD
. ::. : . . : . .. :.:.::::... ::..: . . :..:... :. :
CCDS73 LPNWMAEFKRFTPDIPTMLYHGTQEERQKLVRNIYKRKGTLQIHPVVITSFEIAMR---D
150 160 170 180 190 200
620 630 640 650 660 670
pF1KA1 RSLFRRLKLNYAIFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPVQNNLLELMSLLNF
:. ... .: : :::: .::: ..: .::.:.:::::::.:::: :: :::::
CCDS73 RNALQHCYWKYLIVDEGHRIKNMKCRLIRELKRFNADNKLLLTGTPLQNNLSELWSLLNF
210 220 230 240 250 260
680 690 700 710 720
pF1KA1 VMPHMFSSSTSEIRRMFSSKTKSADEQSIYEKER---IAHA-KQIIKPFILRRVKEEVLK
..: .:.. : .. :. . : ..: ::: . : .::. ::.:::.: .:
CCDS73 LLPDVFDDLKS-FESWFDITSLSETAEDIIAKEREQNVLHMLHQILTPFLLRRLKSDVAL
270 280 290 300 310 320
730 740 750 760 770 780
pF1KA1 QLPPKKDRIELCAMSEKQEQLYLGLFNRLKKSINNLV--TEKNT-EMCNV---MMQLRKM
..:::.. . .:.::: .: .. :: .: :. .::.: :. . . ::
CCDS73 EVPPKREVVVYAPLSKKQEIFYTAIVNR---TIANMFGSSEKETIELSPTGRPKRRTRKS
330 340 350 360 370
790 800 810 820 830 840
pF1KA1 ANHPLLHRQYYTAEKL-KEMSQLMLKEPTHCEANPDLIFE-DMEVMTDFELHVLCKQYRH
:. . ::: .... . .: . :.: . : ...... . : : .. .
CCDS73 INYSKIDDFPNELEKLISQIQPEVDRERAVVEVNIPVESEVNLKLQNIMMLLRKCCNHPY
380 390 400 410 420 430
850 860 870 880 890
pF1KA1 I---------NNFQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLL
. ..:..: .:. .:::: .: .: :::..: .:.::::.: :::::
CCDS73 LIEYPIDPVTQEFKIDEELVTNSGKFLILDRMLPELKKRGHKVLLFSQMTSMLDILMDYC
440 450 460 470 480 490
900 910 920 930 940 950
pF1KA1 KHHQHRYLRLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDID
. .. . ::::. . ::: . . :::: ..:.::.::.:::::::::.:..::..: :
CCDS73 HLRDFNFSRLDGSMSYSEREKNMHSFNTDPEVFIFLVSTRAGGLGINLTAADTVIIYDSD
500 510 520 530 540 550
960 970 980 990 1000 1010
pF1KA1 CNPYNDKQAEDRCHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEG
:: .: ::.:::::.:::: :.: .:.. .::...... : :::.
CCDS73 WNPQSDLQAQDRCHRIGQTKPVVVYRLVTANTIDQKIVERAAAKRKLEKLIIHKNHFKGG
560 570 580 590 600 610
1020
pF1KA1 SMPADIATLLKTSMGL
CCDS73 QSGLNLSKNFLDPKELMELLKSRDYEREIKGSREKVISDKDLELLLDRSDLIDQMNASGP
620 630 640 650 660 670
>>CCDS73165.1 HELLS gene_id:3070|Hs108|chr10 (714 aa)
initn: 1136 init1: 508 opt: 674 Z-score: 607.9 bits: 123.5 E(32554): 1.5e-27
Smith-Waterman score: 1137; 38.0% identity (66.9% similar) in 547 aa overlap (479-1001:82-620)
450 460 470 480 490 500
pF1KA1 IQERDVVIRLMNKCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWL
:: ..::. .. .. .. :: :..::
CCDS73 NKDSNSIIKDRLSETVRQNTKFFFDPVRKCNGQPVPFQQPKHFTGGV-MRWYQVEGMEWL
60 70 80 90 100 110
510 520 530 540 550 560
pF1KA1 ALVHKHGLNGILADEMGLGKTIQAIAFLAYLYQEGNNGPHLIVVPASTIDNWLREVNLWC
.. ..:.:::::::::::::.: :: .: . :.: :: :. : ::. ::. : . .
CCDS73 RMLWENGINGILADEMGLGKTVQCIATIALMIQRGVPGPFLVCGPLSTLPNWMAEFKRFT
120 130 140 150 160 170
570 580 590 600 610 620
pF1KA1 PTLKVLCYYGSQEERKQIRFNIHSR---YEDYNVIVTTYNCAISSSDDRSLFRRLKLNYA
: . .. :.:.::::... ::..: . . :..:... :. ::. ... .:
CCDS73 PDIPTMLYHGTQEERQKLVRNIYKRKGTLQIHPVVITSFEIAMR---DRNALQHCYWKYL
180 190 200 210 220
630 640 650 660 670 680
pF1KA1 IFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPVQNNLLELMSLLNFVMPHMFSSSTSE
: :::: .::: ..: .::.:.:::::::.:::: :: :::::..: .:.. :
CCDS73 IVDEGHRIKNMKCRLIRELKRFNADNKLLLTGTPLQNNLSELWSLLNFLLPDVFDDLKS-
230 240 250 260 270 280
690 700 710 720 730 740
pF1KA1 IRRMFSSKTKSADEQSIYEKER---IAHA-KQIIKPFILRRVKEEVLKQLPPKKDRIELC
.. :. . : ..: ::: . : .::. ::.:::.: .: ..:::.. .
CCDS73 FESWFDITSLSETAEDIIAKEREQNVLHMLHQILTPFLLRRLKSDVALEVPPKREVVVYA
290 300 310 320 330 340
750 760 770 780 790
pF1KA1 AMSEKQEQLYLGLFNRLKKSINNLV--TEKNT-EMCNV---MMQLRKMANHPLLHRQYYT
.:.::: .: .. :: .: :. .::.: :. . . :: :. .
CCDS73 PLSKKQEIFYTAIVNR---TIANMFGSSEKETIELSPTGRPKRRTRKSINYSKIDDFPNE
350 360 370 380 390 400
800 810 820 830 840
pF1KA1 AEKL-KEMSQLMLKEPTHCEANPDLIFE-DMEVMTDFELHVLCKQYRHI---------NN
::: .... . .: . :.: . : ...... . : : .. .. ..
CCDS73 LEKLISQIQPEVDRERAVVEVNIPVESEVNLKLQNIMMLLRKCCNHPYLIEYPIDPVTQE
410 420 430 440 450 460
850 860 870 880 890 900
pF1KA1 FQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYLRLDG
:..: .:. .:::: .: .: :::..: .:.::::.: ::::: . .. . ::::
CCDS73 FKIDEELVTNSGKFLILDRMLPELKKRGHKVLLFSQMTSMLDILMDYCHLRDFNFSRLDG
470 480 490 500 510 520
910 920 930 940 950 960
pF1KA1 KTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQAEDR
. . ::: . . :::: ..:.::.::.:::::::::.:..::..: : :: .: ::.::
CCDS73 SMSYSEREKNMHSFNTDPEVFIFLVSTRAGGLGINLTAADTVIIYDSDWNPQSDLQAQDR
530 540 550 560 570 580
970 980 990 1000 1010 1020
pF1KA1 CHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIATLLKT
:::.:::: :.: .:.. .::...... : :::.
CCDS73 CHRIGQTKPVVVYRLVTANTIDQKIVERAAAKRKLEKLIIHKNHFKGGQSGLNLSKNFLD
590 600 610 620 630 640
pF1KA1 SMGL
CCDS73 PKELMELLKSRDYEREIKGSREKVISDKDLELLLDRSDLIDQMNASGPIKEKMGIFKILE
650 660 670 680 690 700
>>CCDS7434.1 HELLS gene_id:3070|Hs108|chr10 (838 aa)
initn: 1136 init1: 508 opt: 674 Z-score: 606.9 bits: 123.6 E(32554): 1.8e-27
Smith-Waterman score: 1137; 38.0% identity (66.9% similar) in 547 aa overlap (479-1001:206-744)
450 460 470 480 490 500
pF1KA1 IQERDVVIRLMNKCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWL
:: ..::. .. .. .. :: :..::
CCDS74 NKDSNSIIKDRLSETVRQNTKFFFDPVRKCNGQPVPFQQPKHFTGGV-MRWYQVEGMEWL
180 190 200 210 220 230
510 520 530 540 550 560
pF1KA1 ALVHKHGLNGILADEMGLGKTIQAIAFLAYLYQEGNNGPHLIVVPASTIDNWLREVNLWC
.. ..:.:::::::::::::.: :: .: . :.: :: :. : ::. ::. : . .
CCDS74 RMLWENGINGILADEMGLGKTVQCIATIALMIQRGVPGPFLVCGPLSTLPNWMAEFKRFT
240 250 260 270 280 290
570 580 590 600 610 620
pF1KA1 PTLKVLCYYGSQEERKQIRFNIHSR---YEDYNVIVTTYNCAISSSDDRSLFRRLKLNYA
: . .. :.:.::::... ::..: . . :..:... :. ::. ... .:
CCDS74 PDIPTMLYHGTQEERQKLVRNIYKRKGTLQIHPVVITSFEIAMR---DRNALQHCYWKYL
300 310 320 330 340 350
630 640 650 660 670 680
pF1KA1 IFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPVQNNLLELMSLLNFVMPHMFSSSTSE
: :::: .::: ..: .::.:.:::::::.:::: :: :::::..: .:.. :
CCDS74 IVDEGHRIKNMKCRLIRELKRFNADNKLLLTGTPLQNNLSELWSLLNFLLPDVFDDLKS-
360 370 380 390 400 410
690 700 710 720 730 740
pF1KA1 IRRMFSSKTKSADEQSIYEKER---IAHA-KQIIKPFILRRVKEEVLKQLPPKKDRIELC
.. :. . : ..: ::: . : .::. ::.:::.: .: ..:::.. .
CCDS74 FESWFDITSLSETAEDIIAKEREQNVLHMLHQILTPFLLRRLKSDVALEVPPKREVVVYA
420 430 440 450 460 470
750 760 770 780 790
pF1KA1 AMSEKQEQLYLGLFNRLKKSINNLV--TEKNT-EMCNV---MMQLRKMANHPLLHRQYYT
.:.::: .: .. :: .: :. .::.: :. . . :: :. .
CCDS74 PLSKKQEIFYTAIVNR---TIANMFGSSEKETIELSPTGRPKRRTRKSINYSKIDDFPNE
480 490 500 510 520
800 810 820 830 840
pF1KA1 AEKL-KEMSQLMLKEPTHCEANPDLIFE-DMEVMTDFELHVLCKQYRHI---------NN
::: .... . .: . :.: . : ...... . : : .. .. ..
CCDS74 LEKLISQIQPEVDRERAVVEVNIPVESEVNLKLQNIMMLLRKCCNHPYLIEYPIDPVTQE
530 540 550 560 570 580
850 860 870 880 890 900
pF1KA1 FQLDMDLILDSGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYLRLDG
:..: .:. .:::: .: .: :::..: .:.::::.: ::::: . .. . ::::
CCDS74 FKIDEELVTNSGKFLILDRMLPELKKRGHKVLLFSQMTSMLDILMDYCHLRDFNFSRLDG
590 600 610 620 630 640
910 920 930 940 950 960
pF1KA1 KTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQAEDR
. . ::: . . :::: ..:.::.::.:::::::::.:..::..: : :: .: ::.::
CCDS74 SMSYSEREKNMHSFNTDPEVFIFLVSTRAGGLGINLTAADTVIIYDSDWNPQSDLQAQDR
650 660 670 680 690 700
970 980 990 1000 1010 1020
pF1KA1 CHRVGQTKEVLVIKLISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIATLLKT
:::.:::: :.: .:.. .::...... : :::.
CCDS74 CHRIGQTKPVVVYRLVTANTIDQKIVERAAAKRKLEKLIIHKNHFKGGQSGLNLSKNFLD
710 720 730 740 750 760
pF1KA1 SMGL
CCDS74 PKELMELLKSRDYEREIKGSREKVISDKDLELLLDRSDLIDQMNASGPIKEKMGIFKILE
770 780 790 800 810 820
>>CCDS35072.1 ERCC6L2 gene_id:375748|Hs108|chr9 (712 aa)
initn: 719 init1: 389 opt: 600 Z-score: 541.8 bits: 111.3 E(32554): 7.4e-24
Smith-Waterman score: 703; 29.6% identity (59.7% similar) in 554 aa overlap (488-997:127-662)
460 470 480 490 500 510
pF1KA1 LMNKCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWLALVHKHGLN
: .:. :. ::. : .: . :: .
CCDS35 DEDLEKPYFPNRKFPSSSVAFKLSDNGDSIPYTINRY--LRDYQREGTRFLYGHYIHGGG
100 110 120 130 140 150
520 530 540 550
pF1KA1 GILADEMGLGKTIQAIAFLA-YLYQEG------NNGPH-------------------LIV
::.:.::::::.:.:.::: :...: :: :. :::
CCDS35 CILGDDMGLGKTVQVISFLAAVLHKKGTREDIENNMPEFLLRSMKKEPLSSTAKKMFLIV
160 170 180 190 200 210
560 570 580 590 600 610
pF1KA1 VPASTIDNWLREVNLWCPTLKVLCYYGSQEERKQIRFNIHSRYEDYNVIVTTYNCAISSS
.: :.. :: :.. : ..: .:.... . :: ...: . . .:::.
CCDS35 APLSVLYNWKDELDTW-GYFRVTVLHGNRKDNELIR--VKQRKCE--IALTTYETLRLCL
220 230 240 250 260
620 630 640 650 660 670
pF1KA1 DDRSLFRRLKLNYAIFDEGHMLKNMGSIRYQHLM-TINANNRLLLTGTPVQNNLLELMSL
:. . :. . .: ::.: .:: . : ..: ... : :. :::: .:::. :: .
CCDS35 DE---LNSLEWSAVIVDEAHRIKN-PKARVTEVMKALKCNVRIGLTGTILQNNMKELWCV
270 280 290 300 310 320
680 690 700 710 720
pF1KA1 LNFVMPHMFSSSTSEIRRMFSSKTKSADEQSIYEKERIAHAKQI------IKPFILRRVK
.....: ...:.: ....::. .. ..... ..: . : . .. ..:::.:
CCDS35 MDWAVPGLLGSGTY-FKKQFSDPVEHGQRHTATKRELATGRKAMQRLAKKMSGWFLRRTK
330 340 350 360 370 380
730 740 750 760 770 780
pF1KA1 EEVLKQLPPKKDRIELCAMSEKQEQLYLGLFNRLKKSINNLVTEKNTEMCNVMMQLRKMA
. ::: :.::. :.... :. .: ... .... .. .. : .. :.
CCDS35 TLIKDQLPKKEDRMVYCSLTDFQKAVYQTVLET--EDVTLILQSSEPCTCRSGQKRRNCC
390 400 410 420 430 440
790 800 810 820 830 840
pF1KA1 NHPLLHRQYYTAEKLKEMSQLMLKEPTHCEANPDLIFEDMEVMTDFELHVLCKQ-YRHIN
. : . . :. .. .. : .: : . . . .. .: : . ..
CCDS35 YKTNSHGETVKTLYLSYLT-VLQKVANHVAL---LQAASTSKQQETLIKRICDQVFSRFP
450 460 470 480 490
850 860 870 880 890
pF1KA1 NF-QLDMDLILD-------SGKFRVLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHH
.: : . : .. :::..:: .:.. ... :.:.::: : .::.:.
CCDS35 DFVQKSKDAAFETLSDPKYSGKMKVLQQLLNHCRKNRDKVLLFSFSTKLLDVLQQYCMAS
500 510 520 530 540 550
900 910 920 930 940 950
pF1KA1 QHRYLRLDGKTQISERIHLIDEFNTDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNP
: ::::.:. ::.... :::. .:. . :.:: :::::.:...::::.: : ::
CCDS35 GLDYRRLDGSTKSEERLKIVKEFNSTQDVNICLVSTMAGGLGLNFVGANVVVLFDPTWNP
560 570 580 590 600 610
960 970 980 990 1000 1010
pF1KA1 YNDKQAEDRCHRVGQTKEVLVIKLISQGTIEESML--KINQQKLKLEQDMTTVDEGDEGS
:: :: :: .:.:: ..: :..::: ::.:: : .: .:.:
CCDS35 ANDLQAIDRAYRIGQCRDVKVLRLISLGTVEEIMYLRQIYKQQLHCVVVGSENAKRYFEA
620 630 640 650 660 670
1020
pF1KA1 MPADIATLLKTSMGL
CCDS35 VQGSKEHQGELFGIHNLFKFRSQGSCLTKDILEV
680 690 700 710
>>CCDS73162.1 HELLS gene_id:3070|Hs108|chr10 (884 aa)
initn: 1131 init1: 508 opt: 567 Z-score: 511.0 bits: 105.9 E(32554): 3.9e-22
Smith-Waterman score: 1030; 34.9% identity (62.4% similar) in 582 aa overlap (479-991:206-780)
450 460 470 480 490 500
pF1KA1 IQERDVVIRLMNKCEDISNKLTKQVTMLTGNGGGWNIEQPSILNQSLSLKPYQKVGLNWL
:: ..::. .. .. .. :: :..::
CCDS73 NKDSNSIIKDRLSETVRQNTKFFFDPVRKCNGQPVPFQQPKHFTGGV-MRWYQVEGMEWL
180 190 200 210 220 230
510 520 530 540 550 560
pF1KA1 ALVHKHGLNGILADEMGLGKTIQAIAFLAYLYQEGNNGPHLIVVPASTIDNWLREVNLWC
.. ..:.:::::::::::::.: :: .: . :.: :: :. : ::. ::. : . .
CCDS73 RMLWENGINGILADEMGLGKTVQCIATIALMIQRGVPGPFLVCGPLSTLPNWMAEFKRFT
240 250 260 270 280 290
570 580 590 600 610 620
pF1KA1 PTLKVLCYYGSQEERKQIRFNIHSR---YEDYNVIVTTYNCAISSSDDRSLFRRLKLNYA
: . .. :.:.::::... ::..: . . :..:... :. ::. ... .:
CCDS73 PDIPTMLYHGTQEERQKLVRNIYKRKGTLQIHPVVITSFEIAMR---DRNALQHCYWKYL
300 310 320 330 340 350
630 640 650 660 670 680
pF1KA1 IFDEGHMLKNMGSIRYQHLMTINANNRLLLTGTPVQNNLLELMSLLNFVMPHMFS-----
: :::: .::: ..: .::.:.:::::::.:::: :: :::::..: .:.
CCDS73 IVDEGHRIKNMKCRLIRELKRFNADNKLLLTGTPLQNNLSELWSLLNFLLPDVFDDLKSF
360 370 380 390 400 410
690 700
pF1KA1 ------SSTSEIRRMFSSKTKSADEQSIYEKERIA-------------------------
.: :: . . .: . . . ..:::
CCDS73 ESWFDITSLSETAEDIIAKEREQNVLHMLHQERIPRMYVSEFTDEGFFEGKLPSRKDLYD
420 430 440 450 460 470
710 720 730 740 750
pF1KA1 ------------HAK-QIIKPFILRRVKEEVLKQLPPKKDRIELCAMSEKQEQLYLGLFN
:.. .:. ::.:::.: .: ..:::.. . .:.::: .: .. :
CCDS73 IRPYENTYLLKLHTNFEILTPFLLRRLKSDVALEVPPKREVVVYAPLSKKQEIFYTAIVN
480 490 500 510 520 530
760 770 780 790 800
pF1KA1 RLKKSINNLV--TEKNT-EMCNV---MMQLRKMANHPLLHRQYYTAEKL-KEMSQLMLKE
: .: :. .::.: :. . . :: :. . ::: .... . .:
CCDS73 R---TIANMFGSSEKETIELSPTGRPKRRTRKSINYSKIDDFPNELEKLISQIQPEVDRE
540 550 560 570 580
810 820 830 840 850
pF1KA1 PTHCEANPDLIFE-DMEVMTDFELHVLCKQYRHI---------NNFQLDMDLILDSGKFR
. :.: . : ...... . : : .. .. ..:..: .:. .::::
CCDS73 RAVVEVNIPVESEVNLKLQNIMMLLRKCCNHPYLIEYPIDPVTQEFKIDEELVTNSGKFL
590 600 610 620 630 640
860 870 880 890 900 910
pF1KA1 VLGCILSELKQKGDRVVLFSQFTMMLDILEVLLKHHQHRYLRLDGKTQISERIHLIDEFN
.: .: :::..: .:.::::.: ::::: . .. . ::::. . ::: . . ::
CCDS73 ILDRMLPELKKRGHKVLLFSQMTSMLDILMDYCHLRDFNFSRLDGSMSYSEREKNMHSFN
650 660 670 680 690 700
920 930 940 950 960 970
pF1KA1 TDMDIFVFLLSTKAGGLGINLTSANVVILHDIDCNPYNDKQAEDRCHRVGQTKEVLVIKL
:: ..:.::.::.:::::::::.:..::..: : :: .: ::.:::::.:::: :.: .:
CCDS73 TDPEVFIFLVSTRAGGLGINLTAADTVIIYDSDWNPQSDLQAQDRCHRIGQTKPVVVYRL
710 720 730 740 750 760
980 990 1000 1010 1020
pF1KA1 ISQGTIEESMLKINQQKLKLEQDMTTVDEGDEGSMPADIATLLKTSMGL
.. .::......
CCDS73 VTANTIDQKIVERAAAKRKLEKLIIHKNHFKGGQSGLNLSKNFLDPKELMELLKSRDYER
770 780 790 800 810 820
1028 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 10:49:32 2016 done: Thu Nov 3 10:49:32 2016
Total Scan time: 3.430 Total Display time: 0.210
Function used was FASTA [36.3.4 Apr, 2011]