FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB6257, 763 aa
1>>>pF1KB6257 763 - 763 aa - 763 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.5822+/-0.000939; mu= 2.5774+/- 0.056
mean_var=243.3522+/-50.682, 0's: 0 Z-trim(113.1): 86 B-trim: 390 in 2/53
Lambda= 0.082216
statistics sampled from 13695 (13781) to 13695 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.423), width: 16
Scan time: 3.480
The best scores are: opt bits E(32554)
CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 ( 763) 5046 611.9 1.2e-174
CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 ( 750) 4954 601.0 2.3e-171
CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 ( 753) 4954 601.0 2.3e-171
CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 ( 728) 4444 540.5 3.6e-153
CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 ( 377) 2490 308.5 1.3e-83
CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 ( 642) 2467 305.9 1.3e-82
CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 ( 808) 1436 183.7 9.9e-46
CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 ( 801) 1112 145.3 3.7e-34
CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 ( 804) 1112 145.3 3.7e-34
CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 ( 622) 836 112.5 2.1e-24
>>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 (763 aa)
initn: 5046 init1: 5046 opt: 5046 Z-score: 3248.9 bits: 611.9 E(32554): 1.2e-174
Smith-Waterman score: 5046; 100.0% identity (100.0% similar) in 763 aa overlap (1-763:1-763)
10 20 30 40 50 60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
670 680 690 700 710 720
730 740 750 760
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
:::::::::::::::::::::::::::::::::::::::::::
CCDS86 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
730 740 750 760
>>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 (750 aa)
initn: 4954 init1: 4954 opt: 4954 Z-score: 3190.1 bits: 601.0 E(32554): 2.3e-171
Smith-Waterman score: 4954; 100.0% identity (100.0% similar) in 750 aa overlap (14-763:1-750)
10 20 30 40 50 60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
10 20 30 40
70 80 90 100 110 120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
350 360 370 380 390 400
430 440 450 460 470 480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
410 420 430 440 450 460
490 500 510 520 530 540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
470 480 490 500 510 520
550 560 570 580 590 600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
530 540 550 560 570 580
610 620 630 640 650 660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
590 600 610 620 630 640
670 680 690 700 710 720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
650 660 670 680 690 700
730 740 750 760
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
:::::::::::::::::::::::::::::::::::::::::::
CCDS44 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
710 720 730 740 750
>>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 (753 aa)
initn: 4954 init1: 4954 opt: 4954 Z-score: 3190.1 bits: 601.0 E(32554): 2.3e-171
Smith-Waterman score: 4954; 100.0% identity (100.0% similar) in 750 aa overlap (14-763:4-753)
10 20 30 40 50 60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MSVMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
10 20 30 40 50
70 80 90 100 110 120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
420 430 440 450 460 470
490 500 510 520 530 540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
600 610 620 630 640 650
670 680 690 700 710 720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
660 670 680 690 700 710
730 740 750 760
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
:::::::::::::::::::::::::::::::::::::::::::
CCDS58 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
720 730 740 750
>>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 (728 aa)
initn: 4430 init1: 4430 opt: 4444 Z-score: 2863.3 bits: 540.5 E(32554): 3.6e-153
Smith-Waterman score: 4721; 95.4% identity (95.4% similar) in 763 aa overlap (1-763:1-728)
10 20 30 40 50 60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLH-----
10 20 30 40 50
70 80 90 100 110 120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
::::::::::::::::::::::::::::::
CCDS81 ------------------------------EVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
60 70 80
130 140 150 160 170 180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
90 100 110 120 130 140
190 200 210 220 230 240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
150 160 170 180 190 200
250 260 270 280 290 300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
210 220 230 240 250 260
310 320 330 340 350 360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
270 280 290 300 310 320
370 380 390 400 410 420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
330 340 350 360 370 380
430 440 450 460 470 480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
390 400 410 420 430 440
490 500 510 520 530 540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
450 460 470 480 490 500
550 560 570 580 590 600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
510 520 530 540 550 560
610 620 630 640 650 660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
570 580 590 600 610 620
670 680 690 700 710 720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS81 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
630 640 650 660 670 680
730 740 750 760
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
:::::::::::::::::::::::::::::::::::::::::::
CCDS81 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
690 700 710 720
>>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 (377 aa)
initn: 2490 init1: 2490 opt: 2490 Z-score: 1614.8 bits: 308.5 E(32554): 1.3e-83
Smith-Waterman score: 2490; 100.0% identity (100.0% similar) in 375 aa overlap (389-763:3-377)
360 370 380 390 400 410
pF1KB6 GIPQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMP
::::::::::::::::::::::::::::::
CCDS41 MHDEVAQPLNLSAKPKTSDGKSPTSPTSPHMP
10 20 30
420 430 440 450 460 470
pF1KB6 ALRINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 ALRINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD
40 50 60 70 80 90
480 490 500 510 520 530
pF1KB6 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS
100 110 120 130 140 150
540 550 560 570 580 590
pF1KB6 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT
160 170 180 190 200 210
600 610 620 630 640 650
pF1KB6 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ
220 230 240 250 260 270
660 670 680 690 700 710
pF1KB6 YFNVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 YFNVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGE
280 290 300 310 320 330
720 730 740 750 760
pF1KB6 EPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
:::::::::::::::::::::::::::::::::::::::::::::
CCDS41 EPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
340 350 360 370
>>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 (642 aa)
initn: 2590 init1: 2467 opt: 2467 Z-score: 1596.8 bits: 305.9 E(32554): 1.3e-82
Smith-Waterman score: 4036; 85.6% identity (85.6% similar) in 750 aa overlap (14-763:1-642)
10 20 30 40 50 60
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN
10 20 30 40
70 80 90 100 110 120
pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS
50 60 70 80 90 100
130 140 150 160 170 180
pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM
110 120 130 140 150 160
190 200 210 220 230 240
pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL
170 180 190 200 210 220
250 260 270 280 290 300
pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL
230 240 250 260 270 280
310 320 330 340 350 360
pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI
290 300 310 320 330 340
370 380 390 400 410 420
pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL
::::::::::::::::::::::::::::
CCDS58 PQGNLGAAVSPTSIHTDKSTNSPPPKSK--------------------------------
350 360 370
430 440 450 460 470 480
pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK
CCDS58 ------------------------------------------------------------
490 500 510 520 530 540
pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
::::::::::::::::::::::::::::::::::::::::::::
CCDS58 ----------------EKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES
380 390 400 410
550 560 570 580 590 600
pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL
420 430 440 450 460 470
610 620 630 640 650 660
pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF
480 490 500 510 520 530
670 680 690 700 710 720
pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
540 550 560 570 580 590
730 740 750 760
pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
:::::::::::::::::::::::::::::::::::::::::::
CCDS58 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
600 610 620 630 640
>>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 (808 aa)
initn: 2012 init1: 1053 opt: 1436 Z-score: 934.5 bits: 183.7 E(32554): 9.9e-46
Smith-Waterman score: 2822; 58.8% identity (78.0% similar) in 806 aa overlap (26-763:14-808)
10 20 30 40 50
pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVS
:::: :: .:::.: :: :: : :::::
CCDS78 MSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPI
10 20 30 40
60 70 80 90 100 110
pF1KB6 FPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG
. :::::::. . :. . :... :: ..::. : .. .:.::::.: .::.
CCDS78 MHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGS
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB6 RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKL
:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:.
CCDS78 RDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKM
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB6 LAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQ
...... ::::::::::::::::: ::.:: ::::::::::::::::::::::::::
CCDS78 ERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQ
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 QMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA--
::.::.:::::::::::::::::::::::::::::::..::::::.:: :::::::::
CCDS78 QMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAA
230 240 250 260 270 280
300 310 320 330
pF1KB6 QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQ---------------
:::::.:::..:: : : ::::.::.:::::::. ::.:::::
CCDS78 QQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQKGHVSHPQINQRLKG
290 300 310 320 330 340
340 350 360 370
pF1KB6 --------------------------QLYAAQLAAMQVSPGGKLPGIPQG-NLGAAVSPT
::::::::.::::::.:.:. :: : ...::::
CCDS78 LSDRFGRNLDTFEHGGGHSYNHKQIEQLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPT
350 360 370 380 390 400
380 390 400 410 420 430
pF1KB6 SIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPALRINSGAGPLK
.:...: .:: . :::.: ::::::..:::.. :::::::. .:: . . : :
CCDS78 GIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNK
410 420 430 440 450 460
440 450 460 470
pF1KB6 ASVPAALASPSARVSTIGYLN---------DHDAVTKAIQEARQMKEQLRREQQV-----
.:.:. ... .: :.. :. :.:.: :::::::.:.::..::::
CCDS78 SSIPSPIGGSLGRGSSLDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHG
470 480 490 500 510 520
480 490 500 510 520 530
pF1KB6 LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAG
.:::.. .:..:::.::.:::.: .:.: ::. :.::.::.. ...:.. :..:.:
CCDS78 VDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGGAT
530 540 550 560 570 580
540 550 560 570 580 590
pF1KB6 VSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKA
:.:.:.::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.
CCDS78 VAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKS
590 600 610 620 630 640
600 610 620 630 640 650
pF1KB6 MTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEM
:.: :::::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::
CCDS78 MSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEM
650 660 670 680 690 700
660 670 680 690 700 710
pF1KB6 RQYFNVGQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYG
::.:.:::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::
CCDS78 RQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYG
710 720 730 740 750 760
720 730 740 750 760
pF1KB6 VKGEEPHI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
.: . . .: :..:: . :.::.: :::: ::.:..: : .::
CCDS78 MKTDGGSLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
770 780 790 800
>>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 (801 aa)
initn: 2204 init1: 867 opt: 1112 Z-score: 726.8 bits: 145.3 E(32554): 3.7e-34
Smith-Waterman score: 2851; 59.5% identity (78.8% similar) in 805 aa overlap (21-763:8-801)
10 20 30 40 50
pF1KB6 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV
::.. :::: :: .:::.: :: :: : :::::
CCDS53 MSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
10 20 30 40
60 70 80 90 100 110
pF1KB6 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG
. :::::::. . :. . :... :: ..::. : .. .:.::::.: .::
CCDS53 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB6 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
.:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:
CCDS53 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB6 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
. ...... ::::::::::::::::: ::.:: :::::::::::::::::::::::::
CCDS53 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
:::.::.:::::::::::::::::::::::::::::::..::::::.:: :::::::::
CCDS53 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB6 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
:::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.:::::
CCDS53 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB6 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
:.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. ::::
CCDS53 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
350 360 370 380 390 400
420 430 440 450
pF1KB6 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
:::. .:: . . : :.:.:. ... .: :..: ::
CCDS53 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
410 420 430 440 450 460
460 470 480 490 500
pF1KB6 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
:.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:
CCDS53 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
470 480 490 500 510 520
510 520 530 540
pF1KB6 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
.: ::. :.::.::.. ...:.. :..:: : :.:.:.
CCDS53 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
530 540 550 560 570 580
550 560 570 580 590 600
pF1KB6 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS53 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
590 600 610 620 630 640
610 620 630 640 650 660
pF1KB6 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
:::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS53 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
650 660 670 680 690 700
670 680 690 700 710 720
pF1KB6 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: .
CCDS53 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
710 720 730 740 750 760
730 740 750 760
pF1KB6 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
. .: :..:: . :.::.: :::: ::.:..: : .::
CCDS53 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
770 780 790 800
>>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 (804 aa)
initn: 2204 init1: 867 opt: 1112 Z-score: 726.8 bits: 145.3 E(32554): 3.7e-34
Smith-Waterman score: 2851; 59.5% identity (78.8% similar) in 805 aa overlap (21-763:11-804)
10 20 30 40 50
pF1KB6 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV
::.. :::: :: .:::.: :: :: : :::::
CCDS53 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP
10 20 30 40
60 70 80 90 100 110
pF1KB6 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG
. :::::::. . :. . :... :: ..::. : .. .:.::::.: .::
CCDS53 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB6 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK
.:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:
CCDS53 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB6 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR
. ...... ::::::::::::::::: ::.:: :::::::::::::::::::::::::
CCDS53 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB6 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-
:::.::.:::::::::::::::::::::::::::::::..::::::.:: :::::::::
CCDS53 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB6 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP
:::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.:::::
CCDS53 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB6 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT
:.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. ::::
CCDS53 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT
350 360 370 380 390 400
420 430 440 450
pF1KB6 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN--
:::. .:: . . : :.:.:. ... .: :..: ::
CCDS53 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP
410 420 430 440 450 460
460 470 480 490 500
pF1KB6 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE
:.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .:
CCDS53 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE
470 480 490 500 510 520
510 520 530 540
pF1KB6 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI
.: ::. :.::.::.. ...:.. :..:: : :.:.:.
CCDS53 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV
530 540 550 560 570 580
550 560 570 580 590 600
pF1KB6 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK
::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: ::
CCDS53 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK
590 600 610 620 630 640
610 620 630 640 650 660
pF1KB6 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV
:::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.:
CCDS53 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV
650 660 670 680 690 700
670 680 690 700 710 720
pF1KB6 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP
::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: .
CCDS53 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG
710 720 730 740 750 760
730 740 750 760
pF1KB6 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN
. .: :..:: . :.::.: :::: ::.:..: : .::
CCDS53 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN
770 780 790 800
>>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 (622 aa)
initn: 1270 init1: 679 opt: 836 Z-score: 551.4 bits: 112.5 E(32554): 2.1e-24
Smith-Waterman score: 1486; 43.6% identity (65.1% similar) in 685 aa overlap (75-755:30-616)
50 60 70 80 90 100
pF1KB6 DGLPAFHLPLHVSFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVD-GNKVMSSFAP
.: : :..: .. .. : . :. . .:
CCDS44 MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPC-HEAPQGSATAAEPQPGDPARAS---
10 20 30 40 50
110 120 130 140 150 160
pF1KB6 HNSSTSPQKAEEGG-RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEET
..:..:: .:. : : . : . :.:: .. ....... .:.:.. . .: : .
CCDS44 -QDSADPQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASG-SQEKLD-FNRNLKEVV
60 70 80 90 100 110
170 180 190 200 210 220
pF1KB6 PSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDE
:.::::::.:::...:. .: . ..::: ::::::: ::. ::.::..::.:::.::.:
CCDS44 PAIEKLLSSDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSE
120 130 140 150 160 170
230 240 250 260 270 280
pF1KB6 QKKLAASQIEKQRQQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPV
::..:: .:::.::::::.:::::::.:::::.:::::::::::::: : ..: .:::.
CCDS44 QKNMAAMLFEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPA
180 190 200 210 220 230
290 300 310 320 330 340
pF1KB6 FPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLY
:::... : .. .. . :: .: :: : :::: .
CCDS44 FPPSHQPLPVTPDSQLALP--------------IQPIPC--------KPVEYPLQLLHSP
240 250 260
350 360 370 380 390 400
pF1KB6 AAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPK
: : : :: .:. : .: .:::::.::::
CCDS44 PA--------PVVKRPGA-----------------MATHHP----LQEPSQPLNLTAKPK
270 280 290 300
410 420 430 440 450 460
pF1KB6 TSDGKSPTSPTSPHMPALRINSGAG-PLKASVPAALASPSARVSTIGYLNDHDAVTKAIQ
.: :.. :.:...: . : . . :. . : .:.:.. ::::::::
CCDS44 -----APELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQ
310 320 330 340 350
470 480 490 500 510 520
pF1KB6 EARQMKEQLRREQQVLDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHA
.:::. :. .. .:::. : .:. .:.: .:. : :
CCDS44 DARQL---LHSHSGALDGS---------PNTPFRKDLISLDSSP----AKERLEDGCVHP
360 370 380 390
530 540 550 560 570 580
pF1KB6 MMDFNLSGDSDGSAGVSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDM
. . :: : ::: ::: : :::::::::::::::::::::::::::
CCDS44 LEEAMLSCDMDGSRHFPESR----------NSSHIKRPMNAFMVWAKDERRKILQAFPDM
400 410 420 430 440
590 600 610 620 630 640
pF1KB6 HNSNISKILGSRWKAMTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLR
:::.::::::::::.::: :::::::::::::.:::::::::::::::::::.:.::.::
CCDS44 HNSSISKILGSRWKSMTNQEKQPYYEEQARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLR
450 460 470 480 490 500
650 660 670 680 690 700
pF1KB6 IGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSS
.:::::.::.:::. :: . . :: :. .... :.:: : :::: . :: :
CCDS44 VGEYKALMRTRRQDARQSYVIPPQAGQVQMSSSDVLYPRA---AGMPLAQPLVEHY-VPR
510 520 530 540 550 560
710 720 730 740 750 760
pF1KB6 SPEPGMPVIQSTYGVKGEEPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAG
: .:.:::: .: ... : .. .. : ::.: .:.:.::. . . ::.:
CCDS44 SLDPNMPVIVNTCSLREEGEGTDDRHSVAD--GEMY-RYSEDEDS-EGEEKSDGELVVLT
570 580 590 600 610 620
pF1KB6 QAN
CCDS44 D
763 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 15:14:12 2016 done: Mon Nov 7 15:14:13 2016
Total Scan time: 3.480 Total Display time: 0.230
Function used was FASTA [36.3.4 Apr, 2011]