FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6257, 763 aa 1>>>pF1KB6257 763 - 763 aa - 763 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.5822+/-0.000939; mu= 2.5774+/- 0.056 mean_var=243.3522+/-50.682, 0's: 0 Z-trim(113.1): 86 B-trim: 390 in 2/53 Lambda= 0.082216 statistics sampled from 13695 (13781) to 13695 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.423), width: 16 Scan time: 3.480 The best scores are: opt bits E(32554) CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 ( 763) 5046 611.9 1.2e-174 CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 ( 750) 4954 601.0 2.3e-171 CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 ( 753) 4954 601.0 2.3e-171 CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 ( 728) 4444 540.5 3.6e-153 CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 ( 377) 2490 308.5 1.3e-83 CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 ( 642) 2467 305.9 1.3e-82 CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 ( 808) 1436 183.7 9.9e-46 CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 ( 801) 1112 145.3 3.7e-34 CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 ( 804) 1112 145.3 3.7e-34 CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 ( 622) 836 112.5 2.1e-24 >>CCDS8699.1 SOX5 gene_id:6660|Hs108|chr12 (763 aa) initn: 5046 init1: 5046 opt: 5046 Z-score: 3248.9 bits: 611.9 E(32554): 1.2e-174 Smith-Waterman score: 5046; 100.0% identity (100.0% similar) in 763 aa overlap (1-763:1-763) 10 20 30 40 50 60 pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP 670 680 690 700 710 720 730 740 750 760 pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN ::::::::::::::::::::::::::::::::::::::::::: CCDS86 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 730 740 750 760 >>CCDS44844.1 SOX5 gene_id:6660|Hs108|chr12 (750 aa) initn: 4954 init1: 4954 opt: 4954 Z-score: 3190.1 bits: 601.0 E(32554): 2.3e-171 Smith-Waterman score: 4954; 100.0% identity (100.0% similar) in 750 aa overlap (14-763:1-750) 10 20 30 40 50 60 pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN ::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 MSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN 10 20 30 40 70 80 90 100 110 120 pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL 350 360 370 380 390 400 430 440 450 460 470 480 pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK 410 420 430 440 450 460 490 500 510 520 530 540 pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES 470 480 490 500 510 520 550 560 570 580 590 600 pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL 530 540 550 560 570 580 610 620 630 640 650 660 pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF 590 600 610 620 630 640 670 680 690 700 710 720 pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP 650 660 670 680 690 700 730 740 750 760 pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN ::::::::::::::::::::::::::::::::::::::::::: CCDS44 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 710 720 730 740 750 >>CCDS58217.1 SOX5 gene_id:6660|Hs108|chr12 (753 aa) initn: 4954 init1: 4954 opt: 4954 Z-score: 3190.1 bits: 601.0 E(32554): 2.3e-171 Smith-Waterman score: 4954; 100.0% identity (100.0% similar) in 750 aa overlap (14-763:4-753) 10 20 30 40 50 60 pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN ::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MSVMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM 120 130 140 150 160 170 190 200 210 220 230 240 pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL 180 190 200 210 220 230 250 260 270 280 290 300 pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL 240 250 260 270 280 290 310 320 330 340 350 360 pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI 300 310 320 330 340 350 370 380 390 400 410 420 pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL 360 370 380 390 400 410 430 440 450 460 470 480 pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK 420 430 440 450 460 470 490 500 510 520 530 540 pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES 480 490 500 510 520 530 550 560 570 580 590 600 pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL 540 550 560 570 580 590 610 620 630 640 650 660 pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF 600 610 620 630 640 650 670 680 690 700 710 720 pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP 660 670 680 690 700 710 730 740 750 760 pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN ::::::::::::::::::::::::::::::::::::::::::: CCDS58 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 720 730 740 750 >>CCDS81672.1 SOX5 gene_id:6660|Hs108|chr12 (728 aa) initn: 4430 init1: 4430 opt: 4444 Z-score: 2863.3 bits: 540.5 E(32554): 3.6e-153 Smith-Waterman score: 4721; 95.4% identity (95.4% similar) in 763 aa overlap (1-763:1-728) 10 20 30 40 50 60 pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLH----- 10 20 30 40 50 70 80 90 100 110 120 pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS :::::::::::::::::::::::::::::: CCDS81 ------------------------------EVDGNKVMSSFAPHNSSTSPQKAEEGGRQS 60 70 80 130 140 150 160 170 180 pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM 90 100 110 120 130 140 190 200 210 220 230 240 pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL 150 160 170 180 190 200 250 260 270 280 290 300 pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL 210 220 230 240 250 260 310 320 330 340 350 360 pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI 270 280 290 300 310 320 370 380 390 400 410 420 pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL 330 340 350 360 370 380 430 440 450 460 470 480 pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK 390 400 410 420 430 440 490 500 510 520 530 540 pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES 450 460 470 480 490 500 550 560 570 580 590 600 pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL 510 520 530 540 550 560 610 620 630 640 650 660 pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF 570 580 590 600 610 620 670 680 690 700 710 720 pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP 630 640 650 660 670 680 730 740 750 760 pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN ::::::::::::::::::::::::::::::::::::::::::: CCDS81 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 690 700 710 720 >>CCDS41761.1 SOX5 gene_id:6660|Hs108|chr12 (377 aa) initn: 2490 init1: 2490 opt: 2490 Z-score: 1614.8 bits: 308.5 E(32554): 1.3e-83 Smith-Waterman score: 2490; 100.0% identity (100.0% similar) in 375 aa overlap (389-763:3-377) 360 370 380 390 400 410 pF1KB6 GIPQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMP :::::::::::::::::::::::::::::: CCDS41 MHDEVAQPLNLSAKPKTSDGKSPTSPTSPHMP 10 20 30 420 430 440 450 460 470 pF1KB6 ALRINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ALRINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLD 40 50 60 70 80 90 480 490 500 510 520 530 pF1KB6 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVS 100 110 120 130 140 150 540 550 560 570 580 590 pF1KB6 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMT 160 170 180 190 200 210 600 610 620 630 640 650 pF1KB6 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQ 220 230 240 250 260 270 660 670 680 690 700 710 pF1KB6 YFNVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 YFNVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGE 280 290 300 310 320 330 720 730 740 750 760 pF1KB6 EPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN ::::::::::::::::::::::::::::::::::::::::::::: CCDS41 EPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 340 350 360 370 >>CCDS58216.1 SOX5 gene_id:6660|Hs108|chr12 (642 aa) initn: 2590 init1: 2467 opt: 2467 Z-score: 1596.8 bits: 305.9 E(32554): 1.3e-82 Smith-Waterman score: 4036; 85.6% identity (85.6% similar) in 750 aa overlap (14-763:1-642) 10 20 30 40 50 60 pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN ::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MSSKRPASPYGEADGEVAMVTSRQKVEEEESDGLPAFHLPLHVSFPN 10 20 30 40 70 80 90 100 110 120 pF1KB6 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 KPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGGRQS 50 60 70 80 90 100 130 140 150 160 170 180 pF1KB6 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKLLAM 110 120 130 140 150 160 190 200 210 220 230 240 pF1KB6 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQQMEL 170 180 190 200 210 220 250 260 270 280 290 300 pF1KB6 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAAQQGFLL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KB6 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 PPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSPGGKLPGI 290 300 310 320 330 340 370 380 390 400 410 420 pF1KB6 PQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPKTSDGKSPTSPTSPHMPAL :::::::::::::::::::::::::::: CCDS58 PQGNLGAAVSPTSIHTDKSTNSPPPKSK-------------------------------- 350 360 370 430 440 450 460 470 480 pF1KB6 RINSGAGPLKASVPAALASPSARVSTIGYLNDHDAVTKAIQEARQMKEQLRREQQVLDGK CCDS58 ------------------------------------------------------------ 490 500 510 520 530 540 pF1KB6 VAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES :::::::::::::::::::::::::::::::::::::::::::: CCDS58 ----------------EKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAGVSES 380 390 400 410 550 560 570 580 590 600 pF1KB6 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNL 420 430 440 450 460 470 610 620 630 640 650 660 pF1KB6 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 EKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYF 480 490 500 510 520 530 670 680 690 700 710 720 pF1KB6 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 NVGQQAQIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP 540 550 560 570 580 590 730 740 750 760 pF1KB6 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN ::::::::::::::::::::::::::::::::::::::::::: CCDS58 HIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN 600 610 620 630 640 >>CCDS7821.1 SOX6 gene_id:55553|Hs108|chr11 (808 aa) initn: 2012 init1: 1053 opt: 1436 Z-score: 934.5 bits: 183.7 E(32554): 9.9e-46 Smith-Waterman score: 2822; 58.8% identity (78.0% similar) in 806 aa overlap (26-763:14-808) 10 20 30 40 50 pF1KB6 MLTDPDLPQEFERMSSKRPASPYGEADGEVAM---VTSRQKVEEEESDGLPAFHLPLHVS :::: :: .:::.: :: :: : ::::: CCDS78 MSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHPI 10 20 30 40 60 70 80 90 100 110 pF1KB6 FPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEGG . :::::::. . :. . :... :: ..::. : .. .:.::::.: .::. CCDS78 MHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEGS 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDKL :. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.:. CCDS78 RDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEKM 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 LAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQRQ ...... ::::::::::::::::: ::.:: :::::::::::::::::::::::::: CCDS78 ERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQRQ 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 QMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA-- ::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: CCDS78 QMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAAA 230 240 250 260 270 280 300 310 320 330 pF1KB6 QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQ--------------- :::::.:::..:: : : ::::.::.:::::::. ::.::::: CCDS78 QQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQKGHVSHPQINQRLKG 290 300 310 320 330 340 340 350 360 370 pF1KB6 --------------------------QLYAAQLAAMQVSPGGKLPGIPQG-NLGAAVSPT ::::::::.::::::.:.:. :: : ...:::: CCDS78 LSDRFGRNLDTFEHGGGHSYNHKQIEQLYAAQLASMQVSPGAKMPSTPQPPNTAGTVSPT 350 360 370 380 390 400 380 390 400 410 420 430 pF1KB6 SIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPTSPTSPHMPALRINSGAGPLK .:...: .:: . :::.: ::::::..:::.. :::::::. .:: . . : : CCDS78 GIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPTSPTQNLFPASKTSPVNLPNK 410 420 430 440 450 460 440 450 460 470 pF1KB6 ASVPAALASPSARVSTIGYLN---------DHDAVTKAIQEARQMKEQLRREQQV----- .:.:. ... .: :.. :. :.:.: :::::::.:.::..:::: CCDS78 SSIPSPIGGSLGRGSSLDILSSLNSPALFGDQDTVMKAIQEARKMREQIQREQQQQQPHG 470 480 490 500 510 520 480 490 500 510 520 530 pF1KB6 LDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGSAG .:::.. .:..:::.::.:::.: .:.: ::. :.::.::.. ...:.. :..:.: CCDS78 VDGKLSSINNMGLNSCRNEKERTRFENLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGGAT 530 540 550 560 570 580 540 550 560 570 580 590 pF1KB6 VSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKA :.:.:.::..:::.:.:::::::::::::::::::::::::::::::::::::::::::. CCDS78 VAEARVYRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKS 590 600 610 620 630 640 600 610 620 630 640 650 pF1KB6 MTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEM :.: :::::::::::::: ::::::.:::::::::::.:::::::::::: .::.::::: CCDS78 MSNQEKQPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEM 650 660 670 680 690 700 660 670 680 690 700 710 pF1KB6 RQYFNVGQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYG ::.:.:::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..:::::::: CCDS78 RQFFTVGQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYG 710 720 730 740 750 760 720 730 740 750 760 pF1KB6 VKGEEPHI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN .: . . .: :..:: . :.::.: :::: ::.:..: : .:: CCDS78 MKTDGGSLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN 770 780 790 800 >>CCDS53604.1 SOX6 gene_id:55553|Hs108|chr11 (801 aa) initn: 2204 init1: 867 opt: 1112 Z-score: 726.8 bits: 145.3 E(32554): 3.7e-34 Smith-Waterman score: 2851; 59.5% identity (78.8% similar) in 805 aa overlap (21-763:8-801) 10 20 30 40 50 pF1KB6 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV ::.. :::: :: .:::.: :: :: : ::::: CCDS53 MSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP 10 20 30 40 60 70 80 90 100 110 pF1KB6 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG . :::::::. . :. . :... :: ..::. : .. .:.::::.: .:: CCDS53 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK .:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.: CCDS53 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR . ...... ::::::::::::::::: ::.:: ::::::::::::::::::::::::: CCDS53 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA- :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: CCDS53 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP :::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.::::: CCDS53 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT :.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. :::: CCDS53 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT 350 360 370 380 390 400 420 430 440 450 pF1KB6 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN-- :::. .:: . . : :.:.:. ... .: :..: :: CCDS53 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP 410 420 430 440 450 460 460 470 480 490 500 pF1KB6 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE :.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .: CCDS53 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE 470 480 490 500 510 520 510 520 530 540 pF1KB6 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI .: ::. :.::.::.. ...:.. :..:: : :.:.:. CCDS53 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV 530 540 550 560 570 580 550 560 570 580 590 600 pF1KB6 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: :: CCDS53 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK 590 600 610 620 630 640 610 620 630 640 650 660 pF1KB6 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.: CCDS53 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV 650 660 670 680 690 700 670 680 690 700 710 720 pF1KB6 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP ::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . CCDS53 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG 710 720 730 740 750 760 730 740 750 760 pF1KB6 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN . .: :..:: . :.::.: :::: ::.:..: : .:: CCDS53 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN 770 780 790 800 >>CCDS53605.1 SOX6 gene_id:55553|Hs108|chr11 (804 aa) initn: 2204 init1: 867 opt: 1112 Z-score: 726.8 bits: 145.3 E(32554): 3.7e-34 Smith-Waterman score: 2851; 59.5% identity (78.8% similar) in 805 aa overlap (21-763:11-804) 10 20 30 40 50 pF1KB6 MLTDPDLPQEFERMSSKRPASPYG-EADGEVAM---VTSRQKVEEEESDGLPAFHLPLHV ::.. :::: :: .:::.: :: :: : ::::: CCDS53 MGRMSSKQATSPFACAADGEDAMTQDLTSREK--EEGSDQHVASHLPLHP 10 20 30 40 60 70 80 90 100 110 pF1KB6 SFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVDGNKVMSSFAPHNSSTSPQKAEEG . :::::::. . :. . :... :: ..::. : .. .:.::::.: .:: CCDS53 IMHNKPHSEELPTLVSTIQQDADWDSVLSSQQRMESENNKLCSLYSFRNTSTSPHKPDEG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KB6 GRQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEETPSIEKLLSKDWKDK .:. : ..:...:::::::::::::::::::.:.::. ..: :.. .:::::::::.: CCDS53 SRDR-EIMTSVTFGTPERRKGSLADVVDTLKQKKLEEMTRTEQEDSSCMEKLLSKDWKEK 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB6 LLAMGSGNF-GEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDEQKKLAASQIEKQR . ...... ::::::::::::::::: ::.:: ::::::::::::::::::::::::: CCDS53 MERLNTSELLGEIKGTPESLAEKERQLSTMITQLISLREQLLAAHDEQKKLAASQIEKQR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB6 QQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPVFPPDQRTLAAAA- :::.::.:::::::::::::::::::::::::::::::..::::::.:: ::::::::: CCDS53 QQMDLARQQQEQIARQQQQLLQQQHKINLLQQQIQVQGHMPPLMIPIFPHDQRTLAAAAA 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB6 -QQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLYAAQLAAMQVSP :::::.:::..:: : : ::::.::.:::::::. ::.:::::::::::::.::::: CCDS53 AQQGFLFPPGITYKPG--DNYPVQFIPSTMAAAAAS--GLSPLQLQQLYAAQLASMQVSP 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB6 GGKLPGIPQG-NLGAAVSPTSIHTDKSTNSPPPKSKDEVA-QPLNLSAKPKTSDG-KSPT :.:.:. :: : ...::::.:...: .:: . :::.: ::::::..:::.. :::: CCDS53 GAKMPSTPQPPNTAGTVSPTGIKNEKRGTSPVTQVKDEAAAQPLNLSSRPKTAEPVKSPT 350 360 370 380 390 400 420 430 440 450 pF1KB6 SPTSPHMPALRINSGAGPLKASVPAALASPSARVSTIGY-----------------LN-- :::. .:: . . : :.:.:. ... .: :..: :: CCDS53 SPTQNLFPASKTSPVNLPNKSSIPSPIGGSLGRGSSLGKWKSQHQEETYELDILSSLNSP 410 420 430 440 450 460 460 470 480 490 500 pF1KB6 ----DHDAVTKAIQEARQMKEQLRREQQV-----LDGKVAVVNSLGLNNCRTEKEKTTLE :.:.: :::::::.:.::..:::: .:::.. .:..:::.::.:::.: .: CCDS53 ALFGDQDTVMKAIQEARKMREQIQREQQQQQPHGVDGKLSSINNMGLNSCRNEKERTRFE 470 480 490 500 510 520 510 520 530 540 pF1KB6 SLTQQLAVKQNEEGKFSHAMMDFNLSGDSDGS--------------------AGVSESRI .: ::. :.::.::.. ...:.. :..:: : :.:.:. CCDS53 NLGPQLTGKSNEDGKLGPGVIDLTRPEDAEGSKAMNGSAAKLQQYYCWPTGGATVAEARV 530 540 550 560 570 580 550 560 570 580 590 600 pF1KB6 YRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKAMTNLEK ::..:::.:.:::::::::::::::::::::::::::::::::::::::::::.:.: :: CCDS53 YRDARGRASSEPHIKRPMNAFMVWAKDERRKILQAFPDMHNSNISKILGSRWKSMSNQEK 590 600 610 620 630 640 610 620 630 640 650 660 pF1KB6 QPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLRIGEYKAIMRNRRQEMRQYFNV :::::::::::: ::::::.:::::::::::.:::::::::::: .::.:::::::.:.: CCDS53 QPYYEEQARLSKIHLEKYPNYKYKPRPKRTCIVDGKKLRIGEYKQLMRSRRQEMRQFFTV 650 660 670 680 690 700 670 680 690 700 710 720 pF1KB6 GQQAQIPIATA-GVVYPGAIAMAGM-PSPHLPSEHSSVSSSPEPGMPVIQSTYGVKGEEP ::: ::::.:. ::::::::.:: :::.. :. ::.:.::::..::::::::.: . CCDS53 GQQPQIPITTGTGVVYPGAITMATTTPSPQMTSDCSSTSASPEPSLPVIQSTYGMKTDGG 710 720 730 740 750 760 730 740 750 760 pF1KB6 HI--KEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAGQAN . .: :..:: . :.::.: :::: ::.:..: : .:: CCDS53 SLAGNEMINGED-EMEMYDDY---EDDPKSDYSSENEAPEAVSAN 770 780 790 800 >>CCDS44299.1 SOX13 gene_id:9580|Hs108|chr1 (622 aa) initn: 1270 init1: 679 opt: 836 Z-score: 551.4 bits: 112.5 E(32554): 2.1e-24 Smith-Waterman score: 1486; 43.6% identity (65.1% similar) in 685 aa overlap (75-755:30-616) 50 60 70 80 90 100 pF1KB6 DGLPAFHLPLHVSFPNKPHSEEFQPVSLLTQETCGHRTPTSQHNTMEVD-GNKVMSSFAP .: : :..: .. .. : . :. . .: CCDS44 MSMRSPISAQLALDGVGTMVNCTIKSEEKKEPC-HEAPQGSATAAEPQPGDPARAS--- 10 20 30 40 50 110 120 130 140 150 160 pF1KB6 HNSSTSPQKAEEGG-RQSGESLSSTALGTPERRKGSLADVVDTLKQRKMEELIKNEPEET ..:..:: .:. : : . : . :.:: .. ....... .:.:.. . .: : . CCDS44 -QDSADPQAPAQGNFRGSWDCSSPEGNGSPEPKRPGVSEAASG-SQEKLD-FNRNLKEVV 60 70 80 90 100 110 170 180 190 200 210 220 pF1KB6 PSIEKLLSKDWKDKLLAMGSGNFGEIKGTPESLAEKERQLMGMINQLTSLREQLLAAHDE :.::::::.:::...:. .: . ..::: ::::::: ::. ::.::..::.:::.::.: CCDS44 PAIEKLLSSDWKERFLGRNSMEAKDVKGTQESLAEKELQLLVMIHQLSTLRDQLLTAHSE 120 130 140 150 160 170 230 240 250 260 270 280 pF1KB6 QKKLAASQIEKQRQQMELAKQQQEQIARQQQQLLQQQHKINLLQQQIQVQGQLPPLMIPV ::..:: .:::.::::::.:::::::.:::::.:::::::::::::: : ..: .:::. CCDS44 QKNMAAMLFEKQQQQMELARQQQEQIAKQQQQLIQQQHKINLLQQQIQ-QVNMPYVMIPA 180 190 200 210 220 230 290 300 310 320 330 340 pF1KB6 FPPDQRTLAAAAQQGFLLPPGFSYKAGCSDPYPVQLIPTTMAAAAAATPGLGPLQLQQLY :::... : .. .. . :: .: :: : :::: . CCDS44 FPPSHQPLPVTPDSQLALP--------------IQPIPC--------KPVEYPLQLLHSP 240 250 260 350 360 370 380 390 400 pF1KB6 AAQLAAMQVSPGGKLPGIPQGNLGAAVSPTSIHTDKSTNSPPPKSKDEVAQPLNLSAKPK : : : :: .:. : .: .:::::.:::: CCDS44 PA--------PVVKRPGA-----------------MATHHP----LQEPSQPLNLTAKPK 270 280 290 300 410 420 430 440 450 460 pF1KB6 TSDGKSPTSPTSPHMPALRINSGAG-PLKASVPAALASPSARVSTIGYLNDHDAVTKAIQ .: :.. :.:...: . : . . :. . : .:.:.. :::::::: CCDS44 -----APELPNTSSSPSLKMSSCVPRPPSHGGPTRDLQSSPPSLPLGFLGEGDAVTKAIQ 310 320 330 340 350 470 480 490 500 510 520 pF1KB6 EARQMKEQLRREQQVLDGKVAVVNSLGLNNCRTEKEKTTLESLTQQLAVKQNEEGKFSHA .:::. :. .. .:::. : .:. .:.: .:. : : CCDS44 DARQL---LHSHSGALDGS---------PNTPFRKDLISLDSSP----AKERLEDGCVHP 360 370 380 390 530 540 550 560 570 580 pF1KB6 MMDFNLSGDSDGSAGVSESRIYRESRGRGSNEPHIKRPMNAFMVWAKDERRKILQAFPDM . . :: : ::: ::: : ::::::::::::::::::::::::::: CCDS44 LEEAMLSCDMDGSRHFPESR----------NSSHIKRPMNAFMVWAKDERRKILQAFPDM 400 410 420 430 440 590 600 610 620 630 640 pF1KB6 HNSNISKILGSRWKAMTNLEKQPYYEEQARLSKQHLEKYPDYKYKPRPKRTCLVDGKKLR :::.::::::::::.::: :::::::::::::.:::::::::::::::::::.:.::.:: CCDS44 HNSSISKILGSRWKSMTNQEKQPYYEEQARLSRQHLEKYPDYKYKPRPKRTCIVEGKRLR 450 460 470 480 490 500 650 660 670 680 690 700 pF1KB6 IGEYKAIMRNRRQEMRQYFNVGQQA-QIPIATAGVVYPGAIAMAGMPSPHLPSEHSSVSS .:::::.::.:::. :: . . :: :. .... :.:: : :::: . :: : CCDS44 VGEYKALMRTRRQDARQSYVIPPQAGQVQMSSSDVLYPRA---AGMPLAQPLVEHY-VPR 510 520 530 540 550 560 710 720 730 740 750 760 pF1KB6 SPEPGMPVIQSTYGVKGEEPHIKEEIQAEDINGEIYDEYDEEEDDPDVDYGSDSENHIAG : .:.:::: .: ... : .. .. : ::.: .:.:.::. . . ::.: CCDS44 SLDPNMPVIVNTCSLREEGEGTDDRHSVAD--GEMY-RYSEDEDS-EGEEKSDGELVVLT 570 580 590 600 610 620 pF1KB6 QAN CCDS44 D 763 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 15:14:12 2016 done: Mon Nov 7 15:14:13 2016 Total Scan time: 3.480 Total Display time: 0.230 Function used was FASTA [36.3.4 Apr, 2011]