FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9765, 903 aa
1>>>pF1KB9765 903 - 903 aa - 903 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 9.0157+/-0.00108; mu= 6.7261+/- 0.065
mean_var=278.8550+/-57.898, 0's: 0 Z-trim(112.6): 50 B-trim: 0 in 0/51
Lambda= 0.076804
statistics sampled from 13278 (13317) to 13278 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.717), E-opt: 0.2 (0.409), width: 16
Scan time: 3.670
The best scores are: opt bits E(32554)
CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 ( 903) 5987 677.6 2.8e-194
CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 ( 901) 5963 674.9 1.8e-193
CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14 ( 933) 5871 664.8 2.1e-190
CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14 ( 920) 5339 605.8 1.2e-172
CCDS12694.1 NPAS1 gene_id:4861|Hs108|chr19 ( 590) 579 78.2 5.1e-14
CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 ( 766) 553 75.4 4.5e-13
CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 ( 667) 543 74.2 8.7e-13
>>CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 (903 aa)
initn: 5987 init1: 5987 opt: 5987 Z-score: 3601.5 bits: 677.6 E(32554): 2.8e-194
Smith-Waterman score: 5987; 100.0% identity (100.0% similar) in 903 aa overlap (1-903:1-903)
10 20 30 40 50 60
pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAHL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB9 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME
790 800 810 820 830 840
850 860 870 880 890 900
pF1KB9 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER
850 860 870 880 890 900
pF1KB9 KED
:::
CCDS55 KED
>>CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 (901 aa)
initn: 5335 init1: 5335 opt: 5963 Z-score: 3587.1 bits: 674.9 E(32554): 1.8e-193
Smith-Waterman score: 5963; 99.8% identity (99.8% similar) in 903 aa overlap (1-903:1-901)
10 20 30 40 50 60
pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAHL
:::::::::::::::::::::::::::::::::::::: ::::::::::::::::::::
CCDS96 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVK--GAQRRRSPSALAIEVFEAHL
70 80 90 100 110
130 140 150 160 170 180
pF1KB9 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 GSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB9 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 GMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKST
180 190 200 210 220 230
250 260 270 280 290 300
pF1KB9 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 LTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAHALPPPTINEVRIDC
240 250 260 270 280 290
310 320 330 340 350 360
pF1KB9 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 HMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQ
300 310 320 330 340 350
370 380 390 400 410 420
pF1KB9 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 CVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPH
360 370 380 390 400 410
430 440 450 460 470 480
pF1KB9 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 LPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDND
420 430 440 450 460 470
490 500 510 520 530 540
pF1KB9 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 MNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQ
480 490 500 510 520 530
550 560 570 580 590 600
pF1KB9 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 NCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSASSPGGLDAGL
540 550 560 570 580 590
610 620 630 640 650 660
pF1KB9 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 VEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYSMTKPPSSEH
600 610 620 630 640 650
670 680 690 700 710 720
pF1KB9 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 FPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAPVASDPLSPP
660 670 680 690 700 710
730 740 750 760 770 780
pF1KB9 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 LSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEALQRLQAGNVVLPLVHRVT
720 730 740 750 760 770
790 800 810 820 830 840
pF1KB9 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 GTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNFVDVNSPGFGLDPKTPME
780 790 800 810 820 830
850 860 870 880 890 900
pF1KB9 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS96 MLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTLPFPVYSNGIHAAQTLER
840 850 860 870 880 890
pF1KB9 KED
:::
CCDS96 KED
900
>>CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14 (933 aa)
initn: 5871 init1: 5871 opt: 5871 Z-score: 3531.8 bits: 664.8 E(32554): 2.1e-190
Smith-Waterman score: 5917; 96.8% identity (96.8% similar) in 933 aa overlap (1-903:1-933)
10 20 30
pF1KB9 MAPTKPSFQQDPSRRER------------------------------LQALRKEKSRDAA
::::::::::::::::: :::::::::::::
CCDS53 MAPTKPSFQQDPSRRERITAQHPLPNQSECRKIYRYDGIYCESTYQNLQALRKEKSRDAA
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB9 RSRRGKENFEFYELAKLLPLPAAITSQLDKASIIRLTISYLKMRDFANQGDPPWNLRMEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RSRRGKENFEFYELAKLLPLPAAITSQLDKASIIRLTISYLKMRDFANQGDPPWNLRMEG
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB9 PPPNTSVKVIGAQRRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 PPPNTSVKVIGAQRRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSI
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB9 YLGLSQVELTGSSVFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 YLGLSQVELTGSSVFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSE
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB9 TPEPVESTSPSLLTTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TPEPVESTSPSLLTTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSH
250 260 270 280 290 300
280 290 300 310 320 330
pF1KB9 GRTVPSQIMGLVVVAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 GRTVPSQIMGLVVVAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVD
310 320 330 340 350 360
340 350 360 370 380 390
pF1KB9 IVGKRCYHFIHAEDVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 IVGKRCYHFIHAEDVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKN
370 380 390 400 410 420
400 410 420 430 440 450
pF1KB9 ANEKNIIWVNYLLSNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ANEKNIIWVNYLLSNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNEN
430 440 450 460 470 480
460 470 480 490 500 510
pF1KB9 SKSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SKSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENP
490 500 510 520 530 540
520 530 540 550 560 570
pF1KB9 KAGEDGFGALGAMQIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KAGEDGFGALGAMQIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKR
550 560 570 580 590 600
580 590 600 610 620 630
pF1KB9 KKRRKRQKGGSASRRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KKRRKRQKGGSASRRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDN
610 620 630 640 650 660
640 650 660 670 680 690
pF1KB9 DSSIWNYPPNREISRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DSSIWNYPPNREISRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPG
670 680 690 700 710 720
700 710 720 730 740 750
pF1KB9 ADGAAARKTQFGASATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 ADGAAARKTQFGASATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSA
730 740 750 760 770 780
760 770 780 790 800 810
pF1KB9 SNSLLYTGDLEALQRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SNSLLYTGDLEALQRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAM
790 800 810 820 830 840
820 830 840 850 860 870
pF1KB9 QSNLLPNAHAVNFVDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QSNLLPNAHAVNFVDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAG
850 860 870 880 890 900
880 890 900
pF1KB9 NVFTTAEGLFSTLPFPVYSNGIHAAQTLERKED
:::::::::::::::::::::::::::::::::
CCDS53 NVFTTAEGLFSTLPFPVYSNGIHAAQTLERKED
910 920 930
>>CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14 (920 aa)
initn: 5339 init1: 5339 opt: 5339 Z-score: 3213.3 bits: 605.8 E(32554): 1.2e-172
Smith-Waterman score: 5943; 98.2% identity (98.2% similar) in 920 aa overlap (1-903:1-920)
10 20 30 40 50 60
pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
10 20 30 40 50 60
70 80 90 100
pF1KB9 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVK-----------------VIGAQ
:::::::::::::::::::::::::::::::::::::: :::::
CCDS53 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKGIQMWKSELCMRKTPCEVIGAQ
70 80 90 100 110 120
110 120 130 140 150 160
pF1KB9 RRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RRRSPSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSS
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB9 VFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VFDYVHPGDHVEMAEQLGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLL
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB9 TTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TTDNTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVV
250 260 270 280 290 300
290 300 310 320 330 340
pF1KB9 VAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VAHALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAE
310 320 330 340 350 360
350 360 370 380 390 400
pF1KB9 DVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 DVEGIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLL
370 380 390 400 410 420
410 420 430 440 450 460
pF1KB9 SNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SNPEYKDTPMDIAQLPHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENS
430 440 450 460 470 480
470 480 490 500 510 520
pF1KB9 EDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAM
490 500 510 520 530 540
530 540 550 560 570 580
pF1KB9 QIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QIKVERYVESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSAS
550 560 570 580 590 600
590 600 610 620 630 640
pF1KB9 RRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 RRRLSSASSPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREI
610 620 630 640 650 660
650 660 670 680 690 700
pF1KB9 SRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SRNESPYSMTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGA
670 680 690 700 710 720
710 720 730 740 750 760
pF1KB9 SATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SATAALAPVASDPLSPPLSASPRDKHPGNGGGGGGGGGGAGGGGPSASNSLLYTGDLEAL
730 740 750 760 770 780
770 780 790 800 810 820
pF1KB9 QRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 QRLQAGNVVLPLVHRVTGTLAATSTAAQRVYTTGTIRYAPAEVTLAMQSNLLPNAHAVNF
790 800 810 820 830 840
830 840 850 860 870 880
pF1KB9 VDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 VDVNSPGFGLDPKTPMEMLYHHVHRLNMSGPFGGAVSAASLTQMPAGNVFTTAEGLFSTL
850 860 870 880 890 900
890 900
pF1KB9 PFPVYSNGIHAAQTLERKED
::::::::::::::::::::
CCDS53 PFPVYSNGIHAAQTLERKED
910 920
>>CCDS12694.1 NPAS1 gene_id:4861|Hs108|chr19 (590 aa)
initn: 1443 init1: 528 opt: 579 Z-score: 365.2 bits: 78.2 E(32554): 5.1e-14
Smith-Waterman score: 1568; 52.7% identity (76.3% similar) in 465 aa overlap (18-466:42-483)
10 20 30 40
pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKL
::: ::::::.::::::::::.::.:::::
CCDS12 SEVKCVGGRGASVPWDFLPGLMVKAPSGPCLQAQRKEKSRNAARSRRGKENLEFFELAKL
20 30 40 50 60 70
50 60 70 80 90 100
pF1KB9 LPLPAAITSQLDKASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKVIGAQRRRS
::::.::.::::::::.::...::..: :: : :::.:: ::: . : ::.
CCDS12 LPLPGAISSQLDKASIVRLSVTYLRLRRFAALGAPPWGLRAAGPPAGL------APGRRG
80 90 100 110 120
110 120 130 140 150 160
pF1KB9 PSALAIEVFEAHLGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDY
:.::. :::: :::.::::::::::::::::::::::::::::::::::::.::::::::
CCDS12 PAALVSEVFEQHLGGHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVEMTGSSVFDY
130 140 150 160 170 180
170 180 190 200 210 220
pF1KB9 VHPGDHVEMAEQLGMKLP-PGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTD
.::::: :. ::::.. : :: ..::.:::: ..::: .:.. .. ..
CCDS12 IHPGDHSEVLEQLGLRTPTPG----PPTPPSVSSSSSSSSSLADTPE-IEASLTKVPPSS
190 200 210 220 230 240
230 240 250 260 270 280
pF1KB9 NTLERSFFIRMKSTLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPSQIMGLVVVAH
. :::::.::::::::::.:.:.:::::::.::::: .:. .:::...:
CCDS12 LVQERSFFVRMKSTLTKRGLHVKASGYKVIHVTGRLR-----AHA-------LGLVALGH
250 260 270 280
290 300 310 320 330 340
pF1KB9 ALPPPTINEVRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVE
.::: . :. . ::.: :... :.:. ::.:.::.::: : ..::. ::.:.:..:.
CCDS12 TLPPAPLAELPLHGHMIVFRLSLGLTILACESRVSDHMDLGPSELVGRSCYQFVHGQDAT
290 300 310 320 330 340
350 360 370 380 390 400
pF1KB9 GIRHSHLDLLNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNP
::.::.:::.::: .: ::::.:. ::..:.:: ::.: ..:. .:....::...::.
CCDS12 RIRQSHVDLLDKGQVMTGYYRWLQRAGGFVWLQSVATVAGSGKSPGEHHVLWVSHVLSQA
350 360 370 380 390 400
410 420 430 440 450
pF1KB9 EYKDTPMDIAQLPHL---------------PEKTSESSETSDSESDSKDTSGITEDNENS
: .::.: ::: :: .:..... .:... .:.: : .
CCDS12 EGGQTPLDAFQLPASVACEEASSPGPEPTEPEPPTEGKQAAPAENEAPQTQGKRIKVEPG
410 420 430 440 450 460
460 470 480 490 500 510
pF1KB9 KSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPK
. ::... ..:::
CCDS12 PRETKGSEDSGDEDPSSHPATPRPEFTSVIRAGVLKQDPVRPWGLAPPGDPPPTLLHAGF
470 480 490 500 510 520
>>CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 (766 aa)
initn: 1080 init1: 425 opt: 553 Z-score: 348.2 bits: 75.4 E(32554): 4.5e-13
Smith-Waterman score: 996; 34.3% identity (59.2% similar) in 650 aa overlap (23-663:2-562)
10 20 30 40 50 60
pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
::::..:::.:: ::: ::::::::::::.::::::::
CCDS50 MKEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDK
10 20 30
70 80 90 100 110
pF1KB9 ASIIRLTISYLKMRDFANQG-DPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAH
::::::: :::::: .: : : . : :: .. .
CCDS50 ASIIRLTTSYLKMRVVFPEGLGEAW----------------GHSSRTSP----LDNVGRE
40 50 60 70
120 130 140 150 160 170
pF1KB9 LGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQ
::::.::.::::.:.. .::..:::::.:..::::::::::.:...:.::.:: ::.
CCDS50 LGSHLLQTLDGFIFVVAPDGKIMYISETASVHLGLSQVELTGNSIYEYIHPADHDEMTAV
80 90 100 110 120 130
180 190 200 210 220 230
pF1KB9 LGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKS
: ::. .: .: .. . .:::::.:::
CCDS50 L--------------TAH---------------QPYHSH----FVQEYEIERSFFLRMKC
140 150 160
240 250 260 270 280 290
pF1KB9 TLTKRGVHIKSSGYKVIHITGRLRLR-VSLSHGRTVPS-QIMGLVVVAHALPPPTINEVR
.:.::.. . .:::::: .: :..: ::. . : .:::.:.:.::: ...:..
CCDS50 VLAKRNAGLTCGGYKVIHCSGYLKIRQYSLDMSPFDGCYQNVGLVAVGHSLPPSAVTEIK
170 180 190 200 210 220
300 310 320 330 340 350
pF1KB9 IDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLN
. .::. :...:...:. ..:... : :.. : :: .:. :. .: .: ::
CCDS50 LHSNMFMFRASLDMKLIFLDSRVAELTGYEPQDLIEKTLYHHVHGCDTFHLRCAHHLLLV
230 240 250 260 270 280
360 370 380 390 400 410
pF1KB9 KGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQ
::: .:::::.. :.::..:.:: :::. :.... . :. :::.:.. ::: ... :
CCDS50 KGQVTTKYYRFLAKHGGWVWVQSYATIVHNSRSSRPHCIVSVNYVLTDTEYKGLQLSLDQ
290 300 310 320 330 340
420 430 440 450 460 470
pF1KB9 LPHLPEKTSESSETSDSESDSKDTSGITEDNENSKS------DEKGNQSENSEDPEPDRK
. : .: .. . .:.. . .. .::: . .: ..: ::. . : .
CCDS50 ISASKPAFSYTSSSTPTMTDNRKGAKSRLSSSKSKSRTSPYPQYSGFHTERSES-DHDSQ
350 360 370 380 390 400
480 490 500 510 520 530
pF1KB9 KSGNACDNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYV
.:. .: . .. : :. : : . .: . .. :: :: .. ::.
CCDS50 WGGSPL-TDTASPQLLDPADRPGSQH-DASCAYRQFSDRSSLCYGF-ALDHSRLVEERHF
410 420 430 440 450 460
540 550 560 570 580 590
pF1KB9 ESESDLRLQNCESLTSDSAKDSDSAGEAGAQASSKHQKRKKRRKRQKGGSASRRRLSSAS
.. : ::. .... .. .:: .. :: . :..::
CCDS50 HT------QACEGGRCEAGRYFLGTPQAG--------------REPWWGSRAALPLTKAS
470 480 490 500
600 610 620 630 640 650
pF1KB9 SPGGLDAGLVEPPRLLSSPNSASVLKIKTEISEPINFDNDSSIWNYPPNREISRNESPYS
: . .: : : :. ::: .:. . ..:.:: . . :. :.. . :
CCDS50 -PESREA--YEN----SMPHIASVHRIHGRG----HWDEDSVVSSPDPGSA-SESGDRYR
510 520 530 540 550
660 670 680 690 700 710
pF1KB9 MTKPPSSEHFPSPQGGGGGGGGGGGLHVAIPDSVLTPPGADGAAARKTQFGASATAALAP
. :: : ::
CCDS50 TEQYQSSPHEPSKIETLIRATQQMIKEEENRLQLRKAPSDQLASINGAGKKHSLCFANYQ
560 570 580 590 600 610
>>CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 (667 aa)
initn: 992 init1: 419 opt: 543 Z-score: 343.0 bits: 74.2 E(32554): 8.7e-13
Smith-Waterman score: 994; 39.0% identity (64.8% similar) in 474 aa overlap (23-493:2-411)
10 20 30 40 50 60
pF1KB9 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
::::..::..:: ::: ::::::::::::.::::::::
CCDS13 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDK
10 20 30
70 80 90 100 110
pF1KB9 ASIIRLTISYLKMRDFANQG-DPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAH
::::::: :::::: .: : : : : .: .. .
CCDS13 ASIIRLTTSYLKMRAVFPEGLGDAW-----GQPS-----------RAGP----LDGVAKE
40 50 60 70
120 130 140 150 160 170
pF1KB9 LGSHILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQ
::::.::.::::::.. ..::..:::::.:..::::::::::.:...:.::.:: ::.
CCDS13 LGSHLLQTLDGFVFVVASDGKIMYISETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAV
80 90 100 110 120 130
180 190 200 210 220 230
pF1KB9 LGMKLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKS
: . : . ::.. .:::::.:::
CCDS13 LTAHQPLHHHLLQE---------------------------------YEIERSFFLRMKC
140 150 160
240 250 260 270 280 290
pF1KB9 TLTKRGVHIKSSGYKVIHITGRLRLRVSLSHGRTVPS--QIMGLVVVAHALPPPTINEVR
.:.::.. . ::::::: .: :..: . : ::.:::.:...::: .:.:..
CCDS13 VLAKRNAGLTCSGYKVIHCSGYLKIRQYMLDMSLYDSCYQIVGLVAVGQSLPPSAITEIK
170 180 190 200 210 220
300 310 320 330 340 350
pF1KB9 IDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLN
. .::. :...::..:. ..:... : :.. : :: .:. :: .:..: ::
CCDS13 LYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHHLLLV
230 240 250 260 270 280
360 370 380 390 400 410
pF1KB9 KGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQ
::: .::::: ..: ::..:.:: ::.. :.... . :. :::.:.. :::. ... :
CCDS13 KGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQLSLEQ
290 300 310 320 330 340
420 430 440 450 460 470
pF1KB9 LPHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNAC
. :...: .:. : :..: ... .:.: ... .: : .. :.
CCDS13 VS--TAKSQDSWRTA--LSTSQETRKLVKP-KNTKM-----KTKLRTNPYPPQQYSSFQM
350 360 370 380 390
480 490 500 510 520 530
pF1KB9 DNDMNCNDDGHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDL
:. ..:.. :. ..:
CCDS13 DK-LECGQLGNWRASPPASAAAPPELQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFS
400 410 420 430 440 450
903 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 00:56:53 2016 done: Sat Nov 5 00:56:53 2016
Total Scan time: 3.670 Total Display time: 0.150
Function used was FASTA [36.3.4 Apr, 2011]