FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4384, 870 aa
1>>>pF1KB4384 870 - 870 aa - 870 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.1555+/-0.000891; mu= 8.5853+/- 0.054
mean_var=155.4507+/-30.970, 0's: 0 Z-trim(112.1): 47 B-trim: 0 in 0/53
Lambda= 0.102867
statistics sampled from 12839 (12884) to 12839 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.73), E-opt: 0.2 (0.396), width: 16
Scan time: 4.920
The best scores are: opt bits E(32554)
CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2 ( 870) 5916 890.2 0
CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14 ( 735) 1854 287.3 6.6e-77
CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14 ( 826) 1854 287.4 7.3e-77
CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14 ( 850) 1848 286.5 1.4e-76
CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19 ( 667) 1294 204.2 6.4e-52
CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19 ( 669) 1293 204.1 7.1e-52
CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19 ( 600) 864 140.4 9.4e-33
CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 ( 766) 835 136.1 2.3e-31
CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 ( 667) 818 133.6 1.2e-30
CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 ( 901) 443 78.0 8.5e-14
CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 ( 903) 443 78.0 8.5e-14
CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14 ( 920) 443 78.0 8.7e-14
CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14 ( 933) 443 78.0 8.8e-14
>>CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2 (870 aa)
initn: 5916 init1: 5916 opt: 5916 Z-score: 4751.0 bits: 890.2 E(32554): 0
Smith-Waterman score: 5916; 100.0% identity (100.0% similar) in 870 aa overlap (1-870:1-870)
10 20 30 40 50 60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHMDIPLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHMDIPLD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB4 SKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCTKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 SKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCTKG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB4 QVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQTE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB4 SLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGNQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 SLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGNQN
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB4 FEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSSCS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 FEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSSCS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB4 TPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 TPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDF
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB4 QLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB4 HRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 HRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB4 FLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 FLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB4 DLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 DLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHL
730 740 750 760 770 780
790 800 810 820 830 840
pF1KB4 PLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 PLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELT
790 800 810 820 830 840
850 860 870
pF1KB4 RYDCEVNVPVLGSSTLLQGGDLLRALDQAT
::::::::::::::::::::::::::::::
CCDS18 RYDCEVNVPVLGSSTLLQGGDLLRALDQAT
850 860 870
>>CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14 (735 aa)
initn: 1411 init1: 811 opt: 1854 Z-score: 1494.2 bits: 287.3 E(32554): 6.6e-77
Smith-Waterman score: 2058; 48.7% identity (70.7% similar) in 764 aa overlap (6-720:9-730)
10 20 30 40 50
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIM
.::. :::::::::::::: :::::.::::::::.:::::.:::::::::.:
CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB4 RLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISK
::.::.::..:::.. . :.. .: ::. .:::::.::. :.:.:::::..:.:..:
CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKALDGFVMVLTDDGDMIYISDNVNK
70 80 90 100 110
120 130 140 150 160 170
pF1KB4 FMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVT
.::::: ::::::.:::::::::::.:: :. .:: . ::.:...:.:.::.:::::.:
CCDS97 YMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--LVKKGKEQNTQRSFFLRMKCTLT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHM
.::::.:.::::::::::::...:: :. :. ::::.: ..::...:::: :::..
CCDS97 SRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CGYKKPPMTCLVLICEPIPHPSNI
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 DIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQN
.:::::::::::::.::::.:::.:::::.::.:::::::: ::.::::::...::.:..
CCDS97 EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 LCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFS
. :::::..::::::::.:::::.:::.::::: .: :::::.:::::.: : ..:..::
CCDS97 MFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 MDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAII
..::: ..:: : :...: . . :: .. :: :::.::. :. :::. ::.::
CCDS97 LQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLFDKLKKEPDALTLLAPAAGDTII
360 370 380 390 400
420 430 440
pF1KB4 SLDFG-------NQNFEESSAYGKAILP-PSQ----------PWATE-----LRSHS---
::::: .:..:: :. ..:: :.. : : ::: .
CCDS97 SLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPA
410 420 430 440 450 460
450 460 470 480 490
pF1KB4 -TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDL-
.: : .: : .::.:: . .:: :. .: :::: .: .:.:.
CCDS97 LNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMV
470 480 490 500 510 520
500 510 520 530 540 550
pF1KB4 ---KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDFQL---SPICPEER
:.:..::::: :::::. ::: ..:::: :::::::: .:::: . . : :
CCDS97 NEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAPYIPMD-DDFQLRSFDQLSPLES
530 540 550 560 570 580
560 570 580 590 600
pF1KB4 LLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEHRPMSSIF
: ...:: ... :.: .: : : . :.. :: . : : .:
CCDS97 SSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTDEL-------KTVTKDR-MEDIK
590 600 610 620 630
610 620 630 640 650 660
pF1KB4 FDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTEFLGAAPLG
. .: . : . .: .: : .:: : . : : .. ..:: . : .
CCDS97 ILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNRAG--KGVI--EQTE--KSHPRS
640 650 660 670 680
670 680 690 700 710 720
pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGGDPP
: : .: : . :.: ..::.: . ::..:.. . ::
CCDS97 PNVLSVALSQRTTVPE--------EELNPKILALQNAQR-KRKMEHDGSLFQAVGII
690 700 710 720 730
730 740 750 760 770 780
pF1KB4 GGSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHLPLPQPPSA
>>CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14 (826 aa)
initn: 1595 init1: 811 opt: 1854 Z-score: 1493.4 bits: 287.4 E(32554): 7.3e-77
Smith-Waterman score: 2163; 45.4% identity (66.0% similar) in 917 aa overlap (6-868:9-824)
10 20 30 40 50
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIM
.::. :::::::::::::: :::::.::::::::.:::::.:::::::::.:
CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB4 RLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISK
::.::.::..:::.. . :.. .: ::. .:::::.::. :.:.:::::..:.:..:
CCDS97 RLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKALDGFVMVLTDDGDMIYISDNVNK
70 80 90 100 110
120 130 140 150 160 170
pF1KB4 FMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVT
.::::: ::::::.:::::::::::.:: :. .:: . ::.:...:.:.::.:::::.:
CCDS97 YMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--LVKKGKEQNTQRSFFLRMKCTLT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCGYKEPLLSCLIIMCEPIQHPSHM
.::::.:.::::::::::::...:: :. :. ::::.: ..::...:::: :::..
CCDS97 SRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CGYKKPPMTCLVLICEPIPHPSNI
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 DIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQN
.:::::::::::::.::::.:::.:::::.::.:::::::: ::.::::::...::.:..
CCDS97 EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHLTKTHHD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 LCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFS
. :::::..::::::::.:::::.:::.::::: .: :::::.:::::.: : ..:..::
CCDS97 MFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQHDLIFS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 MDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAII
..::: ..:: : :...: . . :: .. :: :::.::. :. :::. ::.::
CCDS97 LQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLFDKLKKEPDALTLLAPAAGDTII
360 370 380 390 400
420 430 440
pF1KB4 SLDFG-------NQNFEESSAYGKAILP-PSQ----------PWATE-----LRSHS---
::::: .:..:: :. ..:: :.. : : ::: .
CCDS97 SLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSSADPA
410 420 430 440 450 460
450 460 470 480 490
pF1KB4 -TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDL-
.: : .: : .::.:: . .:: :. .: :::: .: .:.:.
CCDS97 LNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGSTRQSSPEPNSPSEYCFYVDSDMV
470 480 490 500 510 520
500 510 520 530 540 550
pF1KB4 ---KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAPYIPMDGEDFQL---SPICPEER
:.:..::::: :::::. ::: ..:::: :::::::: .:::: . . : :
CCDS97 NEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAPYIPMD-DDFQLRSFDQLSPLES
530 540 550 560 570 580
560 570 580 590 600
pF1KB4 LLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEHRPMSSIF
: ...:: ... :.: .: : : . :.. :: . : : .:
CCDS97 SSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTDEL-------KTVTKDR-MEDIK
590 600 610 620 630
610 620 630 640 650 660
pF1KB4 FDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLHFGPTKWAVGDQRTEFLGAAPLG
. .: . : . .: .: : .:: : . : : .. ..:: . : .
CCDS97 ILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNRAG--KGVI--EQTE--KSHPRS
640 650 660 670 680
670 680 690 700 710 720
pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGG---
: : .: : . :.: ..::.: . ::..:.. . :: .. :
CCDS97 PNVLSVALSQRTTVP--------EEELNPKILALQNAQR-KRKMEHDGSLFQAVGIGTLL
690 700 710 720 730
730 740 750 760 770 780
pF1KB4 DPPG--GSTSHLMWKRMKNLRGGSCPLMPDKPLSANVPNDKFTQNPMRGLGHPLRHLPLP
. : ..:. : :::.:. ... :: :.
CCDS97 QQPDDHAATTSLSWKRVKGCKSSE-------------------QNGME------------
740 750 760
790 800 810 820 830 840
pF1KB4 QPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSGMASRLLGPSFESYLLPELTRYD
: . : : .: :::: :.. ::.:: ::
CCDS97 QKTIILIP----------------------------SDLACRLLGQSMDESGLPQLTSYD
770 780 790
850 860 870
pF1KB4 CEVNVPVLGSSTLLQGGDLLRALDQAT
::::.:. :: .:::: .:::::::
CCDS97 CEVNAPIQGSRNLLQGEELLRALDQVN
800 810 820
>>CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14 (850 aa)
initn: 1595 init1: 811 opt: 1848 Z-score: 1488.4 bits: 286.5 E(32554): 1.4e-76
Smith-Waterman score: 2157; 45.4% identity (65.9% similar) in 917 aa overlap (6-868:33-848)
10 20 30
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFY
:. : :::::::::::::: :::::.::::
CCDS58 SQCRSLENKFVFLKEGLGNSKPEELEEIRIENGRISSERRKEKSRDAARSRRSKESEVFY
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB4 ELAHELPLPHSVSSHLDKASIMRLAISFLRTHKLLSSVCSENESEAEADQQMDNLYLKAL
::::.:::::.:::::::::.:::.::.::..:::.. . :.. .: ::. .:::::
CCDS58 ELAHQLPLPHNVSSHLDKASVMRLTISYLRVRKLLDAGDLDIEDDMKA--QMNCFYLKAL
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB4 EGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGF
.::. :.:.:::::..:.:..:.::::: ::::::.:::::::::::.:: :. .:: .
CCDS58 DGFVMVLTDDGDMIYISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNG--L
130 140 150 160 170
160 170 180 190 200 210
pF1KB4 GKKSKDMSTERDFFMRMKCTVTNRGRTVNLKSATWKVLHCTGQVKVY--NNCPPHNSLCG
::.:...:.:.::.:::::.:.::::.:.::::::::::::...:: :. :. ::
CCDS58 VKKGKEQNTQRSFFLRMKCTLTSRGRTMNIKSATWKVLHCTGHIHVYDTNSNQPQ---CG
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB4 YKEPLLSCLIIMCEPIQHPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELL
::.: ..::...:::: :::...:::::::::::::.::::.:::.:::::.::.:::::
CCDS58 YKKPPMTCLVLICEPIPHPSNIEIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELL
240 250 260 270 280 290
280 290 300 310 320 330
pF1KB4 GRSAYEFYHALDSENMTKSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQ
::: ::.::::::...::.:... :::::..::::::::.:::::.:::.::::: .: :
CCDS58 GRSIYEYYHALDSDHLTKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQ
300 310 320 330 340 350
340 350 360 370 380 390
pF1KB4 PQCIMCVNYVLSEIEKNDVVFSMDQTESLFKP---HLMAMNSIFDSSGKGAVSEKSNFLF
::::.:::::.: : ..:..::..::: ..:: : :...: . . :: .. ::
CCDS58 PQCIVCVNYVVSGIIQHDLIFSLQQTECVLKPVESSDMKMTQLFTK----VESEDTSSLF
360 370 380 390 400 410
400 410 420 430
pF1KB4 TKLKEEPEELAQLAPTPGDAIISLDFG-------NQNFEESSAYGKAILP-PSQ------
:::.::. :. :::. ::.::::::: .:..:: :. ..:: :..
CCDS58 DKLKKEPDALTLLAPAAGDTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNIN
420 430 440 450 460 470
440 450 460 470
pF1KB4 ----PWATE-----LRSHS----TQSEAGSL-P-------AFTVPQAAAPGSTTPSATSS
: : ::: . .: : .: : .::.:: . .:: :.
CCDS58 LAMSPLPTAETPKPLRSSADPALNQEVALKLEPNPESLELSFTMPQIQ-DQTPSPSDGST
480 490 500 510 520 530
480 490 500 510 520 530
pF1KB4 SSSCSTPNSPEDYYTSLDNDL----KIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLAP
.: :::: .: .:.:. :.:..::::: :::::. ::: ..:::: :::
CCDS58 RQSSPEPNSPSEYCFYVDSDMVNEFKLELVEKLFAEDTEAKNPFSTQD--TDLDLEMLAP
540 550 560 570 580
540 550 560 570 580
pF1KB4 YIPMDGEDFQL---SPICPEERLLAENPQSTPQHCFSAM--TNIFQPLAPVAPHSPFLLD
::::: .:::: . . : : : ...:: ... :.: .: : : . :
CCDS58 YIPMD-DDFQLRSFDQLSPLESSSASPESASPQSTVTVFQQTQIQEPTAN-ATTTTATTD
590 600 610 620 630 640
590 600 610 620 630 640
pF1KB4 KFQQQLESKKTEPEHRPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWPPDPPLH
.. :: . : : .: . .: . : . .: .: : .:: : .
CCDS58 EL-------KTVTKDR-MEDIKILIASPS--PTHIHKETTSATSSPYR-DTQSRTASPNR
650 660 670 680 690
650 660 670 680 690 700
pF1KB4 FGPTKWAVGDQRTEFLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKL
: : .. ..:: . : .: : .: : . :.: ..::.:
CCDS58 AG--KGVI--EQTE--KSHPRSPNVLSVALSQRTTVP--------EEELNPKILALQNAQ
700 710 720 730 740
710 720 730 740 750 760
pF1KB4 KLKRQLEYEEQAFQDLSGG---DPPG--GSTSHLMWKRMKNLRGGSCPLMPDKPLSANVP
. ::..:.. . :: .. : . : ..:. : :::.:. ...
CCDS58 R-KRKMEHDGSLFQAVGIGTLLQQPDDHAATTSLSWKRVKGCKSSE--------------
750 760 770 780
770 780 790 800 810 820
pF1KB4 NDKFTQNPMRGLGHPLRHLPLPQPPSAISPGENSKSRFPPQCYATQYQDYSLSSAHKVSG
:: :. : . : :
CCDS58 -----QNGME------------QKTIILIP----------------------------SD
790 800
830 840 850 860 870
pF1KB4 MASRLLGPSFESYLLPELTRYDCEVNVPVLGSSTLLQGGDLLRALDQAT
.: :::: :.. ::.:: ::::::.:. :: .:::: .:::::::
CCDS58 LACRLLGQSMDESGLPQLTSYDCEVNAPIQGSRNLLQGEELLRALDQVN
810 820 830 840 850
>>CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19 (667 aa)
initn: 1351 init1: 577 opt: 1294 Z-score: 1045.7 bits: 204.2 E(32554): 6.4e-52
Smith-Waterman score: 1384; 38.4% identity (64.1% similar) in 711 aa overlap (4-690:2-660)
10 20 30 40 50 60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
: . .::..: :::::::::: :::.::::.:.::: ::. ..::.::::::::::.
CCDS12 MDWQDHRSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
10 20 30 40 50
70 80 90 100 110 120
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
::.:: :.: .. .: .. . . . .: ::::::::. :.: .::: .::::.:: .:
CCDS12 ISYLRMHRLCAA--GEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLG
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
:.:.:: ::::::: ::::.::... :. .. ..... . ::: : .::: :.:.::
CCDS12 LSQLELIGHSIFDFIHPCDQEELQDALTPQQT--LSRRKVEAPTERCFSLRMKSTLTSRG
120 130 140 150 160 170
190 200 210 220 230
pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGY--KEPLLSCLIIMCEPIQHPSHMDIP
::.:::.::::::.:.:....:. : ..: : .:: :.::...:: : ::. .. :
CCDS12 RTLNLKAATWKVLNCSGHMRAYKP-PAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 LDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCT
: .::::::.:::::::::::.:. :: :..:.: ::::. :::::. ..:: ..: .
CCDS12 LGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 KGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQ
:::.:.::::.::. :::.: .::.::. . :. : . :.::....:..:.. ::.:..:
CCDS12 KGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 TESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGN
::. . .. .:: :.:.. :.::: ::: .
CCDS12 TEQHSRRPIQ----------RGAPSQKDT-----------------PNPGD---SLDTPG
360 370 380
420 430 440 450 460 470
pF1KB4 QNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSS
. :. . ::: :. : . . . .: . : :... .. :. .
CCDS12 PRIL---AF---LHPPSLSEAA-LAADPRRFCSPDLRRLLGP--ILDGASVAATPSTPLA
390 400 410 420 430
480 490 500 510 520 530
pF1KB4 CSTPNSPEDYYTSLDNDLKI--EVIEKLFAM--DTEA-KDQCSTQTDFNELDLETLAPYI
:.:: . ..: ..: . : ...::. :::: . . . : . :::: :::::
CCDS12 TRHPQSPLS--ADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI
440 450 460 470 480 490
540 550 560 570 580 590
pF1KB4 PMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLE
:: .::::. : . ..:. . :. :.: : : :: .. .. .
CCDS12 SMD-DDFQLNASEQLPRAYHRPLGAVPR----PRARSFHGLSPPA-LEPSLLPRWGSDPR
500 510 520 530 540
600 610 620 630 640
pF1KB4 SKKTEPEH-RPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWP-PDP------PL
. . : . : .: . .. : .: . . . .: : . : :. ::
CCDS12 LSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPL
550 560 570 580 590 600
650 660 670 680 690
pF1KB4 HF------GPTKWAVGDQRTEFLG-AAPLG--PPVSPPHVSTFKTRSAKGFGARGPDVLS
. ::. .. : : .:. ::: : . :. . :. . : :
CCDS12 SLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQA
610 620 630 640 650 660
700 710 720 730 740 750
pF1KB4 PAMVALSNKLKLKRQLEYEEQAFQDLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPL
CCDS12 D
>>CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19 (669 aa)
initn: 1351 init1: 577 opt: 1293 Z-score: 1044.8 bits: 204.1 E(32554): 7.1e-52
Smith-Waterman score: 1383; 38.2% identity (64.0% similar) in 714 aa overlap (1-690:1-662)
10 20 30 40 50 60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
:. .. ::..: :::::::::: :::.::::.:.::: ::. ..::.::::::::::.
CCDS12 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNLYLKALEGFIAVVTQDGDMIFLSENISKFMG
::.:: :.: .. .: .. . . . .: ::::::::. :.: .::: .::::.:: .:
CCDS12 ISYLRMHRLCAA--GEWNQVGAGGEPLDACYLKALEGFVMVLTAEGDMAYLSENVSKHLG
70 80 90 100 110
130 140 150 160 170 180
pF1KB4 LTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMKCTVTNRG
:.:.:: ::::::: ::::.::... :. .. ..... . ::: : .::: :.:.::
CCDS12 LSQLELIGHSIFDFIHPCDQEELQDALTPQQT--LSRRKVEAPTERCFSLRMKSTLTSRG
120 130 140 150 160 170
190 200 210 220 230
pF1KB4 RTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGY--KEPLLSCLIIMCEPIQHPSHMDIP
::.:::.::::::.:.:....:. : ..: : .:: :.::...:: : ::. .. :
CCDS12 RTLNLKAATWKVLNCSGHMRAYKP-PAQTSPAGSPDSEPPLQCLVLICEAIPHPGSLEPP
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB4 LDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNLCT
: .::::::.:::::::::::.:. :: :..:.: ::::. :::::. ..:: ..: .
CCDS12 LGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIHTLLS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB4 KGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSMDQ
:::.:.::::.::. :::.: .::.::. . :. : . :.::....:..:.. ::.:..:
CCDS12 KGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVLSLEQ
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB4 TESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDFGN
::. . .. .:: :.:.. :.::: ::: .
CCDS12 TEQHSRRPIQ----------RGAPSQKDT-----------------PNPGD---SLDTPG
360 370 380
420 430 440 450 460 470
pF1KB4 QNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTPSATSSSSS
. :. . ::: :. : . . . .: . : :... .. :. .
CCDS12 PRIL---AF---LHPPSLSEAA-LAADPRRFCSPDLRRLLGP--ILDGASVAATPSTPLA
390 400 410 420 430
480 490 500 510 520 530
pF1KB4 CSTPNSPEDYYTSLDNDLKI--EVIEKLFAM--DTEA-KDQCSTQTDFNELDLETLAPYI
:.:: . ..: ..: . : ...::. :::: . . . : . :::: :::::
CCDS12 TRHPQSPLS--ADLPDELPVGTENVHRLFTSGKDTEAVETDLDIAQDADALDLEMLAPYI
440 450 460 470 480 490
540 550 560 570 580 590
pF1KB4 PMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQQQLE
:: .::::. : . ..:. . :. :.: : : :: .. .. .
CCDS12 SMD-DDFQLNASEQLPRAYHRPLGAVPR----PRARSFHGLSPPA-LEPSLLPRWGSDPR
500 510 520 530 540
600 610 620 630 640
pF1KB4 SKKTEPEH-RPMSSIFFDAGSKASLPPCCGQASTPLSSMGGRSNTQWP-PDP------PL
. . : . : .: . .. : .: . . . .: : . : :. ::
CCDS12 LSCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLGVRPPKRSPSPEHENFLLFPL
550 560 570 580 590 600
650 660 670 680 690
pF1KB4 HF------GPTKWAVGDQRTEFLG-AAPLG--PPVSPPHVSTFKTRSAKGFGARGPDVLS
. ::. .. : : .:. ::: : . :. . :. . : :
CCDS12 SLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYSDEDTTQPGGPFQPRAGSAQA
610 620 630 640 650 660
700 710 720 730 740 750
pF1KB4 PAMVALSNKLKLKRQLEYEEQAFQDLSGGDPPGGSTSHLMWKRMKNLRGGSCPLMPDKPL
CCDS12 D
>>CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19 (600 aa)
initn: 924 init1: 577 opt: 864 Z-score: 701.5 bits: 140.4 E(32554): 9.4e-33
Smith-Waterman score: 954; 34.6% identity (60.6% similar) in 592 aa overlap (123-690:52-593)
100 110 120 130 140 150
pF1KB4 KALEGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNG
:.:: ::::::: ::::.::... :. ..
CCDS42 PSPAASAPTWTRPLSCASPSATCACTASAPQLELIGHSIFDFIHPCDQEELQDALTPQQT
30 40 50 60 70 80
160 170 180 190 200 210
pF1KB4 SGFGKKSKDMSTERDFFMRMKCTVTNRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLC
..... . ::: : .::: :.:.::::.:::.::::::.:.:....:. : ..:
CCDS42 --LSRRKVEAPTERCFSLRMKSTLTSRGRTLNLKAATWKVLNCSGHMRAYKP-PAQTSPA
90 100 110 120 130
220 230 240 250 260 270
pF1KB4 GY--KEPLLSCLIIMCEPIQHPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPE
: .:: :.::...:: : ::. .. :: .::::::.:::::::::::.:. :: :.
CCDS42 GSPDSEPPLQCLVLICEAIPHPGSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPD
140 150 160 170 180 190
280 290 300 310 320 330
pF1KB4 ELLGRSAYEFYHALDSENMTKSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPR
.:.: ::::. :::::. ..:: ..: .:::.:.::::.::. :::.: .::.::. . :
CCDS42 DLIGCSAYEYIHALDSDAVSKSIHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGR
200 210 220 230 240 250
340 350 360 370 380 390
pF1KB4 NLQPQCIMCVNYVLSEIEKNDVVFSMDQTESLFKPHLMAMNSIFDSSGKGAVSEKSNFLF
. : . :.::....:..:.. ::.:..:::. . .. .:: :.:..
CCDS42 GPQSESIVCVHFLISQVEETGVVLSLEQTEQHSRRPIQ----------RGAPSQKDT---
260 270 280 290 300
400 410 420 430 440 450
pF1KB4 TKLKEEPEELAQLAPTPGDAIISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSE
:.::: ::: . . :. . ::: :. : . .
CCDS42 --------------PNPGD---SLDTPGPRIL---AF---LHPPSLSEAA-LAADPRRFC
310 320 330 340
460 470 480 490 500
pF1KB4 AGSLPAFTVPQAAAPGSTTPSATSSSSSCSTPNSPEDYYTSLDNDLKI--EVIEKLFAM-
. .: . : :... .. :. . :.:: . ..: ..: . : ...::.
CCDS42 SPDLRRLLGP--ILDGASVAATPSTPLATRHPQSPLS--ADLPDELPVGTENVHRLFTSG
350 360 370 380 390
510 520 530 540 550 560
pF1KB4 -DTEA-KDQCSTQTDFNELDLETLAPYIPMDGEDFQLSPICPEERLLAENPQSTPQHCFS
:::: . . . : . :::: ::::: :: .::::. : . ..:.
CCDS42 KDTEAVETDLDIAQDADALDLEMLAPYISMD-DDFQLNASEQLPRAYHRPLGAVPR----
400 410 420 430 440 450
570 580 590 600 610 620
pF1KB4 AMTNIFQPLAPVAPHSPFLLDKFQQQLESKKTEPEH-RPMSSIFFDAGSKASLPPCCGQA
. :. :.: : . : :: .. .. . . . : . : .: . .. : .: .
CCDS42 PRARSFHGLSPPALE-PSLLPRWGSDPRLSCSSPSRGDPSASSPMAGARKRTLAQSSEDE
460 470 480 490 500 510
630 640 650 660
pF1KB4 STPLSSMGGRSNTQWP-PDP------PLHF------GPTKWAVGDQRTEFLG-AAPLG--
. . .: : . : :. :: . ::. .. : : .:. :::
CCDS42 DEGVELLGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLG
520 530 540 550 560 570
670 680 690 700 710 720
pF1KB4 PPVSPPHVSTFKTRSAKGFGARGPDVLSPAMVALSNKLKLKRQLEYEEQAFQDLSGGDPP
: . :. . :. . : :
CCDS42 PSLLSPYSDEDTTQPGGPFQPRAGSAQAD
580 590 600
>>CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 (766 aa)
initn: 842 init1: 378 opt: 835 Z-score: 676.6 bits: 136.1 E(32554): 2.3e-31
Smith-Waterman score: 835; 36.6% identity (68.8% similar) in 382 aa overlap (16-387:2-377)
10 20 30 40 50 60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
::::..::: :: ::. :::::. :::: ...:.::::::.::.
CCDS50 MKEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDKASIIRLT
10 20 30 40
70 80 90 100 110
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNL-------YLKALEGFIAVVTQDGDMIFLSE
:.:. . .. .: ... . .::. :..:.::: ::. :: ....::
CCDS50 TSYLKMRVVFPEGLGEAWGHSSRTSPLDNVGRELGSHLLQTLDGFIFVVAPDGKIMYISE
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB4 NISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMK
. : .::.::::::.::... :: ::.:. :. .. .. ... ::.::.:::
CCDS50 TASVHLGLSQVELTGNSIYEYIHPADHDEMTAVLTAHQ-PYHSHFVQEYEIERSFFLRMK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB4 CTVTNRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEPLLSCLIIMCEPIQHPS
:....:. ..: . .::.::.: .:. . . . : . . :. . . . .
CCDS50 CVLAKRN--AGLTCGGYKVIHCSGYLKIRQYSLDMSPFDGCYQNV--GLVAVGHSLPPSA
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB4 HMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSH
.: : :. :. : :.:::. . :.:..:: ::.:..:. .. :. :. :. .. .:
CCDS50 VTEIKLHSNMFMFRASLDMKLIFLDSRVAELTGYEPQDLIEKTLYHHVHGCDTFHLRCAH
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB4 QNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVV
. : .::::.. ::.::::::.::... .:...: :. .:.::. :::::.. : . .
CCDS50 HLLLVKGQVTTKYYRFLAKHGGWVWVQSYATIVHNSRSSRPHCIVSVNYVLTDTEYKGLQ
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB4 FSMDQTESLFKPHLMAMNS---IFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDA
.:.:: : :: . .: . .. ::: :. :.
CCDS50 LSLDQI-SASKPAFSYTSSSTPTMTDNRKGAKSRLSSSKSKSRTSPYPQYSGFHTERSES
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB4 IISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTP
CCDS50 DHDSQWGGSPLTDTASPQLLDPADRPGSQHDASCAYRQFSDRSSLCYGFALDHSRLVEER
410 420 430 440 450 460
>>CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 (667 aa)
initn: 820 init1: 382 opt: 818 Z-score: 663.9 bits: 133.6 E(32554): 1.2e-30
Smith-Waterman score: 847; 29.4% identity (58.4% similar) in 632 aa overlap (16-627:2-586)
10 20 30 40 50 60
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA
::::..::. :: ::. :::::. :::: ...:.::::::.::.
CCDS13 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLT
10 20 30 40
70 80 90 100 110
pF1KB4 ISFLRTHKLLSSVCSENESEAEADQQMDNL-------YLKALEGFIAVVTQDGDMIFLSE
:.:. . .. .. .. .:.. :..:.::. ::..:: ....::
CCDS13 TSYLKMRAVFPEGLGDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISE
50 60 70 80 90 100
120 130 140 150 160 170
pF1KB4 NISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMK
. : .::.::::::.::... :: ::.:. :. .. . ... ::.::.:::
CCDS13 TASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHH-HLLQEYEIERSFFLRMK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB4 CTVTNRGRTVNLKSATWKVLHCTGQVKVYN---NCPPHNSLCGYKEPLLSCLIIMCEPIQ
:....:. ..: . .::.::.: .:. . . ..: : :. . :. . . .
CCDS13 CVLAKRN--AGLTCSGYKVIHCSGYLKIRQYMLDMSLYDS-C-YQ---IVGLVAVGQSLP
170 180 190 200 210
240 250 260 270 280 290
pF1KB4 HPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMT
. .: : :. :. : :.:.:. . :.:.::. ::.:..:. .. :. :. : ..
CCDS13 PSAITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLR
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB4 KSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKN
.:. : .::::.. ::.:.:.::.::... .::..: :. .:.::. :::::.::: .
CCDS13 YAHHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYK
280 290 300 310 320 330
360 370 380 390 400
pF1KB4 DVVFSMDQTESLFKPHLMAMNSIFDSS-GKGAVSEKSNFLFTKLKEEPEELAQLAPTPGD
.. .:..:. : : . ... :. . :. :.. . :::. .: : . :
CCDS13 ELQLSLEQV-STAKSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQMD
340 350 360 370 380 390
410 420 430 440 450 460
pF1KB4 AIISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTT
. ..:: ..: ..: :: ::. :: .:. :....: . :
CCDS13 KLECGQLGNW---RASPPASAAAPP------ELQPHSESSDLLYTPSYSLPFSYHYGHF-
400 410 420 430 440
470 480 490 500 510 520
pF1KB4 PSATSSSSSCSTPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETL
: . :: . : : . . .. ..: :. .: : . .
CCDS13 PLDSHVFSS-KKPMLPAKFGQPQGSPCEV---ARFFLSTLPASGEC--QWHYAN------
450 460 470 480 490
530 540 550 560 570 580
pF1KB4 APYIPMDGEDFQLSPICPEERLLAENPQSTPQHCFSAMTNIFQPLAPVAPHSPFLLDKFQ
: .: .. . : : : .: .: ... .. ::.: : :
CCDS13 -PLVPSSSSPAKNPP---------EPPANTARH---SLVPSYE--APAAAVRRFGEDTAP
500 510 520 530 540
590 600 610 620 630 640
pF1KB4 QQLES---KKTEPEHRPMSSIFFDA--GSKASL----PPCCGQASTPLSSMGGRSNTQWP
.. : . :: : .. : :.. .: : ::. ::
CCDS13 PSFPSCGHYREEPALGPAKAARQAARDGARLALARAAPECCAPP-TPEAPGAPAQLPFVL
550 560 570 580 590
650 660 670 680 690 700
pF1KB4 PDPPLHFGPTKWAVGDQRTEFLGAAPLGPPVSPPHVSTFKTRSAKGFGARGPDVLSPAMV
CCDS13 LNYHRVLARRGPLGGAAPAASGLACAPGGPEAATGALRLRHPSPAATSPPGAPLPHYLGA
600 610 620 630 640 650
>>CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 (901 aa)
initn: 823 init1: 324 opt: 443 Z-score: 361.1 bits: 78.0 E(32554): 8.5e-14
Smith-Waterman score: 727; 33.3% identity (62.1% similar) in 406 aa overlap (19-367:26-419)
10 20 30 40 50
pF1KB4 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDK
:::::: ::.::. :::::. :::: ...:.:::
CCDS96 MAPTKPSFQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDK
10 20 30 40 50 60
60 70 80
pF1KB4 ASIMRLAISFLRTHKLL-----------------SSVCSENESEAEA-------DQQMDN
:::.::.::.:. . . .:: . .. .. . . .. .
CCDS96 ASIIRLTISYLKMRDFANQGDPPWNLRMEGPPPNTSVKGAQRRRSPSALAIEVFEAHLGS
70 80 90 100 110 120
90 100 110 120 130 140
pF1KB4 LYLKALEGFIAVVTQDGDMIFLSENISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSL
:..:.::. ...:.: ....::..: ..::.:::::: :.::..:: :: :. :.:..
CCDS96 HILQSLDGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQLGM
130 140 150 160 170 180
150 160 170
pF1KB4 KNGSGFGKKSK--------------------------------DMSTERDFFMRMKCTVT
: : : :. : . ::.::.::: :.:
CCDS96 KLPPGRGLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKSTLT
190 200 210 220 230 240
180 190 200 210 220 230
pF1KB4 NRGRTVNLKSATWKVLHCTGQVKVYNNCPPHNSLCGYKEP-LLSCLIIMCEPIQHPSHMD
.:: :..::. .::.: ::.... . : : : . :... . . :. .
CCDS96 KRG--VHIKSSGYKVIHITGRLRLRVSLS-H----GRTVPSQIMGLVVVAHALPPPTINE
250 260 270 280 290
240 250 260 270 280 290
pF1KB4 IPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMTKSHQNL
. .: . :..: .::... ::..::.. . : ...:. :.: :: : :.. .:: .:
CCDS96 VRIDCHMFVTRVNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDL
300 310 320 330 340 350
300 310 320 330 340 350
pF1KB4 CTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKNDVVFSM
.::: :. :: . :.:::.:.....:. : .: . . :. :::.::. : .:. ...
CCDS96 LNKGQCVTKYYRWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDI
360 370 380 390 400 410
360 370 380 390 400 410
pF1KB4 DQTESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDAIISLDF
: :::
CCDS96 AQL-----PHLPEKTSESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDR
420 430 440 450 460
870 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 14:53:20 2016 done: Thu Nov 3 14:53:21 2016
Total Scan time: 4.920 Total Display time: 0.250
Function used was FASTA [36.3.4 Apr, 2011]