FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3524, 570 aa 1>>>pF1KE3524 570 - 570 aa - 570 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.8015+/-0.00088; mu= 13.6787+/- 0.053 mean_var=134.3515+/-27.552, 0's: 0 Z-trim(111.3): 48 B-trim: 278 in 1/52 Lambda= 0.110650 statistics sampled from 12242 (12286) to 12242 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.72), E-opt: 0.2 (0.377), width: 16 Scan time: 3.740 The best scores are: opt bits E(32554) CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 ( 667) 3524 574.1 1.9e-163 CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 ( 766) 2245 370.0 6.1e-102 CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14 ( 735) 939 161.5 3.4e-39 CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14 ( 826) 939 161.5 3.7e-39 CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14 ( 850) 939 161.5 3.8e-39 CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2 ( 870) 818 142.2 2.5e-33 CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19 ( 667) 777 135.6 1.9e-31 CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19 ( 669) 777 135.6 1.9e-31 CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 ( 901) 543 98.3 4.2e-20 CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 ( 903) 543 98.3 4.2e-20 CCDS53892.1 NPAS3 gene_id:64067|Hs108|chr14 ( 920) 543 98.3 4.3e-20 CCDS53891.1 NPAS3 gene_id:64067|Hs108|chr14 ( 933) 543 98.3 4.3e-20 CCDS42580.2 HIF3A gene_id:64344|Hs108|chr19 ( 600) 494 90.4 7e-18 CCDS8138.1 NPAS4 gene_id:266743|Hs108|chr11 ( 802) 378 71.9 3.3e-12 CCDS12694.1 NPAS1 gene_id:4861|Hs108|chr19 ( 590) 361 69.1 1.7e-11 >>CCDS13646.1 SIM2 gene_id:6493|Hs108|chr21 (667 aa) initn: 3524 init1: 3524 opt: 3524 Z-score: 3047.9 bits: 574.1 E(32554): 1.9e-163 Smith-Waterman score: 3524; 100.0% identity (100.0% similar) in 525 aa overlap (1-525:1-525) 10 20 30 40 50 60 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLTTSYLKMRAVFPEGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLTTSYLKMRAVFPEGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISETASVHLGLSQVELT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISETASVHLGLSQVELT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 GNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLRMKCVLAKRNAGLTCSGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLRMKCVLAKRNAGLTCSGY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 KVIHCSGYLKIRQYMLDMSLYDSCYQIVGLVAVGQSLPPSAITEIKLYSNMFMFRASLDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KVIHCSGYLKIRQYMLDMSLYDSCYQIVGLVAVGQSLPPSAITEIKLYSNMFMFRASLDL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 KLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHHLLLVKGQVTTKYYRLLSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHHLLLVKGQVTTKYYRLLSK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 RGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQLSLEQVSTAKSQDSWRTAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQLSLEQVSTAKSQDSWRTAL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 STSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQMDKLECGQLGNWRASPPASAAAPPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 STSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQMDKLECGQLGNWRASPPASAAAPPE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 LQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFSSKKPMLPAKFGQPQGSPCEVARFFL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFSSKKPMLPAKFGQPQGSPCEVARFFL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 STLPASGECQWHYANPLVPSSSSPAKNPPEPPANTARHSLVPSYEGGSGLLVGKVGGLRT ::::::::::::::::::::::::::::::::::::::::::::: CCDS13 STLPASGECQWHYANPLVPSSSSPAKNPPEPPANTARHSLVPSYEAPAAAVRRFGEDTAP 490 500 510 520 530 540 550 560 570 pF1KE3 AGSRSSHGGGWQMETEPSRFGQTCPLSASK CCDS13 PSFPSCGHYREEPALGPAKAARQAARDGARLALARAAPECCAPPTPEAPGAPAQLPFVLL 550 560 570 580 590 600 >>CCDS5045.1 SIM1 gene_id:6492|Hs108|chr6 (766 aa) initn: 2166 init1: 2070 opt: 2245 Z-score: 1943.7 bits: 370.0 E(32554): 6.1e-102 Smith-Waterman score: 2245; 69.2% identity (84.7% similar) in 510 aa overlap (1-504:1-503) 10 20 30 40 50 60 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLTTSYLKMRAVFPEGL :::::::::.:::::::.:::::::::::::::::::::::::::::::::::.:::::: CCDS50 MKEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDKASIIRLTTSYLKMRVVFPEGL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 GDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISETASVHLGLSQVELT :.:::. ::..:::.:..:::::::::::::.:::: ::::::::::::::::::::::: CCDS50 GEAWGHSSRTSPLDNVGRELGSHLLQTLDGFIFVVAPDGKIMYISETASVHLGLSQVELT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 GNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLRMKCVLAKRNAGLTCSGY ::::::::::.:::::::::::::: : :..::::::::::::::::::::::::::.:: CCDS50 GNSIYEYIHPADHDEMTAVLTAHQPYHSHFVQEYEIERSFFLRMKCVLAKRNAGLTCGGY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 KVIHCSGYLKIRQYMLDMSLYDSCYQIVGLVAVGQSLPPSAITEIKLYSNMFMFRASLDL :::::::::::::: :::: .:.::: :::::::.::::::.:::::.:::::::::::. CCDS50 KVIHCSGYLKIRQYSLDMSPFDGCYQNVGLVAVGHSLPPSAVTEIKLHSNMFMFRASLDM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 KLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHHLLLVKGQVTTKYYRLLSK :::::::::.:.:::::::::::::::::::::.:::: :::::::::::::::::.:.: CCDS50 KLIFLDSRVAELTGYEPQDLIEKTLYHHVHGCDTFHLRCAHHLLLVKGQVTTKYYRFLAK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 RGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQLSLEQVSTAKSQDSWRTAL .:::::::::::.::::::::::::::::::::. ::: :::::.:.:..: :. .. CCDS50 HGGWVWVQSYATIVHNSRSSRPHCIVSVNYVLTDTEYKGLQLSLDQISASKPAFSYTSSS 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 S-TSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQMDKLECGQLGNWRASPPASAAAP- . : ..:: .: . .. :.: ::.::: :::.:. .. : . ..: .:: ...:.: CCDS50 TPTMTDNRKGAKSRLSSSKSKSRTSPYP--QYSGFHTERSESDHDSQWGGSPLTDTASPQ 370 380 390 400 410 420 430 440 450 460 470 pF1KE3 ---PELQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFSSKKPMLPAKFGQPQGSPCEV : .: :. . ..: : :: : :: . .. . .:. ::. CCDS50 LLDPADRPGSQHDASCAYRQFSDRSSLCYG-FALDHSRLVEERHFHTQAC---EGGRCEA 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE3 ARFFLSTLPASGECQWHYANPLVP-SSSSPAKNPPEPPANTARHSLVPSYEGGSGLLVGK .:.::.: : .:. : . .: ...:: CCDS50 GRYFLGT-PQAGREPWWGSRAALPLTKASPESREAYENSMPHIASVHRIHGRGHWDEDSV 480 490 500 510 520 530 >>CCDS9754.1 HIF1A gene_id:3091|Hs108|chr14 (735 aa) initn: 972 init1: 436 opt: 939 Z-score: 817.2 bits: 161.5 E(32554): 3.4e-39 Smith-Waterman score: 939; 39.9% identity (71.6% similar) in 391 aa overlap (2-385:19-394) 10 20 30 40 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASII ::::..::..:: ::. :::::. :::: ..:.:::::.. CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE3 RLTTSYLKMRAVFPEGLGDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMY ::: :::..: .. : : : . ... :..:::::.:...:: ..: CCDS97 RLTISYLRVRKLLDAGDLDIE---------DDMKAQMNCFYLKALDGFVMVLTDDGDMIY 70 80 90 100 110 110 120 130 140 150 160 pF1KE3 ISETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLR ::.... ..::.: ::::.:.... :: ::.:: .:: .. : .. .: . .:::::: CCDS97 ISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNGLVKKG-KEQNTQRSFFLR 120 130 140 150 160 170 170 180 190 200 210 pF1KE3 MKCVLAKRN--AGLTCSGYKVIHCSGYLKIRQYMLDMSLYDSCYQ---IVGLVAVGQSLP :::.:..:. .. . .::.::.:.... : . . . :. .. :: . . .: CCDS97 MKCTLTSRGRTMNIKSATWKVLHCTGHIHV--YDTNSNQPQCGYKKPPMTCLVLICEPIP 180 190 200 210 220 220 230 240 250 260 270 pF1KE3 -PSAITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHL :: : :: : :. :. : :::.:. . : :.::. ::::..:. ...:.. :. : :: CCDS97 HPSNI-EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHL 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE3 RYAHHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEY .:: ...:::::: ::.:.::::.:::.. :::..:...:.:.::: ::::.. : CCDS97 TKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQ 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE3 KELQLSLEQVSTA-KSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQM ..: .::.:. . : .: . .. .: :. . .... ::. .: CCDS97 HDLIFSLQQTECVLKPVES--SDMKMTQLFTKVESEDTSSLFDKLKKEPDALTLLAPAAG 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE3 DKLECGQLGNWRASPPASAAAPPELQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFSS CCDS97 DTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSS 410 420 430 440 450 460 >>CCDS9753.1 HIF1A gene_id:3091|Hs108|chr14 (826 aa) initn: 972 init1: 436 opt: 939 Z-score: 816.5 bits: 161.5 E(32554): 3.7e-39 Smith-Waterman score: 939; 39.9% identity (71.6% similar) in 391 aa overlap (2-385:19-394) 10 20 30 40 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASII ::::..::..:: ::. :::::. :::: ..:.:::::.. CCDS97 MEGAGGANDKKKISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPHNVSSHLDKASVM 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE3 RLTTSYLKMRAVFPEGLGDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMY ::: :::..: .. : : : . ... :..:::::.:...:: ..: CCDS97 RLTISYLRVRKLLDAGDLDIE---------DDMKAQMNCFYLKALDGFVMVLTDDGDMIY 70 80 90 100 110 110 120 130 140 150 160 pF1KE3 ISETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLR ::.... ..::.: ::::.:.... :: ::.:: .:: .. : .. .: . .:::::: CCDS97 ISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNGLVKKG-KEQNTQRSFFLR 120 130 140 150 160 170 170 180 190 200 210 pF1KE3 MKCVLAKRN--AGLTCSGYKVIHCSGYLKIRQYMLDMSLYDSCYQ---IVGLVAVGQSLP :::.:..:. .. . .::.::.:.... : . . . :. .. :: . . .: CCDS97 MKCTLTSRGRTMNIKSATWKVLHCTGHIHV--YDTNSNQPQCGYKKPPMTCLVLICEPIP 180 190 200 210 220 220 230 240 250 260 270 pF1KE3 -PSAITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHL :: : :: : :. :. : :::.:. . : :.::. ::::..:. ...:.. :. : :: CCDS97 HPSNI-EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSIYEYYHALDSDHL 230 240 250 260 270 280 280 290 300 310 320 330 pF1KE3 RYAHHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEY .:: ...:::::: ::.:.::::.:::.. :::..:...:.:.::: ::::.. : CCDS97 TKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCIVCVNYVVSGIIQ 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE3 KELQLSLEQVSTA-KSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQM ..: .::.:. . : .: . .. .: :. . .... ::. .: CCDS97 HDLIFSLQQTECVLKPVES--SDMKMTQLFTKVESEDTSSLFDKLKKEPDALTLLAPAAG 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE3 DKLECGQLGNWRASPPASAAAPPELQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFSS CCDS97 DTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPLPTAETPKPLRSS 410 420 430 440 450 460 >>CCDS58324.1 HIF1A gene_id:3091|Hs108|chr14 (850 aa) initn: 972 init1: 436 opt: 939 Z-score: 816.3 bits: 161.5 E(32554): 3.8e-39 Smith-Waterman score: 939; 39.9% identity (71.6% similar) in 391 aa overlap (2-385:43-418) 10 20 30 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPS ::::..::..:: ::. :::::. :::: CCDS58 VFLKEGLGNSKPEELEEIRIENGRISSERRKEKSRDAARSRRSKESEVFYELAHQLPLPH 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE3 AITSQLDKASIIRLTTSYLKMRAVFPEGLGDAWGQPSRAGPLDGVAKELGSHLLQTLDGF ..:.:::::..::: :::..: .. : : : . ... :..:::: CCDS58 NVSSHLDKASVMRLTISYLRVRKLLDAGDLDIE---------DDMKAQMNCFYLKALDGF 80 90 100 110 120 100 110 120 130 140 150 pF1KE3 VFVVASDGKIMYISETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHHHLL :.:...:: ..:::.... ..::.: ::::.:.... :: ::.:: .:: .. : .. CCDS58 VMVLTDDGDMIYISDNVNKYMGLTQFELTGHSVFDFTHPCDHEEMREMLTHRNGLVKKG- 130 140 150 160 170 180 160 170 180 190 200 pF1KE3 QEYEIERSFFLRMKCVLAKRN--AGLTCSGYKVIHCSGYLKIRQYMLDMSLYDSCYQ--- .: . .:::::::::.:..:. .. . .::.::.:.... : . . . :. CCDS58 KEQNTQRSFFLRMKCTLTSRGRTMNIKSATWKVLHCTGHIHV--YDTNSNQPQCGYKKPP 190 200 210 220 230 240 210 220 230 240 250 260 pF1KE3 IVGLVAVGQSLP-PSAITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTL .. :: . . .: :: : :: : :. :. : :::.:. . : :.::. ::::..:. ... CCDS58 MTCLVLICEPIPHPSNI-EIPLDSKTFLSRHSLDMKFSYCDERITELMGYEPEELLGRSI 250 260 270 280 290 270 280 290 300 310 320 pF1KE3 YHHVHGCDVFHLRYAHHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCI :.. :. : :: .:: ...:::::: ::.:.::::.:::.. :::..:...:.:.:: CCDS58 YEYYHALDSDHLTKTHHDMFTKGQVTTGQYRMLAKRGGYVWVETQATVIYNTKNSQPQCI 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE3 VSVNYVLTEIEYKELQLSLEQVSTA-KSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTN : ::::.. : ..: .::.:. . : .: . .. .: :. . .... ::. . CCDS58 VCVNYVVSGIIQHDLIFSLQQTECVLKPVES--SDMKMTQLFTKVESEDTSSLFDKLKKE 360 370 380 390 400 410 390 400 410 420 430 440 pF1KE3 PYPPQQYSSFQMDKLECGQLGNWRASPPASAAAPPELQPHSESSDLLYTPSYSLPFSYHY : CCDS58 PDALTLLAPAAGDTIISLDFGSNDTETDDQQLEEVPLYNDVMLPSPNEKLQNINLAMSPL 420 430 440 450 460 470 >>CCDS1825.1 EPAS1 gene_id:2034|Hs108|chr2 (870 aa) initn: 820 init1: 382 opt: 818 Z-score: 711.8 bits: 142.2 E(32554): 2.5e-33 Smith-Waterman score: 843; 33.0% identity (65.9% similar) in 455 aa overlap (2-439:16-460) 10 20 30 40 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLT ::::..::. :: ::. :::::. :::: ...:.::::::.::. CCDS18 MTADKEKKRSSSERRKEKSRDAARCRRSKETEVFYELAHELPLPHSVSSHLDKASIMRLA 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE3 TSYLKMRAVFPEGLGDAWGQPSRAGPLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISE :.:. . . :... .. . : ... . :..:.::. ::..:: ....:: CCDS18 ISFLRTHKL----LSSVCSENESEAEAD---QQMDNLYLKALEGFIAVVTQDGDMIFLSE 70 80 90 100 110 110 120 130 140 150 160 pF1KE3 TASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHH-HLLQEYEIERSFFLRMK . : .::.::::::.::... :: ::.:. :. .. . ... ::.::.::: CCDS18 NISKFMGLTQVELTGHSIFDFTHPCDHEEIRENLSLKNGSGFGKKSKDMSTERDFFMRMK 120 130 140 150 160 170 170 180 190 200 210 pF1KE3 CVLAKRN--AGLTCSGYKVIHCSGYLKIRQYMLDMSLYDS-C-YQ---IVGLVAVGQSLP :....:. ..: . .::.::.: .:. . . ..: : :. . :. . . . CCDS18 CTVTNRGRTVNLKSATWKVLHCTGQVKVYN---NCPPHNSLCGYKEPLLSCLIIMCEPIQ 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE3 PSAITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLR . .: : :. :. : :.:.:. . :.:.::. ::.:..:. .. :. :. : .. CCDS18 HPSHMDIPLDSKTFLSRHSMDMKFTYCDDRITELIGYHPEELLGRSAYEFYHALDSENMT 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE3 YAHHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYK .:. : .::::.. ::.:.:.::.::... .::..: :. .:.::. :::::.::: . CCDS18 KSHQNLCTKGQVVSGQYRMLAKHGGYVWLETQGTVIYNPRNLQPQCIMCVNYVLSEIEKN 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE3 ELQLSLEQVSTAKSQDSWRTALSTSQETRKLVKPKNTKMKTKLRTNPYPPQQYSSFQMDK .. .:..:. . . .. . :. :.. . :::. .: : . : CCDS18 DVVFSMDQTESLFKPHLMAMNSIFDSSGKGAVSEKSNFLFTKLKEEPEELAQLAPTPGDA 360 370 380 390 400 410 400 410 420 430 440 pF1KE3 LECGQLGNW---RASPPASAAAPP------ELQPHSESSDLLYTPSYSLPFSYHYGHFPL . ..:: ..: ..: :: ::. :: .:. :....: CCDS18 IISLDFGNQNFEESSAYGKAILPPSQPWATELRSHSTQSEAGSLPAFTVPQAAAPGSTTP 420 430 440 450 460 470 450 460 470 480 490 500 pF1KE3 DSHVFSSKKPMLPAKFGQPQGSPCEVARFFLSTLPASGECQWHYANPLVPSSSSPAKNPP CCDS18 SATSSSSSCSTPNSPEDYYTSLDNDLKIEVIEKLFAMDTEAKDQCSTQTDFNELDLETLA 480 490 500 510 520 530 >>CCDS12682.1 HIF3A gene_id:64344|Hs108|chr19 (667 aa) initn: 766 init1: 334 opt: 777 Z-score: 678.0 bits: 135.6 E(32554): 1.9e-31 Smith-Waterman score: 787; 31.5% identity (58.9% similar) in 577 aa overlap (2-525:14-576) 10 20 30 40 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLTTS ::::..::..:: .:. .:.::. ::. .....::::::.::: : CCDS12 MDWQDHRSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLTIS 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE3 YLKMRAVFPEGLGDAWGQPSRAG-PLDGVAKELGSHLLQTLDGFVFVVASDGKIMYISET ::.:. . : :.: . .: :::. :..:.:::.:....: . :.::. CCDS12 YLRMHRLCAAG---EWNQVGAGGEPLDAC-------YLKALEGFVMVLTAEGDMAYLSEN 70 80 90 100 110 110 120 130 140 150 160 pF1KE3 ASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLRMKCV .: ::::::.:: :.::...::: :..:. .:: .: : .. . : :: : :::: . CCDS12 VSKHLGLSQLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKV-EAPTERCFSLRMKST 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 LAKRNA--GLTCSGYKVIHCSGYLKIRQYMLDMSLY---DSCYQIVGLVAVGQSLPPSAI :..:. .: . .::..:::... . . : :: . :: . ...: . CCDS12 LTSRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHPGS 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE3 TEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHH : : . :. : :::.:. . :.:..::.:: :.::: . :...:. : . . : CCDS12 LEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKSIH 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE3 LLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQL :: :::..: ::.:.. ::..:.:. :::: ..:. . . :: :.......: . : CCDS12 TLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGVVL 290 300 310 320 330 340 350 360 370 380 390 pF1KE3 SLEQVSTAKSQDSWRTALS---TSQETRKLVKPKNTKMKTKLRTNPYP-------PQQYS ::::. . . : : : : . .: : . .. . :. :... CCDS12 SLEQTEQHSRRPIQRGAPSQKDTPNPGDSLDTP-GPRILAFLHPPSLSEAALAADPRRFC 350 360 370 380 390 400 400 410 420 430 pF1KE3 SFQMDKLECGQL--GNWRASP-----------PASAAAPPELQPHSESSDLLYTPSY--- : .. .: : .. :.: : :: : :: .:. :.: . CCDS12 SPDLRRLLGPILDGASVAATPSTPLATRHPQSPLSADLPDELPVGTENVHRLFTSGKDTE 410 420 430 440 450 460 440 450 460 470 480 pF1KE3 -------------SLPFSYHYGHFPLDSHVFSSKKPMLPAKFGQPQGS-PCEVARFFLST .: . . .. .:. . . .:: . .: :. : :: : . CCDS12 AVETDLDIAQDADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLGAVPRPRARSFHGL 470 480 490 500 510 520 490 500 510 520 530 pF1KE3 LPASGEC----QWHYANPLVPSSSSPAKNPPE---PPANTARHSLVPSYEGGSGLLVGKV : . : .: ..: . : :::... : : :.. ...:. : : CCDS12 SPPALEPSLLPRWG-SDPRL-SCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVELLG 530 540 550 560 570 580 540 550 560 570 pF1KE3 GGLRTAGSRSSHGGGWQMETEPSRFGQTCPLSASK CCDS12 VRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSPYS 590 600 610 620 630 640 >>CCDS12681.2 HIF3A gene_id:64344|Hs108|chr19 (669 aa) initn: 766 init1: 334 opt: 777 Z-score: 678.0 bits: 135.6 E(32554): 1.9e-31 Smith-Waterman score: 787; 31.5% identity (58.9% similar) in 577 aa overlap (2-525:16-578) 10 20 30 40 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLT ::::..::..:: .:. .:.::. ::. .....::::::.::: CCDS12 MALGLQRARSTTELRKEKSRDAARSRRSQETEVLYQLAHTLPFARGVSAHLDKASIMRLT 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE3 TSYLKMRAVFPEGLGDAWGQPSRAG-PLDGVAKELGSHLLQTLDGFVFVVASDGKIMYIS :::.:. . : :.: . .: :::. :..:.:::.:....: . :.: CCDS12 ISYLRMHRLCAAG---EWNQVGAGGEPLDAC-------YLKALEGFVMVLTAEGDMAYLS 70 80 90 100 110 110 120 130 140 150 160 pF1KE3 ETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHHHLLQEYEIERSFFLRMK :..: ::::::.:: :.::...::: :..:. .:: .: : .. . : :: : :::: CCDS12 ENVSKHLGLSQLELIGHSIFDFIHPCDQEELQDALTPQQTLSRRKV-EAPTERCFSLRMK 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 CVLAKRNA--GLTCSGYKVIHCSGYLKIRQYMLDMSLY---DSCYQIVGLVAVGQSLPPS .:..:. .: . .::..:::... . . : :: . :: . ...: CCDS12 STLTSRGRTLNLKAATWKVLNCSGHMRAYKPPAQTSPAGSPDSEPPLQCLVLICEAIPHP 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE3 AITEIKLYSNMFMFRASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYA . : : . :. : :::.:. . :.:..::.:: :.::: . :...:. : . . CCDS12 GSLEPPLGRGAFLSRHSLDMKFTYCDDRIAEVAGYSPDDLIGCSAYEYIHALDSDAVSKS 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE3 HHLLLVKGQVTTKYYRLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKEL : :: :::..: ::.:.. ::..:.:. :::: ..:. . . :: :.......: . CCDS12 IHTLLSKGQAVTGQYRFLARSGGYLWTQTQATVVSGGRGPQSESIVCVHFLISQVEETGV 290 300 310 320 330 340 350 360 370 380 390 pF1KE3 QLSLEQVSTAKSQDSWRTALS---TSQETRKLVKPKNTKMKTKLRTNPYP-------PQQ :::::. . . : : : : . .: : . .. . :. :.. CCDS12 VLSLEQTEQHSRRPIQRGAPSQKDTPNPGDSLDTP-GPRILAFLHPPSLSEAALAADPRR 350 360 370 380 390 400 400 410 420 430 pF1KE3 YSSFQMDKLECGQL--GNWRASP-----------PASAAAPPELQPHSESSDLLYTPSY- . : .. .: : .. :.: : :: : :: .:. :.: . CCDS12 FCSPDLRRLLGPILDGASVAATPSTPLATRHPQSPLSADLPDELPVGTENVHRLFTSGKD 410 420 430 440 450 460 440 450 460 470 480 pF1KE3 ---------------SLPFSYHYGHFPLDSHVFSSKKPMLPAKFGQPQGS-PCEVARFFL .: . . .. .:. . . .:: . .: :. : :: : CCDS12 TEAVETDLDIAQDADALDLEMLAPYISMDDDFQLNASEQLPRAYHRPLGAVPRPRARSFH 470 480 490 500 510 520 490 500 510 520 530 pF1KE3 STLPASGEC----QWHYANPLVPSSSSPAKNPPE---PPANTARHSLVPSYEGGSGLLVG . : . : .: ..: . : :::... : : :.. ...:. : : CCDS12 GLSPPALEPSLLPRWG-SDPRL-SCSSPSRGDPSASSPMAGARKRTLAQSSEDEDEGVEL 530 540 550 560 570 580 540 550 560 570 pF1KE3 KVGGLRTAGSRSSHGGGWQMETEPSRFGQTCPLSASK CCDS12 LGVRPPKRSPSPEHENFLLFPLSLSFLLTGGPAPGSLQDPSTPLLNLNEPLGLGPSLLSP 590 600 610 620 630 640 >>CCDS9645.1 NPAS3 gene_id:64067|Hs108|chr14 (901 aa) initn: 1009 init1: 410 opt: 543 Z-score: 474.3 bits: 98.3 E(32554): 4.2e-20 Smith-Waterman score: 932; 38.3% identity (64.1% similar) in 457 aa overlap (17-411:38-491) 10 20 30 40 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLT : ::::::::::::.::::::::::::::: CCDS96 FQQDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDKASIIRLT 10 20 30 40 50 60 50 60 70 80 pF1KE3 TSYLKMRAVFPEGLGDAW-----GQPS---------RAGP----LDGVAKELGSHLLQTL :::::: .: : : : : .: .. .::::.::.: CCDS96 ISYLKMRDFANQG-DPPWNLRMEGPPPNTSVKGAQRRRSPSALAIEVFEAHLGSHILQSL 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE3 DGFVFVVASDGKIMYISETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHH :::::.. ..::..:::::.:..::::::::::.:...:.::.:: ::. : . : . CCDS96 DGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQLGMKLPPGR 130 140 150 160 170 180 150 160 170 pF1KE3 HLLQE---------------------------------YEIERSFFLRMKCVLAKRNAGL ::.. .:::::.::: .:.::.. . CCDS96 GLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKSTLTKRGVHI 190 200 210 220 230 240 180 190 200 210 220 230 pF1KE3 TCSGYKVIHCSGYLKIRQYMLDMSLYDSCYQIVGLVAVGQSLPPSAITEIKLYSNMFMFR ::::::: .: :..: . : ::.:::.:...::: .:.:... .::. : CCDS96 KSSGYKVIHITGRLRLRVSLSHGRTVPS--QIMGLVVVAHALPPPTINEVRIDCHMFVTR 250 260 270 280 290 300 240 250 260 270 280 290 pF1KE3 ASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHHLLLVKGQVTTKYY ...::..:. ..:... : :.. : :: .:. :: .:..: :: ::: .:::: CCDS96 VNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQCVTKYY 310 320 330 340 350 360 300 310 320 330 340 350 pF1KE3 RLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQLSLEQVS--TAKSQ : ..: ::..:.:: ::.. :.... . :. :::.:.. :::. ... :. :.. CCDS96 RWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPHLPEKTS 370 380 390 400 410 420 360 370 380 390 400 pF1KE3 DSWRTA--LSTSQETRKLVKP-KNTKM-----KTKLRTNPYPPQQYSSFQMDK-LECGQL .: .:. : :..: ... .:.: ... .: : .. :. :. ..:.. CCDS96 ESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDD 430 440 450 460 470 480 410 420 430 440 450 460 pF1KE3 GNWRASPPASAAAPPELQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFSSKKPMLPAK :. ..: CCDS96 GHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQNCESLT 490 500 510 520 530 540 >>CCDS55912.1 NPAS3 gene_id:64067|Hs108|chr14 (903 aa) initn: 1009 init1: 410 opt: 543 Z-score: 474.3 bits: 98.3 E(32554): 4.2e-20 Smith-Waterman score: 925; 38.1% identity (63.9% similar) in 457 aa overlap (19-411:40-493) 10 20 30 40 pF1KE3 MKEKSKNAAKTRREKENGEFYELAKLLPLPSAITSQLDKASIIRLTTS ::::::::::::.::::::::::::::: : CCDS55 QDPSRRERLQALRKEKSRDAARSRRGKENFEFYELAKLLPLPAAITSQLDKASIIRLTIS 10 20 30 40 50 60 50 60 70 80 pF1KE3 YLKMRAVFPEGLGDAW-----GQPS-----------RAGP----LDGVAKELGSHLLQTL ::::: .: : : : : .: .. .::::.::.: CCDS55 YLKMRDFANQG-DPPWNLRMEGPPPNTSVKVIGAQRRRSPSALAIEVFEAHLGSHILQSL 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE3 DGFVFVVASDGKIMYISETASVHLGLSQVELTGNSIYEYIHPSDHDEMTAVLTAHQPLHH :::::.. ..::..:::::.:..::::::::::.:...:.::.:: ::. : . : . CCDS55 DGFVFALNQEGKFLYISETVSIYLGLSQVELTGSSVFDYVHPGDHVEMAEQLGMKLPPGR 130 140 150 160 170 180 150 160 170 pF1KE3 HLLQE---------------------------------YEIERSFFLRMKCVLAKRNAGL ::.. .:::::.::: .:.::.. . CCDS55 GLLSQGTAEDGASSASSSSQSETPEPVESTSPSLLTTDNTLERSFFIRMKSTLTKRGVHI 190 200 210 220 230 240 180 190 200 210 220 230 pF1KE3 TCSGYKVIHCSGYLKIRQYMLDMSLYDSCYQIVGLVAVGQSLPPSAITEIKLYSNMFMFR ::::::: .: :..: . : ::.:::.:...::: .:.:... .::. : CCDS55 KSSGYKVIHITGRLRLRVSLSHGRTVPS--QIMGLVVVAHALPPPTINEVRIDCHMFVTR 250 260 270 280 290 300 240 250 260 270 280 290 pF1KE3 ASLDLKLIFLDSRVTEVTGYEPQDLIEKTLYHHVHGCDVFHLRYAHHLLLVKGQVTTKYY ...::..:. ..:... : :.. : :: .:. :: .:..: :: ::: .:::: CCDS55 VNMDLNIIYCENRISDYMDLTPVDIVGKRCYHFIHAEDVEGIRHSHLDLLNKGQCVTKYY 310 320 330 340 350 360 300 310 320 330 340 350 pF1KE3 RLLSKRGGWVWVQSYATVVHNSRSSRPHCIVSVNYVLTEIEYKELQLSLEQVS--TAKSQ : ..: ::..:.:: ::.. :.... . :. :::.:.. :::. ... :. :.. CCDS55 RWMQKNGGYIWIQSSATIAINAKNANEKNIIWVNYLLSNPEYKDTPMDIAQLPHLPEKTS 370 380 390 400 410 420 360 370 380 390 400 pF1KE3 DSWRTA--LSTSQETRKLVKP-KNTKM-----KTKLRTNPYPPQQYSSFQMDK-LECGQL .: .:. : :..: ... .:.: ... .: : .. :. :. ..:.. CCDS55 ESSETSDSESDSKDTSGITEDNENSKSDEKGNQSENSEDPEPDRKKSGNACDNDMNCNDD 430 440 450 460 470 480 410 420 430 440 450 460 pF1KE3 GNWRASPPASAAAPPELQPHSESSDLLYTPSYSLPFSYHYGHFPLDSHVFSSKKPMLPAK :. ..: CCDS55 GHSSSNPDSRDSDDSFEHSDFENPKAGEDGFGALGAMQIKVERYVESESDLRLQNCESLT 490 500 510 520 530 540 570 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 13:54:48 2016 done: Fri Nov 4 13:54:49 2016 Total Scan time: 3.740 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]