FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9704, 332 aa
1>>>pF1KB9704 332 - 332 aa - 332 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.2531+/-0.000446; mu= 11.0846+/- 0.028
mean_var=308.8802+/-63.958, 0's: 0 Z-trim(120.5): 117 B-trim: 917 in 2/53
Lambda= 0.072976
statistics sampled from 35757 (35893) to 35757 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.755), E-opt: 0.2 (0.421), width: 16
Scan time: 8.380
The best scores are: opt bits E(85289)
NP_005404 (OMIM: 157170,269160,603714) homeobox pr ( 332) 2259 251.1 2.5e-66
NP_031400 (OMIM: 206900,212550,606326) homeobox pr ( 246) 1354 155.6 1e-37
NP_058628 (OMIM: 604994) homeobox protein SIX2 [Ho ( 291) 965 114.7 2.4e-25
XP_005264157 (OMIM: 604994) PREDICTED: homeobox pr ( 293) 955 113.7 4.9e-25
NP_005973 (OMIM: 113650,601205,605192,608389) home ( 284) 934 111.5 2.3e-24
XP_016877091 (OMIM: 113650,601205,605192,608389) P ( 173) 804 97.4 2.3e-20
XP_005267816 (OMIM: 606342) PREDICTED: homeobox pr ( 773) 740 91.7 5.4e-18
NP_059116 (OMIM: 606342) homeobox protein SIX4 [Ho ( 781) 740 91.7 5.4e-18
NP_787071 (OMIM: 600963,610896) homeobox protein S ( 739) 729 90.5 1.2e-17
>>NP_005404 (OMIM: 157170,269160,603714) homeobox protei (332 aa)
initn: 2259 init1: 2259 opt: 2259 Z-score: 1311.8 bits: 251.1 E(85289): 2.5e-66
Smith-Waterman score: 2259; 99.7% identity (99.7% similar) in 332 aa overlap (1-332:1-332)
10 20 30 40 50 60
pF1KB9 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_005 MVFRSPLDLYSSHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_005 GAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_005 ACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELA
:::::::::::::::::::::::::::::::::::::::::::::::::::::::: :::
NP_005 RGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELA
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
NP_005 QATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPTHGSAESPSTA
250 260 270 280 290 300
310 320 330
pF1KB9 ASPTTSVSSLTERADTGTSILSVTSSDSECDV
::::::::::::::::::::::::::::::::
NP_005 ASPTTSVSSLTERADTGTSILSVTSSDSECDV
310 320 330
>>NP_031400 (OMIM: 206900,212550,606326) homeobox protei (246 aa)
initn: 1375 init1: 1268 opt: 1354 Z-score: 798.1 bits: 155.6 E(85289): 1e-37
Smith-Waterman score: 1354; 78.3% identity (90.9% similar) in 254 aa overlap (79-332:1-246)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
::::: :::::.:::.:::::::.::.:::
NP_031 MFQLPILNFSPQQVAGVCETLEESGDVERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::::::.::::.::.::.:::::.:::: ::.:.:::::::::::::::.::::.
NP_031 GRFLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQAL
40 50 60 70 80 90
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
:::::::::::::::::::::::::::::::::::::::::::::::::: :::::::::
NP_031 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQD
100 110 120 130 140 150
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC
:::::::: ::::::::::::::::::::::::::::::::::.:... .. :.: :
NP_031 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEG-
160 170 180 190 200
290 300 310 320 330
pF1KB9 PTHGSAESPSTAASPTTSVSSLTERADTGTSILSVTSSDSECDV
:. : ..:.::..:.:: ..:: .:.::::::::.
NP_031 --DGTPEVLGVATSPAASLSS-----KAATSAISITSSDSECDI
210 220 230 240
>>NP_058628 (OMIM: 604994) homeobox protein SIX2 [Homo s (291 aa)
initn: 962 init1: 793 opt: 965 Z-score: 576.1 bits: 114.7 E(85289): 2.4e-25
Smith-Waterman score: 965; 60.8% identity (83.2% similar) in 232 aa overlap (79-309:1-228)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
: .:::..:. :::: :::.:.. :.::::
NP_058 MSMLPTFGFTQEQVACVCEVLQQGGNIERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: .
NP_058 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL
40 50 60 70 80
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: ..
NP_058 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN
90 100 110 120 130 140
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC
:::.: .: :::.::::: :::.::::::::::::: ::.: ... . .. : :
NP_058 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGK
150 160 170 180 190 200
290 300 310 320 330
pF1KB9 PTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV
. ::.:. .: ...: : ::
NP_058 SVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGAD
210 220 230 240 250 260
>>XP_005264157 (OMIM: 604994) PREDICTED: homeobox protei (293 aa)
initn: 941 init1: 772 opt: 955 Z-score: 570.4 bits: 113.7 E(85289): 4.9e-25
Smith-Waterman score: 955; 60.3% identity (82.5% similar) in 234 aa overlap (79-309:1-230)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
: .:::..:. :::: :::.:.. :.::::
XP_005 MSMLPTFGFTQEQVACVCEVLQQGGNIERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: .
XP_005 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL
40 50 60 70 80
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: ..
XP_005 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN
90 100 110 120 130 140
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQ--HQAIGPSGMRSLAEP
:::.: .: :::.::::: :::.::::::::::::: ::.: . .. . .. :
XP_005 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERYEENNENSNSNSHNPLNGS
150 160 170 180 190 200
290 300 310 320 330
pF1KB9 GCPTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV
: . ::.:. .: ...: : ::
XP_005 GKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGG
210 220 230 240 250 260
>>NP_005973 (OMIM: 113650,601205,605192,608389) homeobox (284 aa)
initn: 926 init1: 763 opt: 934 Z-score: 558.6 bits: 111.5 E(85289): 2.3e-24
Smith-Waterman score: 934; 57.8% identity (79.1% similar) in 244 aa overlap (79-317:1-239)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
: .::...:. :::: :::.:.. :..:::
NP_005 MSMLPSFGFTQEQVACVCEVLQQGGNLERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: .
NP_005 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL
40 50 60 70 80
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
::.::: ::::::::::: : :::::.::::::::::::. ..::::..:..::::: ..
NP_005 WLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN
90 100 110 120 130 140
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMR----SLA
:::.: .: :::.::::: :::.::::::::::::: ::.: . . . :. . :
NP_005 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENTENNNSSSNKQNQLSPL
150 160 170 180 190 200
290 300 310 320 330
pF1KB9 EPGCPTHGSAESP-STAASPTTSVSSLTERADTGTSILSVTSSDSECDV
: : : .:.: : :: . : : ... :
NP_005 EGGKPLMSSSEEEFSPPQSPDQN-SVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQH
210 220 230 240 250 260
NP_005 QLQDSLLGPLTSSLVDLGS
270 280
>>XP_016877091 (OMIM: 113650,601205,605192,608389) PREDI (173 aa)
initn: 808 init1: 645 opt: 804 Z-score: 486.6 bits: 97.4 E(85289): 2.3e-20
Smith-Waterman score: 804; 64.9% identity (87.7% similar) in 171 aa overlap (79-249:1-167)
50 60 70 80 90 100
pF1KB9 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
: .::...:. :::: :::.:.. :..:::
XP_016 MSMLPSFGFTQEQVACVCEVLQQGGNLERL
10 20 30
110 120 130 140 150 160
pF1KB9 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
:::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: .
XP_016 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL
40 50 60 70 80
170 180 190 200 210 220
pF1KB9 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
::.::: ::::::::::: : :::::.::::::::::::. ..::::..:..::::: ..
XP_016 WLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN
90 100 110 120 130 140
230 240 250 260 270 280
pF1KB9 PYPNPSKKCELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC
:::.: .: :::.::::: ::
XP_016 PYPSPREKRELAEATGLTTTQGEHRKQ
150 160 170
>>XP_005267816 (OMIM: 606342) PREDICTED: homeobox protei (773 aa)
initn: 782 init1: 602 opt: 740 Z-score: 444.0 bits: 91.7 E(85289): 5.4e-18
Smith-Waterman score: 745; 44.4% identity (67.6% similar) in 293 aa overlap (42-325:48-318)
20 30 40 50 60 70
pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR
: :. ... .: :. :..:.:... .
XP_005 SEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGEEGAVAAAAAGAAADQVQ
20 30 40 50 60 70
80 90 100 110 120
pF1KB9 APPEELSMF--------QLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACE
: :. : : : :::..:: :::.:.. :...::.::::::: .
XP_005 LHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLARFLWSLP----QSD
80 90 100 110 120 130
130 140 150 160 170 180
pF1KB9 AINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGR
. .::.:.:::.:::: : . .:: :::.:.: . .: :: .: .:.: :::. :::
XP_005 LLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAERARGR
140 150 160 170 180 190
190 200 210 220 230 240
pF1KB9 PLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQAT
::: :::::.:.::::::::::::. ..::::..:. :.: : :. ::.:..: .::. :
XP_005 PLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRHLAKIT
200 210 220 230 240 250
250 260 270 280 290 300
pF1KB9 GLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEP-GCPTHGSAESPSTAAS
::. :::.::::::::::: .:: .: .: : : :.:. :. .
XP_005 GLSLTQVSNWFKNRRQRDR-------------NPSETQSKSESDGNP---STEDESSKGH
260 270 280 290
310 320 330
pF1KB9 PTTSVSSLTERADTGTSILSVTSSDSECDV
: :. .: : . ::..:
XP_005 EDLSPHPLSSSSD-GITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSPVF
300 310 320 330 340 350
>>NP_059116 (OMIM: 606342) homeobox protein SIX4 [Homo s (781 aa)
initn: 782 init1: 602 opt: 740 Z-score: 444.0 bits: 91.7 E(85289): 5.4e-18
Smith-Waterman score: 745; 44.4% identity (67.6% similar) in 293 aa overlap (42-325:56-326)
20 30 40 50 60 70
pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR
: :. ... .: :. :..:.:... .
NP_059 SEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGEEGAVAAAAAGAAADQVQ
30 40 50 60 70 80
80 90 100 110 120
pF1KB9 APPEELSMF--------QLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACE
: :. : : : :::..:: :::.:.. :...::.::::::: .
NP_059 LHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLARFLWSLP----QSD
90 100 110 120 130 140
130 140 150 160 170 180
pF1KB9 AINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGR
. .::.:.:::.:::: : . .:: :::.:.: . .: :: .: .:.: :::. :::
NP_059 LLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAERARGR
150 160 170 180 190 200
190 200 210 220 230 240
pF1KB9 PLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQAT
::: :::::.:.::::::::::::. ..::::..:. :.: : :. ::.:..: .::. :
NP_059 PLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRHLAKIT
210 220 230 240 250 260
250 260 270 280 290 300
pF1KB9 GLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEP-GCPTHGSAESPSTAAS
::. :::.::::::::::: .:: .: .: : : :.:. :. .
NP_059 GLSLTQVSNWFKNRRQRDR-------------NPSETQSKSESDGNP---STEDESSKGH
270 280 290 300
310 320 330
pF1KB9 PTTSVSSLTERADTGTSILSVTSSDSECDV
: :. .: : . ::..:
NP_059 EDLSPHPLSSSSD-GITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSPVF
310 320 330 340 350 360
>>NP_787071 (OMIM: 600963,610896) homeobox protein SIX5 (739 aa)
initn: 761 init1: 535 opt: 729 Z-score: 438.0 bits: 90.5 E(85289): 1.2e-17
Smith-Waterman score: 743; 46.2% identity (68.8% similar) in 292 aa overlap (42-330:44-315)
20 30 40 50 60 70
pF1KB9 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR
: :....:.: ::...:: : :. : ::
NP_787 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS-
20 30 40 50 60 70
80 90 100 110 120 130
pF1KB9 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES
::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . .
NP_787 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP
80 90 100 110 120
140 150 160 170 180 190
pF1KB9 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK
.:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: :::
NP_787 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK
130 140 150 160 170 180
200 210 220 230 240 250
pF1KB9 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKCELAQATGLTPTQV
::.:::::::.::::::. ..:::::.:. :. : . ::.:..: .:: :::. :::
NP_787 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV
190 200 210 220 230 240
260 270 280 290 300
pF1KB9 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS
.:::::::::::..:. : . .: .. : :: :..:: .. ::
NP_787 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS
250 260 270 280 290
310 320 330
pF1KB9 SLTERADTGTSILSVTSSDSECDV
. : : :. .:. :. . :
NP_787 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA
300 310 320 330 340 350
332 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:26:05 2016 done: Fri Nov 4 18:26:06 2016
Total Scan time: 8.380 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]