FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8939, 291 aa
1>>>pF1KB8939 291 - 291 aa - 291 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.6186+/-0.000851; mu= 3.7296+/- 0.052
mean_var=257.5476+/-53.951, 0's: 0 Z-trim(116.3): 34 B-trim: 941 in 1/51
Lambda= 0.079918
statistics sampled from 16886 (16914) to 16886 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.825), E-opt: 0.2 (0.52), width: 16
Scan time: 3.000
The best scores are: opt bits E(32554)
CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 2013 244.2 8.6e-65
CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 1453 179.6 2.3e-45
CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 976 124.7 9.3e-29
CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 954 122.0 4.4e-28
CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 869 112.7 8.7e-25
CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 744 98.3 1.8e-20
>>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa)
initn: 2013 init1: 2013 opt: 2013 Z-score: 1276.7 bits: 244.2 E(32554): 8.6e-65
Smith-Waterman score: 2013; 100.0% identity (100.0% similar) in 291 aa overlap (1-291:1-291)
10 20 30 40 50 60
pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 AAEAKERENNENSNSNSHNPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 AAEAKERENNENSNSNSHNPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGL
190 200 210 220 230 240
250 260 270 280 290
pF1KB8 PSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 PSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS
250 260 270 280 290
>>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa)
initn: 1400 init1: 1310 opt: 1453 Z-score: 927.8 bits: 179.6 E(32554): 2.3e-45
Smith-Waterman score: 1456; 74.7% identity (87.0% similar) in 300 aa overlap (1-291:1-284)
10 20 30 40 50 60
pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR
:::::.::::::::::::::::::::.:::::::::::::.:::::::::::::::::::
CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS
:::::::::::::::::::: :::::::::::.::::::::::::::::::::::::::.
CCDS97 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::
CCDS97 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
130 140 150 160 170 180
190 200 210 220 230
pF1KB8 AAEAKERENNENSNSNSH-----NPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSP
:::::::::.::.::.:. .::.: :: ...:::.: .: .::..: .:::.
CCDS97 AAEAKERENTENNNSSSNKQNQLSPLEG-GKPLMSSSEEEFSPPQSPDQNS---VLLLQG
190 200 210 220 230
240 250 260 270 280 290
pF1KB8 PPPGLPSLHSLGHPPGPSAVPVPVPGGGGADP---LQ-HHHGLQDSILNPMSANLVDLGS
..:: . . .:: ...: :: :.: ::::.:.:....::::::
CCDS97 ---------NMGHARSSN---YSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS
240 250 260 270 280
>>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa)
initn: 973 init1: 804 opt: 976 Z-score: 629.8 bits: 124.7 E(32554): 9.3e-29
Smith-Waterman score: 976; 61.2% identity (83.6% similar) in 232 aa overlap (1-228:79-309)
10 20 30
pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERL
: .:::..:. :::: :::.:.. :.::::
CCDS18 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
50 60 70 80 90 100
40 50 60 70 80
pF1KB8 GRFLWSLP----ACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQL
:::::::: ::: ..:.::.:.:.:::::: ::::.::.:::.:.:. ..:.::: .
CCDS18 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
110 120 130 140 150 160
90 100 110 120 130 140
pF1KB8 WLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHN
::.::: ::::::::::: : :::::.::::::.:::::. ..::::..::.::::: ..
CCDS18 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
170 180 190 200 210 220
150 160 170 180 190 200
pF1KB8 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGK
:::.: .:::::.::::: :::.::::::::::::: ::.: ... . .. : :
CCDS18 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC
230 240 250 260 270 280
210 220 230 240 250 260
pF1KB8 SVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGAD
. ::.:. .: ...: : ::
CCDS18 PTHGSAESPST-AASPTTSVSSLTERADTGTSILSVTSSDSECDV
290 300 310 320 330
>>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa)
initn: 948 init1: 790 opt: 954 Z-score: 617.7 bits: 122.0 E(32554): 4.4e-28
Smith-Waterman score: 954; 58.1% identity (82.6% similar) in 241 aa overlap (1-234:1-238)
10 20 30 40 50
pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLP----ACEHLHKNESVLKAKAVV
: .:: ..:. .::: :::.:...:..::::::::::: ::: :.::::::.:.:.:
CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB8 AFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFP
::: ::.::::.:::.:.:. ..::::: :::.::: ::::::::::: : :::::.:::
CCDS97 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB8 LPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR
:::.:::::. ..::::..: .::::: ..:::.: .:::::.::::: :::.:::::::
CCDS97 LPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB8 QRDRAAEAKERENNENSNSNSHNPLNGSGKS---VLGSSEDEKTPSGTPDHSSSSPALLL
:::::: ::.: ... ...: : . : . ::: . .:... . .... :. .
CCDS97 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVA---TSPAASLSSKAATSAISI
190 200 210 220 230
240 250 260 270 280 290
pF1KB8 SPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS
.
CCDS97 TSSDSECDI
240
>>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa)
initn: 890 init1: 863 opt: 869 Z-score: 558.5 bits: 112.7 E(32554): 8.7e-25
Smith-Waterman score: 874; 50.0% identity (70.5% similar) in 302 aa overlap (7-290:106-404)
10 20 30
pF1KB8 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWS
..:. ..::::::.::::::..::.:::::
CCDS97 AAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEALQQGGNLDRLARFLWS
80 90 100 110 120 130
40 50 60 70 80 90
pF1KB8 LPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAE
:: . :. :::.:::.:.::::.: . :::.:::::.: :: ::::: ::.: :::
CCDS97 LPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAE
140 150 160 170 180 190
100 110 120 130 140 150
pF1KB8 KLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRE
. :::::::: :::.::::::::.::::::: ::::::::..:.: : .: :::: :::.
CCDS97 RARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRH
200 210 220 230 240 250
160 170 180 190 200 210
pF1KB8 LAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGKSVLGSSEDEK
::. :::. ::::::::::::::: . ... ..: .... ...:. :. .
CCDS97 LAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDE-SSKGHEDLSPHPLSS
260 270 280 290 300 310
220 230 240 250 260 270
pF1KB8 TPSGTPDHSSSS---PALLLSPPPPGLPSLHSLGHPPGPSAVPV---PVPGGGGADPLQH
. .: . : :: :. . . . :: : : . : ::. :: .:.. .:
CCDS97 SSDGITNLSLSSHMEPVYMQQIGNAKI-SLSSSGVLLNGSLVPASTSPVFLNGNS-FIQG
320 330 340 350 360 370
280 290
pF1KB8 HHGL----------QDSILNP--MSANLVDLGS
:. : ::: ::.:.:. :
CCDS97 PSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKEFKVLQSSANSAT
380 390 400 410 420 430
CCDS97 TTSYSPSVPVSFPGLIPSTEVKREGIQTVASQDGGSVVTFTTPVQINQYGIVQIPNSGAN
440 450 460 470 480 490
>>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa)
initn: 808 init1: 730 opt: 744 Z-score: 480.9 bits: 98.3 E(32554): 1.8e-20
Smith-Waterman score: 767; 44.9% identity (67.7% similar) in 316 aa overlap (5-286:81-393)
10 20 30
pF1KB8 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF
:: . :. ::::::::.: :.:. ::.::
CCDS12 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF
60 70 80 90 100 110
40 50 60 70 80 90
pF1KB8 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI
: .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.:
CCDS12 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH
120 130 140 150 160 170
100 110 120 130 140 150
pF1KB8 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE
:::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: :
CCDS12 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE
180 190 200 210 220 230
160 170 180 190 200
pF1KB8 KRELAEATGLTTTQVSNWFKNRRQRDR------AAEAKERENN---ENSNSNSHNPLNGS
::.:: :::. ::::::::::::::: : .: ..: :. .: : . :. .
CCDS12 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG
240 250 260 270 280 290
210 220 230 240
pF1KB8 GKSVLGSSEDEKT--------PSGTPDHSS-----------SSPALLLSPPPPGLPSLHS
. : . . . . :. : :: .:::.::. : . .: .
CCDS12 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A
300 310 320 330 340
250 260 270 280 290
pF1KB8 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS
::. . : :. . ::::: : : .: ... .:.:.....
CCDS12 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG
350 360 370 380 390 400
CCDS12 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS
410 420 430 440 450 460
291 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 00:47:11 2016 done: Sat Nov 5 00:47:11 2016
Total Scan time: 3.000 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]