FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB8933, 284 aa
1>>>pF1KB8933 284 - 284 aa - 284 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.9633+/-0.000805; mu= 14.2179+/- 0.049
mean_var=143.7370+/-30.681, 0's: 0 Z-trim(111.7): 75 B-trim: 0 in 0/51
Lambda= 0.106977
statistics sampled from 12551 (12626) to 12551 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.759), E-opt: 0.2 (0.388), width: 16
Scan time: 2.700
The best scores are: opt bits E(32554)
CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 1924 308.0 4.9e-84
CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 1442 233.7 1.2e-61
CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 934 155.3 5.3e-38
CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 920 153.0 2e-37
CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 905 151.3 2e-36
CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 720 122.7 7.8e-28
>>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa)
initn: 1924 init1: 1924 opt: 1924 Z-score: 1622.2 bits: 308.0 E(32554): 4.9e-84
Smith-Waterman score: 1924; 99.6% identity (99.6% similar) in 284 aa overlap (1-284:1-284)
10 20 30 40 50 60
pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLCGRPLGAVGKYRVRRKFPLPRT
:::::::::::::::::::::::::::::::::::::: :::::::::::::::::::::
CCDS97 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB8 AAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQGNMGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 AAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQGNMGH
190 200 210 220 230 240
250 260 270 280
pF1KB8 ARSSNYSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS
::::::::::::::::::::::::::::::::::::::::::::
CCDS97 ARSSNYSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS
250 260 270 280
>>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa)
initn: 1389 init1: 1299 opt: 1442 Z-score: 1220.1 bits: 233.7 E(32554): 1.2e-61
Smith-Waterman score: 1445; 74.3% identity (86.7% similar) in 300 aa overlap (1-284:1-291)
10 20 30 40 50 60
pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR
:::::.::::::::::::::::::::.:::::::::::::.:::::::::::::::::::
CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB8 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLCGRPLGAVGKYRVRRKFPLPRT
:::::::::::::::::::: :::::::::::.::::: ::::::::::::::::::::.
CCDS18 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB8 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
::::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::
CCDS18 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR
130 140 150 160 170 180
190 200 210 220 230
pF1KB8 AAEAKERENTENNNSSSNKQNQLSPLEG-GKPLMSSSEEEFSPPQSPDQNS---VLLLQG
:::::::::.::.::.:. .::.: :: ...:::.: .: .::..: .:::.
CCDS18 AAEAKERENNENSNSNSH-----NPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSP
190 200 210 220 230
240 250 260 270 280
pF1KB8 ---------NMGHARSSN---YSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS
..:: . . .:: ...: :: :.: ::::.:.:....::::::
CCDS18 PPPGLPSLHSLGHPPGPSAVPVPVPGGGGADP---LQ-HHHGLQDSILNPMSANLVDLGS
240 250 260 270 280 290
>>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa)
initn: 926 init1: 763 opt: 934 Z-score: 795.7 bits: 155.3 E(32554): 5.3e-38
Smith-Waterman score: 934; 57.8% identity (79.1% similar) in 244 aa overlap (1-239:79-317)
10 20 30
pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERL
: .::...:. :::: :::.:.. :..:::
CCDS18 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
50 60 70 80 90 100
40 50 60 70 80
pF1KB8 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL
:::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: .
CCDS18 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
110 120 130 140 150 160
90 100 110 120 130 140
pF1KB8 WLKAHYVEAEKLCGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN
::.::: ::::: ::::: : :::::.::::::::::::. ..::::..:..::::: ..
CCDS18 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
170 180 190 200 210 220
150 160 170 180 190 200
pF1KB8 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENTENNNSSSNKQNQLSPL
:::.: .:::::.::::: :::.::::::::::::: ::.: . . . :. . :
CCDS18 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMR----SLA
230 240 250 260 270 280
210 220 230 240 250 260
pF1KB8 EGGKPLMSSSEEEFSPPQSPDQN-SVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQH
: : : .:.: : :: . : : ... :
CCDS18 EPGCPTHGSAESP-STAASPTTSVSSLTERADTGTSILSVTSSDSECDV
290 300 310 320 330
270 280
pF1KB8 QLQDSLLGPLTSSLVDLGS
>>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa)
initn: 924 init1: 771 opt: 920 Z-score: 785.5 bits: 153.0 E(32554): 2e-37
Smith-Waterman score: 920; 68.1% identity (88.0% similar) in 191 aa overlap (1-187:1-191)
10 20 30 40 50
pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLP----ACDHLHKNESVLKAKAVV
: .:: ..:. .::: :::.:...:..::::::::::: ::. :.::::::.:.:.:
CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB8 AFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLCGRPLGAVGKYRVRRKFP
::: ::.::::.:::.:.:. ..: ::: :::.::: ::::: ::::: : :::::.:::
CCDS97 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB8 LPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR
:::::::::. ..::::..: .::::: ..:::.: .:::::.::::: :::.:::::::
CCDS97 LPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB8 QRDRAAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQG
:::::: ::.:
CCDS97 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS
190 200 210 220 230 240
>>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa)
initn: 909 init1: 880 opt: 905 Z-score: 767.3 bits: 151.3 E(32554): 2e-36
Smith-Waterman score: 905; 59.3% identity (79.0% similar) in 243 aa overlap (7-244:106-342)
10 20 30
pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWS
..:. ..::::::.:::::::.::.:::::
CCDS97 AAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEALQQGGNLDRLARFLWS
80 90 100 110 120 130
40 50 60 70 80 90
pF1KB8 LPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAE
:: : :. :::.:::.:.::::.: . :::.:::::.: ::: ::::: ::.:.:::
CCDS97 LPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAE
140 150 160 170 180 190
100 110 120 130 140 150
pF1KB8 KLCGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRE
. ::::::: :::.:::::::::::::::: ::::::::..:.: : .: :::: :::.
CCDS97 RARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRH
200 210 220 230 240 250
160 170 180 190 200 210
pF1KB8 LAEATGLTTTQVSNWFKNRRQRDRA-AEAKERENTENNNS----SSNKQNQLSPLEGGKP
::. :::. ::::::::::::::: .:.. . ....: : ::. ...::: .:
CCDS97 LAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDESSKGHEDLSP----HP
260 270 280 290 300 310
220 230 240 250 260 270
pF1KB8 LMSSSEEEFSPPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQHQLQDSL
: :::. . : .. : . : .:.:. :
CCDS97 LSSSSDGITNLSLSSHMEPVYMQQ--IGNAKISLSSSGVLLNGSLVPASTSPVFLNGNSF
320 330 340 350 360
280
pF1KB8 LGPLTSSLVDLGS
CCDS97 IQGPSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKEFKVLQSSAN
370 380 390 400 410 420
>>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa)
initn: 733 init1: 708 opt: 720 Z-score: 613.2 bits: 122.7 E(32554): 7.8e-28
Smith-Waterman score: 732; 48.4% identity (72.0% similar) in 254 aa overlap (5-244:80-333)
10 20 30
pF1KB8 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR
: : :. ::::::::.: :.:. ::.:
CCDS12 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR
50 60 70 80 90 100
40 50 60 70 80 90
pF1KB8 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY
:: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.:
CCDS12 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY
110 120 130 140 150 160
100 110 120 130 140 150
pF1KB8 VEAEKLCGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR
:::. :: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.:
CCDS12 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD
170 180 190 200 210 220
160 170 180 190 200
pF1KB8 EKRELAEATGLTTTQVSNWFKNRRQRDR--AAEAKERENTENNNSSSNKQNQLSP--LE-
:::.:: :::. ::::::::::::::: :. . .. ..: ... ... :: ::
CCDS12 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER
230 240 250 260 270 280
210 220 230 240 250 260
pF1KB8 GGKPLMSSSEEEFS-------PPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGL
:. :. . . . : :: .: .:..:.. : .:
CCDS12 GAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLA
290 300 310 320 330 340
270 280
pF1KB8 QTHQHQLQDSLLGPLTSSLVDLGS
CCDS12 LGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQ
350 360 370 380 390 400
284 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 22:45:56 2016 done: Sat Nov 5 22:45:57 2016
Total Scan time: 2.700 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]