FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0912, 246 aa
1>>>pF1KE0912 246 - 246 aa - 246 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.0467+/-0.000759; mu= 17.4880+/- 0.046
mean_var=108.9291+/-23.847, 0's: 0 Z-trim(110.3): 104 B-trim: 0 in 0/51
Lambda= 0.122886
statistics sampled from 11365 (11485) to 11365 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.737), E-opt: 0.2 (0.353), width: 16
Scan time: 2.200
The best scores are: opt bits E(32554)
CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 1643 301.5 3.5e-82
CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 1367 252.7 2.2e-67
CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 956 179.8 1.8e-45
CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 933 175.7 3e-44
CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 774 148.0 1.7e-35
CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 691 133.3 4.4e-31
>>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa)
initn: 1643 init1: 1643 opt: 1643 Z-score: 1589.0 bits: 301.5 E(32554): 3.5e-82
Smith-Waterman score: 1643; 99.6% identity (100.0% similar) in 246 aa overlap (1-246:1-246)
10 20 30 40 50 60
pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 LPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR
::::::::::::::::::::.:::::::::::::::::::::::::::::::::::::::
CCDS97 LPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS97 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS
190 200 210 220 230 240
pF1KE0 DSECDI
::::::
CCDS97 DSECDI
>>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa)
initn: 1388 init1: 1281 opt: 1367 Z-score: 1323.1 bits: 252.7 E(32554): 2.2e-67
Smith-Waterman score: 1367; 78.7% identity (91.7% similar) in 254 aa overlap (1-246:79-332)
10 20 30
pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERL
::::: :::::.:::.:::::::.::.:::
CCDS18 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL
50 60 70 80 90 100
40 50 60 70 80 90
pF1KE0 GRFLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQAL
:::::::::::.::::.::.::.:::::.:::: ::.:.:::::::::::::::.::::.
CCDS18 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM
110 120 130 140 150 160
100 110 120 130 140 150
pF1KE0 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRNLLREWYLQD
::::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::
CCDS18 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD
170 180 190 200 210 220
160 170 180 190 200
pF1KE0 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEG-
:::::::::::::::::::::::::::::::::::::::::::.:... .. :.: :
CCDS18 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC
230 240 250 260 270 280
210 220 230 240
pF1KE0 --DGTPEVLGVATSPAASLSS-----KAATSAISITSSDSECDI
:. : ..:.::..:.:: ..:: .:.::::::::.
CCDS18 PTHGSAESPSTAASPTTSVSSLTERADTGTSILSVTSSDSECDV
290 300 310 320 330
>>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa)
initn: 950 init1: 792 opt: 956 Z-score: 929.9 bits: 179.8 E(32554): 1.8e-45
Smith-Waterman score: 956; 58.1% identity (83.0% similar) in 241 aa overlap (1-238:1-234)
10 20 30 40 50 60
pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV
: .:: ..:. .::: :::.:...:..::::::::::: ::: :.::::::.:.:.:
CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLP----ACEHLHKNESVLKAKAVV
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP
::: ::.::::.:::.:.:. ..::::: :::.::: ::::::::::: : :::::.:::
CCDS18 AFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFP
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 LPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR
:::.:::::. ..::::..:..::::: ..:::.: .:::::.::::: :::.:::::::
CCDS18 LPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR
120 130 140 150 160 170
190 200 210 220 230
pF1KE0 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVAT---SPAASLSSKAATSAISI
:::::: ::.: ... ...: : . : . ::: . .:... . .... :. .
CCDS18 QRDRAAEAKERENNENSNSNSHNPLNGSGKS---VLGSSEDEKTPSGTPDHSSSSPALLL
180 190 200 210 220 230
240
pF1KE0 TSSDSECDI
.
CCDS18 SPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS
240 250 260 270 280 290
>>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa)
initn: 937 init1: 784 opt: 933 Z-score: 908.0 bits: 175.7 E(32554): 3e-44
Smith-Waterman score: 933; 68.6% identity (89.0% similar) in 191 aa overlap (1-191:1-187)
10 20 30 40 50 60
pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV
: .:: ..:. .::: :::.:...:..::::::::::: ::. :.::::::.:.:.:
CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLP----ACDHLHKNESVLKAKAVV
10 20 30 40 50
70 80 90 100 110 120
pF1KE0 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP
::: ::.::::.:::.:.:. ..: ::: :::.::: ::::::::::: : :::::.:::
CCDS97 AFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLRGRPLGAVGKYRVRRKFP
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE0 LPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR
:::::::::. ..::::..:..::::: ..:::.: .:::::.::::: :::.:::::::
CCDS97 LPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE0 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS
:::::: ::.:
CCDS97 QRDRAAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQG
180 190 200 210 220 230
>>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa)
initn: 769 init1: 635 opt: 774 Z-score: 750.8 bits: 148.0 E(32554): 1.7e-35
Smith-Waterman score: 774; 51.5% identity (73.8% similar) in 237 aa overlap (3-239:103-326)
10 20 30
pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGR
: : : :::..:: :::.:...:...::.:
CCDS97 AAAAAGAAADQVQLHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLAR
80 90 100 110 120 130
40 50 60 70 80 90
pF1KE0 FLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWL
:::::: . : :::.:.:::.:::: : : ::: :::.:.: . .: :: ::
CCDS97 FLWSLP----QSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWY
140 150 160 170 180
100 110 120 130 140 150
pF1KE0 EAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRNLLREWYLQDPY
.:.: :::. :::::: :::::.:.::::::::::::. ..::::..:: :.: : :. :
CCDS97 KARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRY
190 200 210 220 230 240
160 170 180 190 200 210
pF1KE0 PNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGT
:.:..::.::. :::. :::.::::::::::: . . :.. :.:. . . :
CCDS97 PSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPS---ETQSKSESDGNPSTEDESSKGH
250 260 270 280 290 300
220 230 240
pF1KE0 PEVLGVATSPAASLSSKAATSAISITSSDSECDI
.. :: ::. . . .:..:
CCDS97 EDL-----SPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAST
310 320 330 340 350
>>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa)
initn: 672 init1: 563 opt: 691 Z-score: 671.5 bits: 133.3 E(32554): 4.4e-31
Smith-Waterman score: 695; 51.7% identity (72.4% similar) in 232 aa overlap (7-231:84-299)
10 20 30
pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWS
: :::.::: :::.: ..: . ::.::: .
CCDS12 AGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGA
60 70 80 90 100 110
40 50 60 70 80 90
pF1KE0 LPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWLEAHY
:: :: : : .. ::::::.:::. :.: :::..::.. : :: :: :.:.:.:
CCDS12 LP--PA--ERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY
120 130 140 150 160
100 110 120 130 140 150
pF1KE0 QEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPS
.:::. ::: :: :::::.:::::::.::::::. ..:::::.: :. : . ::.:.
CCDS12 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD
170 180 190 200 210 220
160 170 180 190 200 210
pF1KE0 KKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVL
.::.:: :::. :::.:::::::::::..: :.: ..:.::.: .
CCDS12 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGA------------GGGAPCKSESDGNPTTE
230 240 250 260 270
220 230 240
pF1KE0 GVAT-SP------AASLSSKAATSAISITSSDSECDI
.. :: :: .:..::
CCDS12 DESSRSPEDLERGAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVL
280 290 300 310 320 330
246 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 06:34:55 2016 done: Sun Nov 6 06:34:56 2016
Total Scan time: 2.200 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]