FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9760, 739 aa
1>>>pF1KB9760 739 - 739 aa - 739 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 11.4050+/-0.00102; mu= -4.3838+/- 0.062
mean_var=447.2030+/-92.429, 0's: 0 Z-trim(116.6): 27 B-trim: 170 in 1/52
Lambda= 0.060649
statistics sampled from 17227 (17251) to 17227 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.797), E-opt: 0.2 (0.53), width: 16
Scan time: 4.750
The best scores are: opt bits E(32554)
CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 4869 440.6 4.1e-123
CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 1055 106.9 1.2e-22
CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 744 79.3 9.5e-15
CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 740 79.0 1.3e-14
CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 731 78.1 2.1e-14
CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 690 74.5 2.2e-13
>>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa)
initn: 4869 init1: 4869 opt: 4869 Z-score: 2323.8 bits: 440.6 E(32554): 4.1e-123
Smith-Waterman score: 4869; 99.7% identity (100.0% similar) in 739 aa overlap (1-739:1-739)
10 20 30 40 50 60
pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 AEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPAERL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 RGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRAL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 GAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 SLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERGAAPVSAEAAA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 QGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEASSLGPLL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQVAAPGPALGEE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 VLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 TSQVVTLPQAVGPLQLLAAGPGSPVKVAAAAGPANVHLINSGVGVTALQLPSATAPGNFL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 LANPVSGSPIVTGVAVQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL
:::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::
CCDS12 LANPVSGSPIVTGVALQQGKIILTATFPTSMLVSQVLPPAPGLALPLKPETAISVPEGGL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS12 PVAPSPALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPA
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTMLRLPDPDPEGLLLGATAGGEVDEGLEA
::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::
CCDS12 AVPVWSAGLELSAGTEGLLEAEKGLGTQAPHTVLRLPDPDPEGLLLGATAGGEVDEGLEA
670 680 690 700 710 720
730
pF1KB9 EAKVLTQLQSVPVEEPLEL
:::::::::::::::::::
CCDS12 EAKVLTQLQSVPVEEPLEL
730
>>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa)
initn: 907 init1: 853 opt: 1055 Z-score: 520.0 bits: 106.9 E(32554): 1.2e-22
Smith-Waterman score: 1099; 35.5% identity (59.1% similar) in 785 aa overlap (10-738:36-779)
10 20 30
pF1KB9 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTL
:: :: : . : : : .: .
CCDS97 PTGQIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARV
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB9 QAAEGE-AAAAAGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEAL
.. :: :::::::.: . .: : ::. : : :::..::::::::
CCDS97 SGEEGAVAAAAAGAAADQVQLHSELLGR-----HHHAAAAAAQTPLAFSPDHVACVCEAL
70 80 90 100 110 120
100 110 120 130 140 150
pF1KB9 LQAGHAGRLSRFLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHA
:.:. ::.::: .:: .. :::.. .:.:::::::..: : ::: .:::. : .:.:
CCDS97 QQGGNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHP
130 140 150 160 170 180
160 170 180 190 200 210
pF1KB9 FLQDLYLRARYHEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKA
.::.:. .::: :::::::: ::::::::::.:::::.::::::::::::::.:: :::
CCDS97 LLQQLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKE
190 200 210 220 230 240
220 230 240 250 260 270
pF1KB9 CYRGNRYPTPDEKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTED
:. ::::.: :::.:: .::::::::::::::::::::. . . ::::::::.:::
CCDS97 LYKQNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSE--TQSKSESDGNPSTED
250 260 270 280 290
280 290 300 310 320 330
pF1KB9 ESSRSPEDLERGAAPVSAEAAAQGS-------IFLAGTGPPAPCPASSSILVNGSFLAAS
:::.. ::: :... .. : ... : .::..:.:::.. ::
CCDS97 ESSKGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAS
300 310 320 330 340 350
340 350 360 370 380
pF1KB9 GSPAVLLNG-----GP--VIINGLALGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSL
:: :.::: :: ::.::: .:...... :. :: . : .. . .
CCDS97 TSP-VFLNGNSFIQGPSGVILNGLNVGNTQAVA---LN-----PPKMSSNIVSNGISMTD
360 370 380 390 400
390 400 410 420 430 440
pF1KB9 VLDPQTGEVR-LEEAQSEAPETKGAQVAAPGPALGEEVLGPLAQVVPG-PPTAATFPLPP
.: . .:. .. :: : ..: ... .:.. :.. :: :.. .
CCDS97 ILGSTSQDVKEFKVLQSSA---NSATTTSYSPSV------PVS--FPGLIPSTEVKREGI
410 420 430 440 450
450 460 470 480 490 500
pF1KB9 GPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVPTSQVVTLPQAVGPLQLLAAGPG
: . . .:: .. : . .. . ....:. .:: .. . .:::: :
CCDS97 QTVASQDGGSVVTFTTP----VQINQYG-IVQIPNSGANSQFLNGSIGFSPLQL----P-
460 470 480 490 500
510 520 530 540 550
pF1KB9 SPVKVAAAAGPANVHLINSGVGV-----TALQ----LPSATAPGNFLLANPVSGSPIVTG
::.:::. : .: .: .. :..: . :. ::. . . : .:. : :
CCDS97 -PVSVAASQGNISVSSSTSDGSTFTSESTTVQQGKVFLSSLAPSAVVYTVPNTGQTI--G
510 520 530 540 550 560
560 570 580 590 600
pF1KB9 VAVQQG---KIILTATFPTSM--LVSQVLPPA--PGLAL-PLKPETAISVPEGGLPVAPS
. :.: ..... .:... :. : : .: :: . : .. ..::
CCDS97 SVKQEGLERSLVFSQLMPVNQNAQVNANLSSENISGSGLHPLASSLVNVSPTHNFSLSPS
570 580 590 600 610 620
610 620 630 640 650 660
pF1KB9 PALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSP---AA-
: .. .. .:: : ....:: : . . : : . :. : ::
CCDS97 TLLNPTELNRDIADSQPMSAPVASKSTVTSVSNTNYATLQNCSLITGQDLLSVPMTQAAL
630 640 650 660 670 680
670 680 690 700 710
pF1KB9 ---VPVW--SAGLELSAGTEGLLEAEKGLGTQAPHTMLR--LPDPDPEG----LLLGATA
::. ..: : . ... :. : :. .: . : . . .. ..: . .
CCDS97 GEIVPTAEDQVGHPSPAVHQDFVQ-EHRLVLQSVANMKENFLSNSESKATSSLMMLDSKS
690 700 710 720 730 740
720 730
pF1KB9 ----GGEVD---EGLEAEAKVLTQLQSVPVEEPLEL
: :: : ::.. : :..::.: ..: ..
CCDS97 KYVLDGMVDTVCEDLETDKKELAKLQTVQLDEDMQDL
750 760 770 780
>>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa)
initn: 808 init1: 730 opt: 744 Z-score: 378.2 bits: 79.3 E(32554): 9.5e-15
Smith-Waterman score: 767; 44.3% identity (67.7% similar) in 316 aa overlap (81-393:5-286)
60 70 80 90 100 110
pF1KB9 GAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRF
:: . :. ::::::::.: :.:. ::.::
CCDS18 MSMLPT-FGFTQEQVACVCEVLQQGGNIERLGRF
10 20 30
120 130 140 150 160 170
pF1KB9 LGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYH
: .:: :.:. .. ::.:.:.:::.::.. :::..:::. : .:: ::.:.:.:.:
CCDS18 LWSLPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYI
40 50 60 70 80 90
180 190 200 210 220 230
pF1KB9 EAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDE
:::. ::: :::: :::.:.:::::..::::::: :::::.::..:. : : ::.: :
CCDS18 EAEKLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPRE
100 110 120 130 140 150
240 250 260 270 280 290
pF1KB9 KRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLERG
::.:: :::. ::::::::::::::: : .: ..: .. . .:..:
CCDS18 KRELAEATGLTTTQVSNWFKNRRQRDR------AAEAKERENNENS-NSNSHNP------
160 170 180 190 200
300 310 320 330 340
pF1KB9 AAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGL-A
: :.: . . . .:. .:.:::.::. : . .: .
CCDS18 ---------------LNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSPPPPGLPSLHS
210 220 230 240
350 360 370 380 390 400
pF1KB9 LGE--ASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKG
::. . : :. . ::::: : : .: ... .:.:.....
CCDS18 LGHPPGPSAVPVPVPGGGGADPLQHH-HGLQDS----ILNPMSANLVDLGS
250 260 270 280 290
410 420 430 440 450 460
pF1KB9 AQVAAPGPALGEEVLGPLAQVVPGPPTAATFPLPPGPVPAVAAPQVVPLSPPPGYPTGLS
>>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa)
initn: 772 init1: 546 opt: 740 Z-score: 375.6 bits: 79.0 E(32554): 1.3e-14
Smith-Waterman score: 754; 46.6% identity (69.2% similar) in 292 aa overlap (44-315:42-330)
20 30 40 50 60 70
pF1KB9 AGGEAVAAAAATEEEEEEARQLLQTLQAAEGEAAAAAGAGAGAAAAGAEGPGSPGVPGS-
: :....:.: ::...:: : :. : ::
CCDS18 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR
20 30 40 50 60 70
80 90 100 110 120
pF1KB9 -PPEAAS--EPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGALPPA----ERLRGSDP
::: : . :: : ::::::: :::.: ..: ::.::: .:: : : . .
CCDS18 APPEELSMFQLPT-LNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACEAINKHES
80 90 100 110 120 130
130 140 150 160 170 180
pF1KB9 VLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARYHEAERARGRALGAVDK
.:::::.:::. :.. .::..::.. : :. :: ..:.:.:.:::. ::: :: :::
CCDS18 ILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGRPLGPVDK
140 150 160 170 180 190
190 200 210 220 230 240
pF1KB9 YRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPDEKRRLATLTGLSLTQV
::.:::::::.::::::. ..:::::.:. :. : . ::.:..::.:: :::. :::
CCDS18 YRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELAQATGLTPTQV
200 210 220 230 240 250
250 260 270 280 290
pF1KB9 SNWFKNRRQRDRTGAG---------GGAPCKSESD-GNPTTEDESSRSPEDLERGAAPVS
.:::::::::::..:. : . .: .. : :: :..:: .. ::
CCDS18 GNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGCPT--HGSAESPSTAASPTTSVS
260 270 280 290 300
300 310 320 330 340 350
pF1KB9 A--EAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLALGEA
. : : :. .:. :. . :
CCDS18 SLTERADTGTSILSVTSSDSECDV
310 320 330
>>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa)
initn: 745 init1: 719 opt: 731 Z-score: 372.2 bits: 78.1 E(32554): 2.1e-14
Smith-Waterman score: 743; 48.8% identity (72.4% similar) in 254 aa overlap (80-333:5-244)
50 60 70 80 90 100
pF1KB9 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR
: : :. ::::::::.: :.:. ::.:
CCDS97 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR
10 20 30
110 120 130 140 150 160
pF1KB9 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY
:: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.:
CCDS97 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY
40 50 60 70 80 90
170 180 190 200 210 220
pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD
:::. ::: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.:
CCDS97 VEAEKLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR
100 110 120 130 140 150
230 240 250 260 270 280
pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER
:::.:: :::. ::::::::::::::: :. . .. ..: ... ... :: ::
CCDS97 EKRELAEATGLTTTQVSNWFKNRRQRDR--AAEAKERENTENNNSSSNKQNQLSP--LE-
160 170 180 190 200
290 300 310 320 330 340
pF1KB9 GAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLA
:. :. . . . : :: .: .:..:.. : .:
CCDS97 GGKPLMSSSEEEFS-------PPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGL
210 220 230 240 250 260
350 360 370 380 390 400
pF1KB9 LGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQ
CCDS97 QTHQHQLQDSLLGPLTSSLVDLGS
270 280
>>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa)
initn: 671 init1: 562 opt: 690 Z-score: 353.6 bits: 74.5 E(32554): 2.2e-13
Smith-Waterman score: 694; 51.7% identity (72.4% similar) in 232 aa overlap (84-299:7-231)
60 70 80 90 100 110
pF1KB9 AGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGA
: :::.::: :::.: ..: . ::.::: .
CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWS
10 20 30
120 130 140 150 160
pF1KB9 LP--PA--ERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY
:: :: : : .. ::::::.:::. :.: :::..::.. : :: :: :.:.:.:
CCDS97 LPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWLEAHY
40 50 60 70 80 90
170 180 190 200 210 220
pF1KB9 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD
.:::. ::: :: :::::.:::::::.::::::. ..:::::.: :. : . ::.:.
CCDS97 QEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPS
100 110 120 130 140 150
230 240 250 260 270
pF1KB9 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGA------------GGGAPCKSESDGNPTTE
.::.:: :::. :::.:::::::::::..: :.: ..:.::.: .
CCDS97 KKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVL
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB9 DESSRSPEDLERGAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVL
.. :: :: .:..::
CCDS97 GVAT-SP------AASLSSKAATSAISITSSDSECDI
220 230 240
739 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 00:56:13 2016 done: Sat Nov 5 00:56:14 2016
Total Scan time: 4.750 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]