FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6280, 781 aa 1>>>pF1KB6280 781 - 781 aa - 781 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.1915+/-0.00111; mu= 14.2603+/- 0.068 mean_var=203.0183+/-42.185, 0's: 0 Z-trim(109.6): 53 B-trim: 0 in 0/50 Lambda= 0.090013 statistics sampled from 10954 (10982) to 10954 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.674), E-opt: 0.2 (0.337), width: 16 Scan time: 3.670 The best scores are: opt bits E(32554) CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 4994 662.1 9.8e-190 CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 1066 152.0 3.4e-36 CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 916 132.0 1.3e-30 CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 869 125.9 9.4e-29 CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 768 112.7 7.5e-25 CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 751 110.6 4.2e-24 >>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa) initn: 4994 init1: 4994 opt: 4994 Z-score: 3519.8 bits: 662.1 E(32554): 9.8e-190 Smith-Waterman score: 4994; 99.9% identity (99.9% similar) in 781 aa overlap (1-781:1-781) 10 20 30 40 50 60 pF1KB6 MSSSSPTGQIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MSSSSPTGQIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAAT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 AAARVSGEEGAVAAAAAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 AAARVSGEEGAVAAAAAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEAL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 QQGGNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 QQGGNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 LLQQLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LLQQLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 LYKQNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 LYKQNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDES 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 SKGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 SKGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 PVFLNGNSFIQGPSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 PVFLNGNSFIQGPSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 FKVLQSSANSATTTSYSPSVPVSFPGLIPSTEVKREGIQTVASQDGGSVVTFTTPVQINQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 FKVLQSSANSATTTSYSPSVPVSFPGLIPSTEVKREGIQTVASQDGGSVVTFTTPVQINQ 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 YGIVQIPNSGANSQFLNGSIGFSPLQLPPVSVAASQGNISVSSSTSDGSTFTSESTTVQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 YGIVQIPNSGANSQFLNGSIGFSPLQLPPVSVAASQGNISVSSSTSDGSTFTSESTTVQQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 GKVFLSSLAPSAVVYTVPNTGQTIGSVKQEGLERSLVFSQLMPVNQNAQVNANLSSENIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 GKVFLSSLAPSAVVYTVPNTGQTIGSVKQEGLERSLVFSQLMPVNQNAQVNANLSSENIS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 GSGLPPLASSLVNVSPTHNFSLSPSTLLNPTELNRDIADSQPMSAPVASKSTVTSVSNTN :::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 GSGLHPLASSLVNVSPTHNFSLSPSTLLNPTELNRDIADSQPMSAPVASKSTVTSVSNTN 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB6 YATLQNCSLITGQDLLSVPMTQAALGEIVPTAEDQVGHPSPAVHQDFVQEHRLVLQSVAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 YATLQNCSLITGQDLLSVPMTQAALGEIVPTAEDQVGHPSPAVHQDFVQEHRLVLQSVAN 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB6 MKENFLSNSESKATSSLMMLDSKSKYVLDGMVDTVCEDLETDKKELAKLQTVQLDEDMQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MKENFLSNSESKATSSLMMLDSKSKYVLDGMVDTVCEDLETDKKELAKLQTVQLDEDMQD 730 740 750 760 770 780 pF1KB6 L : CCDS97 L >>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa) initn: 907 init1: 853 opt: 1066 Z-score: 763.3 bits: 152.0 E(32554): 3.4e-36 Smith-Waterman score: 1104; 36.8% identity (59.9% similar) in 715 aa overlap (36-701:10-690) 10 20 30 40 50 60 pF1KB6 PTGQIASAADIKQENGMESASEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARV :: :: : . : : : .: . CCDS12 MATLPAEPSAGPAAGGEAVAAAAATEEEEEEARQLLQTL 10 20 30 70 80 90 100 110 120 pF1KB6 SGEEGAVAAAAAGAAADQVQLHSELLGR-----HHHAAAAAAQTPLAFSPDHVACVCEAL .. :: :::::::.: . .: : ::. : : :::..:::::::: CCDS12 QAAEGE-AAAAAGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEAL 40 50 60 70 80 90 130 140 150 160 170 180 pF1KB6 QQGGNLDRLARFLWSLPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHP :.:. ::.::: .:: .. :::.. .:.:::::::..: : ::: .:::. : .:.: CCDS12 LQAGHAGRLSRFLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHA 100 110 120 130 140 150 190 200 210 220 230 240 pF1KB6 LLQQLWYKARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKE .::.:. .::: :::::::: ::::::::::.:::::.::::::::::::::.:: ::: CCDS12 FLQDLYLRARYHEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKA 160 170 180 190 200 210 250 260 270 280 290 pF1KB6 LYKQNRYPSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPSE--TQSKSESDGNPSTED :. ::::.: :::.:: .::::::::::::::::::::. . . ::::::::.::: CCDS12 CYRGNRYPTPDEKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTED 220 230 240 250 260 270 300 310 320 330 340 350 pF1KB6 ESSKGHEDLSPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAS :::.. ::: :... .. : ... : .::..:.:::.. :: CCDS12 ESSRSPEDLERGAAPVSAEAAAQGS-------IFLAGTGPPAPCPASSSILVNGSFLAAS 280 290 300 310 320 330 360 370 380 390 400 pF1KB6 TSP-VFLNGNSFIQGPSGVILNGLNVGNTQAVAL--------NPPKMSSNIVSNGISMTD :: :.::: :: ::.::: .:...... :: . : .. . . CCDS12 GSPAVLLNG-----GP--VIINGLALGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSL 340 350 360 370 380 410 420 430 440 450 pF1KB6 ILGSTSQDVKEFKVLQSSA---NSATTTSYSPSV------PVS--FPGLIPSTEVKREGI .: . .:. .. :: : ..: ... .:.. :.. :: :.. . CCDS12 VLDPQTGEVR-LEEAQSEAPETKGAQVAAPGPALGEEVLGPLAQVVPG-PPTAATFPLPP 390 400 410 420 430 440 460 470 480 490 500 pF1KB6 QTVASQDGGSVVTFTTP----VQINQYG-IVQIPNSGANSQFLNGSIGFSPLQL----P- : . . .:: .. : . .. . ....:. .:: .. . .:::: : CCDS12 GPVPAVAAPQVVPLSPPPGYPTGLSPTSPLLNLPQVVPTSQVVTLPQAVGPLQLLAAGPG 450 460 470 480 490 500 510 520 530 540 550 560 pF1KB6 -PVSVAASQGNISVSSSTSDGSTFTSESTTVQQGKVFLSSLAPSAVVYTVPNTGQTI--G ::.:::. : .: .: .. :..: . :. ::. . . : .:. : : CCDS12 SPVKVAAAAGPANVHLINSGVGV-----TALQ----LPSATAPGNFLLANPVSGSPIVTG 510 520 530 540 550 570 580 590 600 610 620 pF1KB6 SVKQEGLERSLVFSQLMPVNQNAQVNANLSSENISGSGLPPLASSLVNVSPTHNFSLSPS . :.: ..... .:... :. : : .:: . ..: : .. ..:: CCDS12 VALQQG---KIILTATFPTSM--LVSQVLPPA--PGLALPLKPETAISV-PEGGLPVAPS 560 570 580 590 600 630 640 650 660 670 680 pF1KB6 TLLNPTELNRDIADSQPMSAPVASKSTVTSVSNTNYATLQNCSLITGQDLL----SVPMT : .. .. .:: : ....:: : . . : : . :. .::. CCDS12 PALPEAHALGTLSAQQPPPAAATTSSTSLPFSPDSPGLLPNFPAPPPEGLMLSPAAVPVW 610 620 630 640 650 660 690 700 710 720 730 pF1KB6 QAAL----G-EIVPTAEDQVGHPSPAVHQDFVQEHRLVLQSVANMKENFLSNSESKATSS .:.: : : . :: .: .: CCDS12 SAGLELSAGTEGLLEAEKGLGTQAPHTVLRLPDPDPEGLLLGATAGGEVDEGLEAEAKVL 670 680 690 700 710 720 >>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa) initn: 920 init1: 891 opt: 916 Z-score: 662.8 bits: 132.0 E(32554): 1.3e-30 Smith-Waterman score: 916; 59.7% identity (79.4% similar) in 243 aa overlap (106-342:7-244) 80 90 100 110 120 130 pF1KB6 AAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEALQQGGNLDRLARFLWS ..:. ..::::::.:::::::.::.::::: CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWS 10 20 30 140 150 160 170 180 190 pF1KB6 LPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAE :: : :. :::.:::.:.::::.: . :::.:::::.: ::: ::::: ::.:.::: CCDS97 LPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAE 40 50 60 70 80 90 200 210 220 230 240 250 pF1KB6 RARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRH . :::::::: :::.:::::::::::::::: ::::::::..:.: : .: :::: :::. CCDS97 KLRGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRE 100 110 120 130 140 150 260 270 280 290 300 310 pF1KB6 LAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDESSKGHEDLSP----HP ::. :::. ::::::::::::::: .:.. . ....: : ::. ...::: .: CCDS97 LAEATGLTTTQVSNWFKNRRQRDRA-AEAKERENTENNNS----SSNKQNQLSPLEGGKP 160 170 180 190 200 210 320 330 340 350 360 pF1KB6 LSSSSDGITNLSLSSHMEPVYMQQ--IGNAKISLSSSGVLLNGSLVPASTSPVFLNGNSF : :::. . : .. : . : .:.:. : CCDS97 LMSSSEEEFSPPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQHQLQDSL 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB6 IQGPSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKEFKVLQSSAN CCDS97 LGPLTSSLVDLGS 280 >>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa) initn: 890 init1: 863 opt: 869 Z-score: 629.7 bits: 125.9 E(32554): 9.4e-29 Smith-Waterman score: 874; 50.0% identity (70.5% similar) in 302 aa overlap (106-404:7-290) 80 90 100 110 120 130 pF1KB6 AAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEALQQGGNLDRLARFLWS ..:. ..::::::.::::::..::.::::: CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWS 10 20 30 140 150 160 170 180 190 pF1KB6 LPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAE :: . :. :::.:::.:.::::.: . :::.:::::.: :: ::::: ::.: ::: CCDS18 LPACEHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAE 40 50 60 70 80 90 200 210 220 230 240 250 pF1KB6 RARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRH . :::::::: :::.::::::::.::::::: ::::::::..:.: : .: :::: :::. CCDS18 KLRGRPLGAVGKYRVRRKFPLPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRE 100 110 120 130 140 150 260 270 280 290 300 310 pF1KB6 LAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDE-SSKGHEDLSPHPLSS ::. :::. ::::::::::::::: . ... ..: .... ...:. :. . CCDS18 LAEATGLTTTQVSNWFKNRRQRDRAAEAKERENNENSNSNSHNPLNGSGKSVLGSSEDEK 160 170 180 190 200 210 320 330 340 350 360 370 pF1KB6 SSDGITNLSLSSHMEPVYMQQIGNAKI-SLSSSGVLLNGSLVPASTSPVFLNGNS-FIQG . .: . : :: :. . . . :: : : . : ::. :: .:.. .: CCDS18 TPSGTPDHSSSS---PALLLSPPPPGLPSLHSLGHPPGPSAVPV---PVPGGGGADPLQH 220 230 240 250 260 270 380 390 400 410 420 430 pF1KB6 PSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKEFKVLQSSANSAT :. : ::: ::.:.:. : CCDS18 HHGL----------QDSILNP--MSANLVDLGS 280 290 440 450 460 470 480 490 pF1KB6 TTSYSPSVPVSFPGLIPSTEVKREGIQTVASQDGGSVVTFTTPVQINQYGIVQIPNSGAN >>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa) initn: 763 init1: 629 opt: 768 Z-score: 559.7 bits: 112.7 E(32554): 7.5e-25 Smith-Waterman score: 768; 51.1% identity (74.3% similar) in 237 aa overlap (103-326:3-239) 80 90 100 110 120 130 pF1KB6 AAAAAGAAADQVQLHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLAR : : : :::..:: :::.:...:...::.: CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGR 10 20 30 140 150 160 170 180 pF1KB6 FLWSLPQS----DLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWY :::::: . . : :::.:.:::.:::: : : ::: :::.:.: . .: :: :: CCDS97 FLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWL 40 50 60 70 80 90 190 200 210 220 230 240 pF1KB6 KARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRY .:.: :::. :::::: :::::.:.::::::::::::. ..::::..:. :.: : :. : CCDS97 EAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRHLLREWYLQDPY 100 110 120 130 140 150 250 260 270 280 290 300 pF1KB6 PSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPS---ETQSKSESDGNPSTEDESSKGH :.:..::.::. :::. :::.::::::::::: . . :.. :.:. . . : CCDS97 PNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGT 160 170 180 190 200 210 310 320 330 340 350 pF1KB6 EDL-----SPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAST .. :: ::. . . .:..: CCDS97 PEVLGVATSPAASLSSKAATSAISITSSDSECDI 220 230 240 >>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa) initn: 793 init1: 613 opt: 751 Z-score: 546.2 bits: 110.6 E(32554): 4.2e-24 Smith-Waterman score: 756; 44.7% identity (68.3% similar) in 293 aa overlap (56-326:42-325) 30 40 50 60 70 80 pF1KB6 SEGQEAHREVAGGAAVGLSPPAPAPFPLEPGDAATAAARVSGEEGAVAAAAAGAAADQVQ : :. ... .: :. :..:.:... . CCDS18 SHFLLPNFADSHHRSILLASSGGGNGAGGGGGAGGGSGGGNGAGGGGAGGAGGGGGGGSR 20 30 40 50 60 70 90 100 110 120 130 140 pF1KB6 LHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLARFLWSLPQS----D : :. : : : :::..:: :::.:.. :...::.::::::: . . CCDS18 APPEELSMF--------QLPTLNFSPEQVASVCETLEETGDIERLGRFLWSLPVAPGACE 80 90 100 110 120 150 160 170 180 190 200 pF1KB6 LLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAERARGR . .::.:.:::.:::: : . .:: :::.:.: . .: :: .: .:.: :::. ::: CCDS18 AINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAMWLEAHYQEAEKLRGR 130 140 150 160 170 180 210 220 230 240 250 260 pF1KB6 PLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRHLAKIT ::: :::::.:.::::::::::::. ..::::..:. :.: : :. ::.:..::.::. : CCDS18 PLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQDPYPNPSKKRELAQAT 190 200 210 220 230 240 270 280 290 300 pF1KB6 GLSLTQVSNWFKNRRQRDR-------------NPSETQSKSESDGNP---STEDESSKGH ::. :::.::::::::::: .:: .: .: : : :.:. :. . CCDS18 GLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEP-GCPTHGSAESPSTAAS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 EDLSPHPLSSSSD-GITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPASTSPVF : :. .: : . ::..: CCDS18 PTTSVSSLTERADTGTSILSVTSSDSECDV 310 320 330 781 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 18:04:10 2016 done: Mon Nov 7 18:04:11 2016 Total Scan time: 3.670 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]