FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE0912, 246 aa 1>>>pF1KE0912 246 - 246 aa - 246 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0467+/-0.000759; mu= 17.4880+/- 0.046 mean_var=108.9291+/-23.847, 0's: 0 Z-trim(110.3): 104 B-trim: 0 in 0/51 Lambda= 0.122886 statistics sampled from 11365 (11485) to 11365 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.737), E-opt: 0.2 (0.353), width: 16 Scan time: 2.200 The best scores are: opt bits E(32554) CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 1643 301.5 3.5e-82 CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 1367 252.7 2.2e-67 CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 956 179.8 1.8e-45 CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 933 175.7 3e-44 CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 774 148.0 1.7e-35 CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 691 133.3 4.4e-31 >>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa) initn: 1643 init1: 1643 opt: 1643 Z-score: 1589.0 bits: 301.5 E(32554): 3.5e-82 Smith-Waterman score: 1643; 99.6% identity (100.0% similar) in 246 aa overlap (1-246:1-246) 10 20 30 40 50 60 pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE0 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE0 LPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR ::::::::::::::::::::.::::::::::::::::::::::::::::::::::::::: CCDS97 LPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE0 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS 190 200 210 220 230 240 pF1KE0 DSECDI :::::: CCDS97 DSECDI >>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa) initn: 1388 init1: 1281 opt: 1367 Z-score: 1323.1 bits: 252.7 E(32554): 2.2e-67 Smith-Waterman score: 1367; 78.7% identity (91.7% similar) in 254 aa overlap (1-246:79-332) 10 20 30 pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERL ::::: :::::.:::.:::::::.::.::: CCDS18 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL 50 60 70 80 90 100 40 50 60 70 80 90 pF1KE0 GRFLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQAL :::::::::::.::::.::.::.:::::.:::: ::.:.:::::::::::::::.::::. CCDS18 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM 110 120 130 140 150 160 100 110 120 130 140 150 pF1KE0 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRNLLREWYLQD ::::::::::::::::::::::::::::::::::::::::::::::::::.::::::::: CCDS18 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD 170 180 190 200 210 220 160 170 180 190 200 pF1KE0 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEG- :::::::::::::::::::::::::::::::::::::::::::.:... .. :.: : CCDS18 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMRSLAEPGC 230 240 250 260 270 280 210 220 230 240 pF1KE0 --DGTPEVLGVATSPAASLSS-----KAATSAISITSSDSECDI :. : ..:.::..:.:: ..:: .:.::::::::. CCDS18 PTHGSAESPSTAASPTTSVSSLTERADTGTSILSVTSSDSECDV 290 300 310 320 330 >>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa) initn: 950 init1: 792 opt: 956 Z-score: 929.9 bits: 179.8 E(32554): 1.8e-45 Smith-Waterman score: 956; 58.1% identity (83.0% similar) in 241 aa overlap (1-238:1-234) 10 20 30 40 50 60 pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV : .:: ..:. .::: :::.:...:..::::::::::: ::: :.::::::.:.:.: CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLP----ACEHLHKNESVLKAKAVV 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP ::: ::.::::.:::.:.:. ..::::: :::.::: ::::::::::: : :::::.::: CCDS18 AFHRGNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFP 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 LPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR :::.:::::. ..::::..:..::::: ..:::.: .:::::.::::: :::.::::::: CCDS18 LPRSIWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR 120 130 140 150 160 170 190 200 210 220 230 pF1KE0 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVAT---SPAASLSSKAATSAISI :::::: ::.: ... ...: : . : . ::: . .:... . .... :. . CCDS18 QRDRAAEAKERENNENSNSNSHNPLNGSGKS---VLGSSEDEKTPSGTPDHSSSSPALLL 180 190 200 210 220 230 240 pF1KE0 TSSDSECDI . CCDS18 SPPPPGLPSLHSLGHPPGPSAVPVPVPGGGGADPLQHHHGLQDSILNPMSANLVDLGS 240 250 260 270 280 290 >>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa) initn: 937 init1: 784 opt: 933 Z-score: 908.0 bits: 175.7 E(32554): 3e-44 Smith-Waterman score: 933; 68.6% identity (89.0% similar) in 191 aa overlap (1-191:1-187) 10 20 30 40 50 60 pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV : .:: ..:. .::: :::.:...:..::::::::::: ::. :.::::::.:.:.: CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLP----ACDHLHKNESVLKAKAVV 10 20 30 40 50 70 80 90 100 110 120 pF1KE0 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP ::: ::.::::.:::.:.:. ..: ::: :::.::: ::::::::::: : :::::.::: CCDS97 AFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLRGRPLGAVGKYRVRRKFP 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE0 LPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR :::::::::. ..::::..:..::::: ..:::.: .:::::.::::: :::.::::::: CCDS97 LPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE0 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS :::::: ::.: CCDS97 QRDRAAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQG 180 190 200 210 220 230 >>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa) initn: 769 init1: 635 opt: 774 Z-score: 750.8 bits: 148.0 E(32554): 1.7e-35 Smith-Waterman score: 774; 51.5% identity (73.8% similar) in 237 aa overlap (3-239:103-326) 10 20 30 pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGR : : : :::..:: :::.:...:...::.: CCDS97 AAAAAGAAADQVQLHSELLGRHHHAAAAAAQTP-LAFSPDHVACVCEALQQGGNLDRLAR 80 90 100 110 120 130 40 50 60 70 80 90 pF1KE0 FLWSLPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWL :::::: . : :::.:.:::.:::: : : ::: :::.:.: . .: :: :: CCDS97 FLWSLP----QSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWY 140 150 160 170 180 100 110 120 130 140 150 pF1KE0 EAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRNLLREWYLQDPY .:.: :::. :::::: :::::.:.::::::::::::. ..::::..:: :.: : :. : CCDS97 KARYTEAERARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRY 190 200 210 220 230 240 160 170 180 190 200 210 pF1KE0 PNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGT :.:..::.::. :::. :::.::::::::::: . . :.. :.:. . . : CCDS97 PSPAEKRHLAKITGLSLTQVSNWFKNRRQRDRNPS---ETQSKSESDGNPSTEDESSKGH 250 260 270 280 290 300 220 230 240 pF1KE0 PEVLGVATSPAASLSSKAATSAISITSSDSECDI .. :: ::. . . .:..: CCDS97 EDL-----SPHPLSSSSDGITNLSLSSHMEPVYMQQIGNAKISLSSSGVLLNGSLVPAST 310 320 330 340 350 >>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa) initn: 672 init1: 563 opt: 691 Z-score: 671.5 bits: 133.3 E(32554): 4.4e-31 Smith-Waterman score: 695; 51.7% identity (72.4% similar) in 232 aa overlap (7-231:84-299) 10 20 30 pF1KE0 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWS : :::.::: :::.: ..: . ::.::: . CCDS12 AGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSRFLGA 60 70 80 90 100 110 40 50 60 70 80 90 pF1KE0 LPVAPAACEALNKNESVLRARAIVAFHGGNYRELYHILENHKFTKESHAKLQALWLEAHY :: :: : : .. ::::::.:::. :.: :::..::.. : :: :: :.:.:.: CCDS12 LP--PA--ERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY 120 130 140 150 160 100 110 120 130 140 150 pF1KE0 QEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRNLLREWYLQDPYPNPS .:::. ::: :: :::::.:::::::.::::::. ..:::::.: :. : . ::.:. CCDS12 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD 170 180 190 200 210 220 160 170 180 190 200 210 pF1KE0 KKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVL .::.:: :::. :::.:::::::::::..: :.: ..:.::.: . CCDS12 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGA------------GGGAPCKSESDGNPTTE 230 240 250 260 270 220 230 240 pF1KE0 GVAT-SP------AASLSSKAATSAISITSSDSECDI .. :: :: .:..:: CCDS12 DESSRSPEDLERGAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVL 280 290 300 310 320 330 246 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 06:34:55 2016 done: Sun Nov 6 06:34:56 2016 Total Scan time: 2.200 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]