FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB8933, 284 aa 1>>>pF1KB8933 284 - 284 aa - 284 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9633+/-0.000805; mu= 14.2179+/- 0.049 mean_var=143.7370+/-30.681, 0's: 0 Z-trim(111.7): 75 B-trim: 0 in 0/51 Lambda= 0.106977 statistics sampled from 12551 (12626) to 12551 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.759), E-opt: 0.2 (0.388), width: 16 Scan time: 2.700 The best scores are: opt bits E(32554) CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 ( 284) 1924 308.0 4.9e-84 CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 ( 291) 1442 233.7 1.2e-61 CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 ( 332) 934 155.3 5.3e-38 CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 ( 246) 920 153.0 2e-37 CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 ( 781) 905 151.3 2e-36 CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 ( 739) 720 122.7 7.8e-28 >>CCDS9748.1 SIX1 gene_id:6495|Hs108|chr14 (284 aa) initn: 1924 init1: 1924 opt: 1924 Z-score: 1622.2 bits: 308.0 E(32554): 4.9e-84 Smith-Waterman score: 1924; 99.6% identity (99.6% similar) in 284 aa overlap (1-284:1-284) 10 20 30 40 50 60 pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLCGRPLGAVGKYRVRRKFPLPRT :::::::::::::::::::::::::::::::::::::: ::::::::::::::::::::: CCDS97 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLRGRPLGAVGKYRVRRKFPLPRT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB8 AAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQGNMGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS97 AAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQGNMGH 190 200 210 220 230 240 250 260 270 280 pF1KB8 ARSSNYSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS :::::::::::::::::::::::::::::::::::::::::::: CCDS97 ARSSNYSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS 250 260 270 280 >>CCDS1822.1 SIX2 gene_id:10736|Hs108|chr2 (291 aa) initn: 1389 init1: 1299 opt: 1442 Z-score: 1220.1 bits: 233.7 E(32554): 1.2e-61 Smith-Waterman score: 1445; 74.3% identity (86.7% similar) in 300 aa overlap (1-284:1-291) 10 20 30 40 50 60 pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLPACDHLHKNESVLKAKAVVAFHR :::::.::::::::::::::::::::.:::::::::::::.::::::::::::::::::: CCDS18 MSMLPTFGFTQEQVACVCEVLQQGGNIERLGRFLWSLPACEHLHKNESVLKAKAVVAFHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB8 GNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLCGRPLGAVGKYRVRRKFPLPRT :::::::::::::::::::: :::::::::::.::::: ::::::::::::::::::::. CCDS18 GNFRELYKILESHQFSPHNHAKLQQLWLKAHYIEAEKLRGRPLGAVGKYRVRRKFPLPRS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB8 IWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR ::::::::::::::::.::::::::::::::::::::::::::::::::::::::::::: CCDS18 IWDGEETSYCFKEKSRSVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRRQRDR 130 140 150 160 170 180 190 200 210 220 230 pF1KB8 AAEAKERENTENNNSSSNKQNQLSPLEG-GKPLMSSSEEEFSPPQSPDQNS---VLLLQG :::::::::.::.::.:. .::.: :: ...:::.: .: .::..: .:::. CCDS18 AAEAKERENNENSNSNSH-----NPLNGSGKSVLGSSEDEKTPSGTPDHSSSSPALLLSP 190 200 210 220 230 240 250 260 270 280 pF1KB8 ---------NMGHARSSN---YSLPGLTASQPSHGLQTHQHQLQDSLLGPLTSSLVDLGS ..:: . . .:: ...: :: :.: ::::.:.:....:::::: CCDS18 PPPGLPSLHSLGHPPGPSAVPVPVPGGGGADP---LQ-HHHGLQDSILNPMSANLVDLGS 240 250 260 270 280 290 >>CCDS1821.1 SIX3 gene_id:6496|Hs108|chr2 (332 aa) initn: 926 init1: 763 opt: 934 Z-score: 795.7 bits: 155.3 E(32554): 5.3e-38 Smith-Waterman score: 934; 57.8% identity (79.1% similar) in 244 aa overlap (1-239:79-317) 10 20 30 pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERL : .::...:. :::: :::.:.. :..::: CCDS18 GGGNGAGGGGAGGAGGGGGGGSRAPPEELSMFQLPTLNFSPEQVASVCETLEETGDIERL 50 60 70 80 90 100 40 50 60 70 80 pF1KB8 GRFLWSLP----ACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQL :::::::: ::. ..:.::.:.:.:::::: ::::.::.:::.:.:. ..: ::: . CCDS18 GRFLWSLPVAPGACEAINKHESILRARAVVAFHTGNFRDLYHILENHKFTKESHGKLQAM 110 120 130 140 150 160 90 100 110 120 130 140 pF1KB8 WLKAHYVEAEKLCGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHN ::.::: ::::: ::::: : :::::.::::::::::::. ..::::..:..::::: .. CCDS18 WLEAHYQEAEKLRGRPLGPVDKYRVRKKFPLPRTIWDGEQKTHCFKERTRSLLREWYLQD 170 180 190 200 210 220 150 160 170 180 190 200 pF1KB8 PYPSPREKRELAEATGLTTTQVSNWFKNRRQRDRAAEAKERENTENNNSSSNKQNQLSPL :::.: .:::::.::::: :::.::::::::::::: ::.: . . . :. . : CCDS18 PYPNPSKKRELAQATGLTPTQVGNWFKNRRQRDRAAAAKNRLQHQAIGPSGMR----SLA 230 240 250 260 270 280 210 220 230 240 250 260 pF1KB8 EGGKPLMSSSEEEFSPPQSPDQN-SVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQH : : : .:.: : :: . : : ... : CCDS18 EPGCPTHGSAESP-STAASPTTSVSSLTERADTGTSILSVTSSDSECDV 290 300 310 320 330 270 280 pF1KB8 QLQDSLLGPLTSSLVDLGS >>CCDS9747.1 SIX6 gene_id:4990|Hs108|chr14 (246 aa) initn: 924 init1: 771 opt: 920 Z-score: 785.5 bits: 153.0 E(32554): 2e-37 Smith-Waterman score: 920; 68.1% identity (88.0% similar) in 191 aa overlap (1-187:1-191) 10 20 30 40 50 pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWSLP----ACDHLHKNESVLKAKAVV : .:: ..:. .::: :::.:...:..::::::::::: ::. :.::::::.:.:.: CCDS97 MFQLPILNFSPQQVAGVCETLEESGDVERLGRFLWSLPVAPAACEALNKNESVLRARAIV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB8 AFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAEKLCGRPLGAVGKYRVRRKFP ::: ::.::::.:::.:.:. ..: ::: :::.::: ::::: ::::: : :::::.::: CCDS97 AFHGGNYRELYHILENHKFTKESHAKLQALWLEAHYQEAEKLRGRPLGPVDKYRVRKKFP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB8 LPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRELAEATGLTTTQVSNWFKNRR :::::::::. ..::::..: .::::: ..:::.: .:::::.::::: :::.::::::: CCDS97 LPRTIWDGEQKTHCFKERTRHLLREWYLQDPYPNPSKKRELAQATGLTPTQVGNWFKNRR 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB8 QRDRAAEAKERENTENNNSSSNKQNQLSPLEGGKPLMSSSEEEFSPPQSPDQNSVLLLQG :::::: ::.: CCDS97 QRDRAAAAKNRLQQQVLSQGSGRALRAEGDGTPEVLGVATSPAASLSSKAATSAISITSS 190 200 210 220 230 240 >>CCDS9749.2 SIX4 gene_id:51804|Hs108|chr14 (781 aa) initn: 909 init1: 880 opt: 905 Z-score: 767.3 bits: 151.3 E(32554): 2e-36 Smith-Waterman score: 905; 59.3% identity (79.0% similar) in 243 aa overlap (7-244:106-342) 10 20 30 pF1KB8 MSMLPSFGFTQEQVACVCEVLQQGGNLERLGRFLWS ..:. ..::::::.:::::::.::.::::: CCDS97 AAGAAADQVQLHSELLGRHHHAAAAAAQTPLAFSPDHVACVCEALQQGGNLDRLARFLWS 80 90 100 110 120 130 40 50 60 70 80 90 pF1KB8 LPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHYVEAE :: : :. :::.:::.:.::::.: . :::.:::::.: ::: ::::: ::.:.::: CCDS97 LPQSDLLRGNESLLKARALVAFHQGIYPELYSILESHSFESANHPLLQQLWYKARYTEAE 140 150 160 170 180 190 100 110 120 130 140 150 pF1KB8 KLCGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPREKRE . ::::::: :::.:::::::::::::::: ::::::::..:.: : .: :::: :::. CCDS97 RARGRPLGAVDKYRLRRKFPLPRTIWDGEETVYCFKEKSRNALKELYKQNRYPSPAEKRH 200 210 220 230 240 250 160 170 180 190 200 210 pF1KB8 LAEATGLTTTQVSNWFKNRRQRDRA-AEAKERENTENNNS----SSNKQNQLSPLEGGKP ::. :::. ::::::::::::::: .:.. . ....: : ::. ...::: .: CCDS97 LAKITGLSLTQVSNWFKNRRQRDRNPSETQSKSESDGNPSTEDESSKGHEDLSP----HP 260 270 280 290 300 310 220 230 240 250 260 270 pF1KB8 LMSSSEEEFSPPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGLQTHQHQLQDSL : :::. . : .. : . : .:.:. : CCDS97 LSSSSDGITNLSLSSHMEPVYMQQ--IGNAKISLSSSGVLLNGSLVPASTSPVFLNGNSF 320 330 340 350 360 280 pF1KB8 LGPLTSSLVDLGS CCDS97 IQGPSGVILNGLNVGNTQAVALNPPKMSSNIVSNGISMTDILGSTSQDVKEFKVLQSSAN 370 380 390 400 410 420 >>CCDS12673.1 SIX5 gene_id:147912|Hs108|chr19 (739 aa) initn: 733 init1: 708 opt: 720 Z-score: 613.2 bits: 122.7 E(32554): 7.8e-28 Smith-Waterman score: 732; 48.4% identity (72.0% similar) in 254 aa overlap (5-244:80-333) 10 20 30 pF1KB8 MSMLPSFG--FTQEQVACVCEVLQQGGNLERLGR : : :. ::::::::.: :.:. ::.: CCDS12 AGAGAGAAAAGAEGPGSPGVPGSPPEAASEPPTGLRFSPEQVACVCEALLQAGHAGRLSR 50 60 70 80 90 100 40 50 60 70 80 90 pF1KB8 FLWSLPACDHLHKNESVLKAKAVVAFHRGNFRELYKILESHQFSPHNHPKLQQLWLKAHY :: .:: ..:. .. ::.:.:.:::.::.. :::..:::. : .: ::.:.:.:.: CCDS12 FLGALPPAERLRGSDPVLRARALVAFQRGEYAELYRLLESRPFPAAHHAFLQDLYLRARY 110 120 130 140 150 160 100 110 120 130 140 150 pF1KB8 VEAEKLCGRPLGAVGKYRVRRKFPLPRTIWDGEETSYCFKEKSRGVLREWYAHNPYPSPR :::. :: :::: :::.:.:::::.:::::::: :::::.::..:. : : ::.: CCDS12 HEAERARGRALGAVDKYRLRKKFPLPKTIWDGEETVYCFKERSRAALKACYRGNRYPTPD 170 180 190 200 210 220 160 170 180 190 200 pF1KB8 EKRELAEATGLTTTQVSNWFKNRRQRDR--AAEAKERENTENNNSSSNKQNQLSP--LE- :::.:: :::. ::::::::::::::: :. . .. ..: ... ... :: :: CCDS12 EKRRLATLTGLSLTQVSNWFKNRRQRDRTGAGGGAPCKSESDGNPTTEDESSRSPEDLER 230 240 250 260 270 280 210 220 230 240 250 260 pF1KB8 GGKPLMSSSEEEFS-------PPQSPDQNSVLLLQGNMGHARSSNYSLPGLTASQPSHGL :. :. . . . : :: .: .:..:.. : .: CCDS12 GAAPVSAEAAAQGSIFLAGTGPPAPCPASSSILVNGSFLAASGSPAVLLNGGPVIINGLA 290 300 310 320 330 340 270 280 pF1KB8 QTHQHQLQDSLLGPLTSSLVDLGS CCDS12 LGEASSLGPLLLTGGGGAPPPQPSPQGASETKTSLVLDPQTGEVRLEEAQSEAPETKGAQ 350 360 370 380 390 400 284 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 22:45:56 2016 done: Sat Nov 5 22:45:57 2016 Total Scan time: 2.700 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]