FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2507, 440 aa 1>>>pF1KE2507 440 - 440 aa - 440 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3925+/-0.000899; mu= 8.0397+/- 0.054 mean_var=116.2457+/-23.403, 0's: 0 Z-trim(109.5): 9 B-trim: 0 in 0/51 Lambda= 0.118956 statistics sampled from 10930 (10936) to 10930 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.697), E-opt: 0.2 (0.336), width: 16 Scan time: 2.910 The best scores are: opt bits E(32554) CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 2934 514.4 9e-146 CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 2848 499.6 2.4e-141 CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 2417 425.7 4.6e-119 CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 2409 424.4 2.4e-118 CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 482 93.6 5e-19 CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 318 65.4 9.7e-11 >>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa) initn: 2934 init1: 2934 opt: 2934 Z-score: 2730.6 bits: 514.4 E(32554): 9e-146 Smith-Waterman score: 2934; 100.0% identity (100.0% similar) in 440 aa overlap (1-440:1-440) 10 20 30 40 50 60 pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA 370 380 390 400 410 420 430 440 pF1KE2 PSPGQTVKPEADRDHASDQL :::::::::::::::::::: CCDS33 PSPGQTVKPEADRDHASDQL 430 440 >>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa) initn: 2848 init1: 2848 opt: 2848 Z-score: 2651.0 bits: 499.6 E(32554): 2.4e-141 Smith-Waterman score: 2848; 100.0% identity (100.0% similar) in 427 aa overlap (14-440:3-429) 10 20 30 40 50 60 pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ ::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MSGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ 10 20 30 40 70 80 90 100 110 120 pF1KE2 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE2 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE2 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE2 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE2 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE2 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA 350 360 370 380 390 400 430 440 pF1KE2 PSPGQTVKPEADRDHASDQL :::::::::::::::::::: CCDS43 PSPGQTVKPEADRDHASDQL 410 420 >>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa) initn: 2405 init1: 2382 opt: 2417 Z-score: 2251.0 bits: 425.7 E(32554): 4.6e-119 Smith-Waterman score: 2417; 81.0% identity (95.5% similar) in 426 aa overlap (14-439:20-445) 10 20 30 40 50 pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC :.:: :::::::::::::::::::::::::::::.:::::: CCDS76 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG :::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.:: CCDS76 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG :::::.:.:.::::::::.::::::::: :::.::::::::::::::::::::::::::: CCDS76 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT ::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::. CCDS76 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES :::.:::::::::::::.:::::::::::.:::::::::::::::::::::::::::::: CCDS76 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE2 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD :::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::. CCDS76 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE2 HLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPV ..... :. .: ..:::::::.::::::.::::: :.:::.:::.:... ..:.:: : CCDS76 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV 370 380 390 400 410 420 420 430 440 pF1KE2 AHPPHAPSPGQTVKPEADRDHASDQL ::: .::::.: .: .:.: ..: CCDS76 AHPSQAPSPNQPTKHGDNREHPNEQ 430 440 >>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa) initn: 2412 init1: 2382 opt: 2409 Z-score: 2238.1 bits: 424.4 E(32554): 2.4e-118 Smith-Waterman score: 2409; 80.9% identity (95.5% similar) in 425 aa overlap (15-439:561-985) 10 20 30 40 pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPI .:: :::::::::::::::::::::::::: CCDS76 LHTPHSPYQKVARRTGAPIIVSTMLAPEPSIRPQIMNGPLHPRPLVALLDGRDCTVEMPI 540 550 560 570 580 590 50 60 70 80 90 100 pF1KE2 LKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDN :::.:::::::::::::::::::::::::.:::::::::::::::::::.:::::::.:: CCDS76 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN 600 610 620 630 640 650 110 120 130 140 150 160 pF1KE2 IDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIRE .:::.::.:::::::.:.:.::::::::.::::::::: :::.::::::::::::::::: CCDS76 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE 660 670 680 690 700 710 170 180 190 200 210 220 pF1KE2 VASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQ ::::::::::::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::: CCDS76 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ 720 730 740 750 760 770 230 240 250 260 270 280 pF1KE2 DLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRI :::..::::.:::.:::::::::::::.:::::::::::.:::::::::::::::::::: CCDS76 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI 780 790 800 810 820 830 290 300 310 320 330 340 pF1KE2 RGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIP :::::::::::::::.:::::::::::::::.::::::::.:::: :: ::::::::::: CCDS76 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP 840 850 860 870 880 890 350 360 370 380 390 400 pF1KE2 DSLKNCVNKDHLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSA .::.:::::. ..... :. .: ..:::::::.::::::.::::: :.:::.:::.:.. CCDS76 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGG 900 910 920 930 940 950 410 420 430 440 pF1KE2 MSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL . ..:.:: :::: .::::.: .: .:.: ..: CCDS76 IPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ 960 970 980 >>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa) initn: 302 init1: 169 opt: 482 Z-score: 455.1 bits: 93.6 E(32554): 5e-19 Smith-Waterman score: 482; 31.5% identity (58.2% similar) in 330 aa overlap (67-392:45-360) 40 50 60 70 80 90 pF1KE2 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV :.. : .. . .: . .. . :... CCDS90 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG 20 30 40 50 60 70 100 110 120 130 140 150 pF1KE2 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV : :.: ::.:...: :: : :.: .. .:. : :. : :. ....: CCDS90 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG--- 80 90 100 110 120 130 160 170 180 190 200 210 pF1KE2 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG . :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..: CCDS90 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG 140 150 160 170 180 220 230 240 250 260 270 pF1KE2 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA .:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: :: CCDS90 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL 190 200 210 220 230 240 280 290 300 310 320 330 pF1KE2 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR .::. :. :::::: :: . : : :.: :: . ...:. . :: : .. CCDS90 RALQSGQCAGAALDVFTEEPP--RDRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV 250 260 270 280 290 300 340 350 360 370 380 390 pF1KE2 RAITGRIPDSLKNCVNKDHLTAATHWASMDPAVVHPELNGAAYRY----PPGVVGVAPTG . :. :: . :: . ::.: : . : :. .: : :.. : : CCDS90 DMVKGK---SLTGVVNAQALTSAFS-PHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG 310 320 330 340 350 360 400 410 420 430 440 pF1KE2 IPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL CCDS90 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE 370 380 390 400 410 420 >>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa) initn: 346 init1: 246 opt: 318 Z-score: 306.3 bits: 65.4 E(32554): 9.7e-11 Smith-Waterman score: 318; 27.7% identity (55.3% similar) in 311 aa overlap (48-348:23-327) 20 30 40 50 60 70 pF1KE2 PIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQ---STQEIHEKVLNEAV--- .: .: :... : . : : :...: CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGVAGA 10 20 30 40 50 80 90 100 110 120 pF1KE2 -GALMYHTITLTREDLEKFKA-LRIIVRIGSGFDNIDIKSAGDLGIAVCNVPAASVEETA : : . . .. :. : :..: .. :.:.. . :: : .: . .. :: CCDS66 HGLLCLLSDHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTTA 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 DSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGIIGLGRVGQAV . .. .:. :: . ...: . : . . . : . :.:::::::.:::. CCDS66 ELAVSLLLTTCRRLPEAIEEVKNGGWT-SWKPLWLCGYG---LTQSTVGIIGLGRIGQAI 120 130 140 150 160 190 200 210 220 230 240 pF1KE2 ALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLNEHNHHLIN- : : : :: . ..: : : . . .: .:: ... :.:. .. : : CCDS66 ARRLKPFGVQRFLYTGRQPRPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLCNK 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE2 DFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFSQGPLKDAP :: ..:.. : ..: .:: .:.. : ::: :.: .:.::: ::. .. :: CCDS66 DF-FQKMKETAVFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLP-TNHPLLTLK 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE2 NLICTPHAAWYSEQASIEMREEAAREIRRAITGR-IPDSLKNCVNKDHLTAATHWASMDP : . :: . .... : :: .. .. :. .:. :: CCDS66 NCVILPHIGSATHRTRNTMSLLAANNLLAGLRGEPMPSELKL 290 300 310 320 370 380 390 400 410 420 pF1KE2 AVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTV 440 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 02:43:27 2016 done: Tue Nov 8 02:43:27 2016 Total Scan time: 2.910 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]