FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2507, 440 aa
1>>>pF1KE2507 440 - 440 aa - 440 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.3925+/-0.000899; mu= 8.0397+/- 0.054
mean_var=116.2457+/-23.403, 0's: 0 Z-trim(109.5): 9 B-trim: 0 in 0/51
Lambda= 0.118956
statistics sampled from 10930 (10936) to 10930 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.697), E-opt: 0.2 (0.336), width: 16
Scan time: 2.910
The best scores are: opt bits E(32554)
CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 ( 440) 2934 514.4 9e-146
CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 ( 429) 2848 499.6 2.4e-141
CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 ( 445) 2417 425.7 4.6e-119
CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 ( 985) 2409 424.4 2.4e-118
CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 ( 533) 482 93.6 5e-19
CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 ( 328) 318 65.4 9.7e-11
>>CCDS3348.1 CTBP1 gene_id:1487|Hs108|chr4 (440 aa)
initn: 2934 init1: 2934 opt: 2934 Z-score: 2730.6 bits: 514.4 E(32554): 9e-146
Smith-Waterman score: 2934; 100.0% identity (100.0% similar) in 440 aa overlap (1-440:1-440)
10 20 30 40 50 60
pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA
370 380 390 400 410 420
430 440
pF1KE2 PSPGQTVKPEADRDHASDQL
::::::::::::::::::::
CCDS33 PSPGQTVKPEADRDHASDQL
430 440
>>CCDS43203.1 CTBP1 gene_id:1487|Hs108|chr4 (429 aa)
initn: 2848 init1: 2848 opt: 2848 Z-score: 2651.0 bits: 499.6 E(32554): 2.4e-141
Smith-Waterman score: 2848; 100.0% identity (100.0% similar) in 427 aa overlap (14-440:3-429)
10 20 30 40 50 60
pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
:::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 MSGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQSTQ
10 20 30 40
70 80 90 100 110 120
pF1KE2 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLGIAVCNV
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE2 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 PAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGII
110 120 130 140 150 160
190 200 210 220 230 240
pF1KE2 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 GLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLN
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE2 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 EHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFS
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE2 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 QGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKDHLTAAT
290 300 310 320 330 340
370 380 390 400 410 420
pF1KE2 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 HWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHA
350 360 370 380 390 400
430 440
pF1KE2 PSPGQTVKPEADRDHASDQL
::::::::::::::::::::
CCDS43 PSPGQTVKPEADRDHASDQL
410 420
>>CCDS7643.1 CTBP2 gene_id:1488|Hs108|chr10 (445 aa)
initn: 2405 init1: 2382 opt: 2417 Z-score: 2251.0 bits: 425.7 E(32554): 4.6e-119
Smith-Waterman score: 2417; 81.0% identity (95.5% similar) in 426 aa overlap (14-439:20-445)
10 20 30 40 50
pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFC
:.:: :::::::::::::::::::::::::::::.::::::
CCDS76 MALVDKHKVKRQRLDRICEGIRPQIMNGPLHPRPLVALLDGRDCTVEMPILKDLATVAFC
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 DAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDNIDIKSAGDLG
:::::::::::::::::::.:::::::::::::::::::.:::::::.::.:::.::.::
CCDS76 DAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDNVDIKAAGELG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 IAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRG
:::::.:.:.::::::::.::::::::: :::.:::::::::::::::::::::::::::
CCDS76 IAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIREVASGAARIRG
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 ETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVT
::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: ::::::..::::.
CCDS76 ETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQDLLYQSDCVS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 LHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHES
:::.:::::::::::::.:::::::::::.::::::::::::::::::::::::::::::
CCDS76 LHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRIRGAALDVHES
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE2 EPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIPDSLKNCVNKD
:::::.:::::::::::::::.::::::::.:::: :: :::::::::::.::.:::::.
CCDS76 EPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIPESLRNCVNKE
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE2 HLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPV
..... :. .: ..:::::::.::::::.::::: :.:::.:::.:... ..:.:: :
CCDS76 FFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGGIPVTHNLPTV
370 380 390 400 410 420
420 430 440
pF1KE2 AHPPHAPSPGQTVKPEADRDHASDQL
::: .::::.: .: .:.: ..:
CCDS76 AHPSQAPSPNQPTKHGDNREHPNEQ
430 440
>>CCDS7644.1 CTBP2 gene_id:1488|Hs108|chr10 (985 aa)
initn: 2412 init1: 2382 opt: 2409 Z-score: 2238.1 bits: 424.4 E(32554): 2.4e-118
Smith-Waterman score: 2409; 80.9% identity (95.5% similar) in 425 aa overlap (15-439:561-985)
10 20 30 40
pF1KE2 MGSSHLLNKGLPLGVRPPIMNGPLHPRPLVALLDGRDCTVEMPI
.:: ::::::::::::::::::::::::::
CCDS76 LHTPHSPYQKVARRTGAPIIVSTMLAPEPSIRPQIMNGPLHPRPLVALLDGRDCTVEMPI
540 550 560 570 580 590
50 60 70 80 90 100
pF1KE2 LKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIVRIGSGFDN
:::.:::::::::::::::::::::::::.:::::::::::::::::::.:::::::.::
CCDS76 LKDLATVAFCDAQSTQEIHEKVLNEAVGAMMYHTITLTREDLEKFKALRVIVRIGSGYDN
600 610 620 630 640 650
110 120 130 140 150 160
pF1KE2 IDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRVQSVEQIRE
.:::.::.:::::::.:.:.::::::::.::::::::: :::.:::::::::::::::::
CCDS76 VDIKAAGELGIAVCNIPSAAVEETADSTICHILNLYRRNTWLYQALREGTRVQSVEQIRE
660 670 680 690 700 710
170 180 190 200 210 220
pF1KE2 VASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQ
::::::::::::::.::.::.:::::.:::::::.:.::::::.::.::.::.::: :::
CCDS76 VASGAARIRGETLGLIGFGRTGQAVAVRAKAFGFSVIFYDPYLQDGIERSLGVQRVYTLQ
720 730 740 750 760 770
230 240 250 260 270 280
pF1KE2 DLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRI
:::..::::.:::.:::::::::::::.:::::::::::.::::::::::::::::::::
CCDS76 DLLYQSDCVSLHCNLNEHNHHLINDFTIKQMRQGAFLVNAARGGLVDEKALAQALKEGRI
780 790 800 810 820 830
290 300 310 320 330 340
pF1KE2 RGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIRRAITGRIP
:::::::::::::::.:::::::::::::::.::::::::.:::: :: :::::::::::
CCDS76 RGAALDVHESEPFSFAQGPLKDAPNLICTPHTAWYSEQASLEMREAAATEIRRAITGRIP
840 850 860 870 880 890
350 360 370 380 390 400
pF1KE2 DSLKNCVNKDHLTAATHWASMDPAVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSA
.::.:::::. ..... :. .: ..:::::::.::::::.::::: :.:::.:::.:..
CCDS76 ESLRNCVNKEFFVTSAPWSVIDQQAIHPELNGATYRYPPGIVGVAPGGLPAAMEGIIPGG
900 910 920 930 940 950
410 420 430 440
pF1KE2 MSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL
. ..:.:: :::: .::::.: .: .:.: ..:
CCDS76 IPVTHNLPTVAHPSQAPSPNQPTKHGDNREHPNEQ
960 970 980
>>CCDS904.1 PHGDH gene_id:26227|Hs108|chr1 (533 aa)
initn: 302 init1: 169 opt: 482 Z-score: 455.1 bits: 93.6 E(32554): 5e-19
Smith-Waterman score: 482; 31.5% identity (58.2% similar) in 330 aa overlap (67-392:45-360)
40 50 60 70 80 90
pF1KE2 DCTVEMPILKDVATVAFCDAQSTQEIHEKVLNEAVGALMYHTITLTREDLEKFKALRIIV
:.. : .. . .: . .. . :...
CCDS90 LDPCCRKILQDGGLQVVEKQNLSKEELIAELQDCEGLIVRSATKVTADVINAAEKLQVVG
20 30 40 50 60 70
100 110 120 130 140 150
pF1KE2 RIGSGFDNIDIKSAGDLGIAVCNVPAASVEETADSTLCHILNLYRRATWLHQALREGTRV
: :.: ::.:...: :: : :.: .. .:. : :. : :. ....:
CCDS90 RAGTGVDNVDLEAATRKGILVMNTPNGNSLSAAELTCGMIMCLARQIPQATASMKDG---
80 90 100 110 120 130
160 170 180 190 200 210
pF1KE2 QSVEQIREVASGAARIRGETLGIIGLGRVGQAVALRAKAFGFNVLFYDPYLSDGVERALG
. :. . ... .. :.::::.::::.:. :: : ..::.... ::: .: : ..:
CCDS90 -KWERKKFMGT---ELNGKTLGILGLGRIGREVATRMQSFGMKTIGYDPIISPEVSASFG
140 150 160 170 180
220 230 240 250 260 270
pF1KE2 LQRVSTLQDLLFHSDCVTLHCGLNEHNHHLINDFTVKQMRQGAFLVNTARGGLVDEKALA
.:.. :... : .:.: : . :.:: : : ..:. .:: ::::.::: ::
CCDS90 VQQLP-LEEIWPLCDFITVHTPLLPSTTGLLNDNTFAQCKKGVRVVNCARGGIVDEGALL
190 200 210 220 230 240
280 290 300 310 320 330
pF1KE2 QALKEGRIRGAALDVHESEPFSFSQGPLKDAPNLICTPHAAWYSEQASIEMREEAAREIR
.::. :. :::::: :: . : : :.: :: . ...:. . :: : ..
CCDS90 RALQSGQCAGAALDVFTEEPP--RDRALVDHENVISCPHLGASTKEAQSRCGEEIAVQFV
250 260 270 280 290 300
340 350 360 370 380 390
pF1KE2 RAITGRIPDSLKNCVNKDHLTAATHWASMDPAVVHPELNGAAYRY----PPGVVGVAPTG
. :. :: . :: . ::.: : . : :. .: : :.. : :
CCDS90 DMVKGK---SLTGVVNAQALTSAFS-PHTKPWIGLAEALGTLMRAWAGSPKGTIQVITQG
310 320 330 340 350 360
400 410 420 430 440
pF1KE2 IPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTVKPEADRDHASDQL
CCDS90 TSLKNAGNCLSPAVIVGLLKEASKQADVNLVNAKLLVKEAGLNVTTSHSPAAPGEQGFGE
370 380 390 400 410 420
>>CCDS6609.1 GRHPR gene_id:9380|Hs108|chr9 (328 aa)
initn: 346 init1: 246 opt: 318 Z-score: 306.3 bits: 65.4 E(32554): 9.7e-11
Smith-Waterman score: 318; 27.7% identity (55.3% similar) in 311 aa overlap (48-348:23-327)
20 30 40 50 60 70
pF1KE2 PIMNGPLHPRPLVALLDGRDCTVEMPILKDVATVAFCDAQ---STQEIHEKVLNEAV---
.: .: :... : . : : :...:
CCDS66 MRPVRLMKVFVTRRIPAEGRVALARAADCEVEQWDSDEPIPAKELERGVAGA
10 20 30 40 50
80 90 100 110 120
pF1KE2 -GALMYHTITLTREDLEKFKA-LRIIVRIGSGFDNIDIKSAGDLGIAVCNVPAASVEETA
: : . . .. :. : :..: .. :.:.. . :: : .: . .. ::
CCDS66 HGLLCLLSDHVDKRILDAAGANLKVISTMSVGIDHLALDEIKKRGIRVGYTPDVLTDTTA
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 DSTLCHILNLYRRATWLHQALREGTRVQSVEQIREVASGAARIRGETLGIIGLGRVGQAV
. .. .:. :: . ...: . : . . . : . :.:::::::.:::.
CCDS66 ELAVSLLLTTCRRLPEAIEEVKNGGWT-SWKPLWLCGYG---LTQSTVGIIGLGRIGQAI
120 130 140 150 160
190 200 210 220 230 240
pF1KE2 ALRAKAFGFNVLFYDPYLSDGVERALGLQRVSTLQDLLFHSDCVTLHCGLNEHNHHLIN-
: : : :: . ..: : : . . .: .:: ... :.:. .. : :
CCDS66 ARRLKPFGVQRFLYTGRQPRPEEAAEFQAEFVSTPELAAQSDFIVVACSLTPATEGLCNK
170 180 190 200 210 220
250 260 270 280 290 300
pF1KE2 DFTVKQMRQGAFLVNTARGGLVDEKALAQALKEGRIRGAALDVHESEPFSFSQGPLKDAP
:: ..:.. : ..: .:: .:.. : ::: :.: .:.::: ::. .. ::
CCDS66 DF-FQKMKETAVFINISRGDVVNQDDLYQALASGKIAAAGLDVTSPEPLP-TNHPLLTLK
230 240 250 260 270 280
310 320 330 340 350 360
pF1KE2 NLICTPHAAWYSEQASIEMREEAAREIRRAITGR-IPDSLKNCVNKDHLTAATHWASMDP
: . :: . .... : :: .. .. :. .:. ::
CCDS66 NCVILPHIGSATHRTRNTMSLLAANNLLAGLRGEPMPSELKL
290 300 310 320
370 380 390 400 410 420
pF1KE2 AVVHPELNGAAYRYPPGVVGVAPTGIPAAVEGIVPSAMSLSHGLPPVAHPPHAPSPGQTV
440 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 02:43:27 2016 done: Tue Nov 8 02:43:27 2016
Total Scan time: 2.910 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]