FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9629, 337 aa
1>>>pF1KB9629 337 - 337 aa - 337 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.4999+/-0.000782; mu= 7.8451+/- 0.048
mean_var=152.1036+/-30.396, 0's: 0 Z-trim(113.6): 45 B-trim: 0 in 0/54
Lambda= 0.103993
statistics sampled from 14210 (14255) to 14210 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.78), E-opt: 0.2 (0.438), width: 16
Scan time: 2.190
The best scores are: opt bits E(32554)
CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 ( 337) 2301 356.3 2e-98
CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 ( 356) 1011 162.8 3.9e-40
CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 ( 331) 827 135.2 7.5e-32
CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 ( 382) 788 129.4 4.8e-30
>>CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 (337 aa)
initn: 2301 init1: 2301 opt: 2301 Z-score: 1880.4 bits: 356.3 E(32554): 2e-98
Smith-Waterman score: 2301; 100.0% identity (100.0% similar) in 337 aa overlap (1-337:1-337)
10 20 30 40 50 60
pF1KB9 MLTLPFDESVVMPESQMCRKFSRECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MLTLPFDESVVMPESQMCRKFSRECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 EEEDREEEDENGLPRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 EEEDREEEDENGLPRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 VPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 VPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGC
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 LQLNARSFLMGQGGEAAHHTRSPYSTFYPPYHSPELTTPPGHGTLDNSKSMKPYNYCSAY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 LQLNARSFLMGQGGEAAHHTRSPYSTFYPPYHSPELTTPPGHGTLDNSKSMKPYNYCSAY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 ESFYESTSPECASPQFEGPLSPPPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 ESFYESTSPECASPQFEGPLSPPPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPL
250 260 270 280 290 300
310 320 330
pF1KB9 GQGAMFRLPTDSHFPYDLHLRSQSLTMQDELNAVFHN
:::::::::::::::::::::::::::::::::::::
CCDS54 GQGAMFRLPTDSHFPYDLHLRSQSLTMQDELNAVFHN
310 320 330
>>CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 (356 aa)
initn: 941 init1: 724 opt: 1011 Z-score: 834.1 bits: 162.8 E(32554): 3.9e-40
Smith-Waterman score: 1053; 49.9% identity (71.9% similar) in 359 aa overlap (2-337:1-356)
10 20 30 40 50
pF1KB9 MLTLPFDESVVM--PESQMCRKFSREC----EDQKQIKKPESFSKQIVLRGKSIKRAPGE
.: ..:: .: :. : ... :: ..... : :. . . . :.. . :
CCDS22 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDDLETMNAEEDSLRNGGEE
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 ETEKE--EEEEDREEEDENGLPRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLND
: : : ::::..::::.. :.::: .::: :: :::: :.::..:::::::::::::
CCDS22 EDEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGLNA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 ALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQP
::::::::::::::::::::::::::::::::::::::: :: :::..:::.::::::::
CCDS22 ALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLSQP
120 130 140 150 160 170
180 190 200 210 220
pF1KB9 TTNLVAGCLQLNARSFLMGQGGEAAHHTRSPYSTF--YP-PYHSPELTTPPGHGTLDNSK
:::::::::::: :.:: :. . : . ..: .: :.:: : .:: .::.:.:.
CCDS22 TTNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPP-YGTMDSSH
180 190 200 210 220 230
230 240 250 260 270 280
pF1KB9 SMK----PYNYCSAYESFYESTSPECASPQFEGPLSPPPINYNGIFSLKQEETLDYGKNY
.. :. : .: : :.:: .:.::.:.:::::: .. :: ::.:.: . .. :::
CCDS22 VFHVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPP-LSINGNFSFKHEPSAEFEKNY
240 250 260 270 280 290
290 300 310 320 330
pF1KB9 NYGMHYCAVPPRGPLGQGAMF--------RLPTDSHFPYDLHLRSQSLTMQDELNAVFHN
. ::: :. : ..:..: ..: :. . .: : . . . :. .:::.::.
CCDS22 AFTMHYPAATLAGAQSHGSIFSGTAAPRCEIPIDNIMSFDSHSHHERV-MSAQLNAIFHD
300 310 320 330 340 350
>>CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 (331 aa)
initn: 737 init1: 737 opt: 827 Z-score: 685.4 bits: 135.2 E(32554): 7.5e-32
Smith-Waterman score: 827; 51.3% identity (72.3% similar) in 267 aa overlap (54-318:49-307)
30 40 50 60 70 80
pF1KB9 ECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEEEEEDREEEDENGLPRRRGLRKKK
:: .. ::::..::. :. :.::: .:::
CCDS88 SWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEEEEDGEK--PKRRGPKKKK
20 30 40 50 60 70
90 100 110 120 130 140
pF1KB9 TTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKVVPCYSKTQKLSKIETLRLAKNYI
:: :::: . :: .::::::.:::::::::::::.:.::::::::::::::::::.:::
CCDS88 MTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKTQKLSKIETLRLARNYI
80 90 100 110 120 130
150 160 170 180 190 200
pF1KB9 WALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGCLQLNARSFLMGQGGEAAHHTRSP
:::::.:. :. :. ::. :::::::::.:::::::::. .: :. . . . :
CCDS88 WALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQSVLLEKHEDKSPICDSA
140 150 160 170 180 190
210 220 230 240 250 260
pF1KB9 YSTFYPPYHSPELTTPPGHGTLDNSK-SMKPYNYCSAYESFYESTSPECASPQFEGPLSP
:. :.:: : .:: .: ... .:: . : :: . : :.:..: .::::.:
CCDS88 ISVHNFNYQSPGLPSPP-YGHMETHLLHLKPQVFKSLGESSFGSHLPDCSTPPYEGPLTP
200 210 220 230 240 250
270 280 290 300 310 320
pF1KB9 PPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPLGQGAMFRLPTDSHFP-YDLHLR
: .. .: :::::. . : :.:.. :: : . :..: . : .. : ::.
CCDS88 P-LSISGNFSLKQDGSPDLEKSYSFMPHY----PSSSLSSGHVHSTPFQAGTPRYDVPID
260 270 280 290 300 310
330
pF1KB9 SQSLTMQDELNAVFHN
CCDS88 MSYDSYPHHGIGTQLNTVFTE
320 330
>>CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 (382 aa)
initn: 1037 init1: 696 opt: 788 Z-score: 652.9 bits: 129.4 E(32554): 4.8e-30
Smith-Waterman score: 1014; 51.7% identity (72.1% similar) in 333 aa overlap (34-337:51-382)
10 20 30 40 50 60
pF1KB9 LPFDESVVMPESQMCRKFSRECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEEE--
: .: . :::. .: :...: :
CCDS11 WGDGEDDEPRSDKGDAPPPPPPAPGPGAPGPARAAKPVPLRGEEGTEATLAEVKEEGELG
30 40 50 60 70 80
70 80 90 100 110
pF1KB9 -EEDREEEDENGL-------PRRRGLRKKKTTKLRLERVKFRRQEANARERNRMHGLNDA
::..:::.:.:: :..:: .:.: :: :::: :.:::.:::::::::: :: :
CCDS11 GEEEEEEEEEEGLDEAEGERPKKRGPKKRKMTKARLERSKLRRQKANARERNRMHDLNAA
90 100 110 120 130 140
120 130 140 150 160 170
pF1KB9 LDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRIGKRPDLLTFVQNLCKGLSQPT
:::::::::::::::::::::::::::::::::::::: ::::::...::.:::::::::
CCDS11 LDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKRPDLVSYVQTLCKGLSQPT
150 160 170 180 190 200
180 190 200 210 220
pF1KB9 TNLVAGCLQLNARSFLMGQGGEAA---HHTRSPYSTFYPPYHSPELTTPPGH--GTLDN-
:::::::::::.:.:: ::...: : . .:.. :: .:. . : : .
CCDS11 TNLVAGCLQLNSRNFLTEQGADGAGRFHGSGGPFAMHPYPYPCSRLAGAQCQAAGGLGGG
210 220 230 240 250 260
230 240 250 260 270 280
pF1KB9 -SKSMKPYNYCSAYESFYEST-----SPECASPQFEGPLSPPPINYNGIFSLKQEETLDY
..... ..::.:::..: .. ::. : ..::::::: . :: :::::. . :.
CCDS11 AAHALRTHGYCAAYETLYAAAGGGGASPDYNSSEYEGPLSPP-LCLNGNFSLKQDSSPDH
270 280 290 300 310
290 300 310 320 330
pF1KB9 GKNYNYGMHYCAVPPRGPLGQGAMFR-------LPTDSHFPYDLHLRSQSLTMQDELNAV
:.:.:.::: :.: : :.: .: . ... . ::.::. . : .::::
CCDS11 EKSYHYSMHYSALPGSRPTGHGLVFGSSAVRGGVHSENLLSYDMHLHHDRGPMYEELNAF
320 330 340 350 360 370
pF1KB9 FHN
:::
CCDS11 FHN
380
337 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 17:49:13 2016 done: Fri Nov 4 17:49:14 2016
Total Scan time: 2.190 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]