FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9628, 331 aa
1>>>pF1KB9628 331 - 331 aa - 331 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.3894+/-0.000754; mu= 8.5863+/- 0.046
mean_var=145.0325+/-29.956, 0's: 0 Z-trim(114.0): 45 B-trim: 621 in 1/55
Lambda= 0.106498
statistics sampled from 14563 (14608) to 14563 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.788), E-opt: 0.2 (0.449), width: 16
Scan time: 3.010
The best scores are: opt bits E(32554)
CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 ( 331) 2245 355.8 2.9e-98
CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 ( 356) 1102 180.2 2.2e-45
CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 ( 337) 827 137.9 1.1e-32
CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 ( 382) 653 111.2 1.4e-24
>>CCDS8886.1 NEUROD4 gene_id:58158|Hs108|chr12 (331 aa)
initn: 2245 init1: 2245 opt: 2245 Z-score: 1877.7 bits: 355.8 E(32554): 2.9e-98
Smith-Waterman score: 2245; 100.0% identity (100.0% similar) in 331 aa overlap (1-331:1-331)
10 20 30 40 50 60
pF1KB9 MSKTFVKSKEMGELVNTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 MSKTFVKSKEMGELVNTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 EEDGEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 EEDGEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 QKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 QKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 VLLEKHEDKSPICDSAISVHNFNYQSPGLPSPPYGHMETHLLHLKPQVFKSLGESSFGSH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 VLLEKHEDKSPICDSAISVHNFNYQSPGLPSPPYGHMETHLLHLKPQVFKSLGESSFGSH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 LPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSYSFMPHYPSSSLSSGHVHSTPFQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS88 LPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSYSFMPHYPSSSLSSGHVHSTPFQA
250 260 270 280 290 300
310 320 330
pF1KB9 GTPRYDVPIDMSYDSYPHHGIGTQLNTVFTE
:::::::::::::::::::::::::::::::
CCDS88 GTPRYDVPIDMSYDSYPHHGIGTQLNTVFTE
310 320 330
>>CCDS2283.1 NEUROD1 gene_id:4760|Hs108|chr2 (356 aa)
initn: 1210 init1: 714 opt: 1102 Z-score: 928.1 bits: 180.2 E(32554): 2.2e-45
Smith-Waterman score: 1208; 53.4% identity (77.4% similar) in 358 aa overlap (1-329:1-354)
10 20 30 40 50
pF1KB9 MSKTFVKSKEMGELV--NTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSI----
:.:.. .: ::: . ::: :. :.::.: .: ... : ... :.::.
CCDS22 MTKSYSESGLMGEPQPQGPPSWTDECLSSQDEEHEADKKEDD---LETMNAEEDSLRNGG
10 20 30 40 50
60 70 80 90 100
pF1KB9 -----------EEEEEEEEDGEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGL
:::::::.: .::::::::::::::::::::. ::.:::::::.:::::
CCDS22 EEEDEDEDLEEEEEEEEEDDDQKPKRRGPKKKKMTKARLERFKLRRMKANARERNRMHGL
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB9 NDALDNLRRVMPCYSKTQKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLS
: ::::::.:.::::::::::::::::::.::::::::.:..:..:. .::. ::::::
CCDS22 NAALDNLRKVVPCYSKTQKLSKIETLRLAKNYIWALSEILRSGKSPDLVSFVQTLCKGLS
120 130 140 150 160 170
170 180 190 200 210
pF1KB9 QPTSNLVAGCLQLGPQSVLLEKHEDKSPICDSA---ISVHNFNYQSPGLPSPPYGHMET-
:::.:::::::::.:.. : :...: : .: . :: ..:::::::::::: :..
CCDS22 QPTTNLVAGCLQLNPRTFLPEQNQDMPPHLPTASASFPVHPYSYQSPGLPSPPYGTMDSS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB9 HLLHLKP--QVFKSLGESSFGSHLPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSY
:..:.:: ..... : : : : ::..: ..:::.:::::.::::.:.. : ..::.:
CCDS22 HVFHVKPPPHAYSAALEPFFESPLTDCTSPSFDGPLSPPLSINGNFSFKHEPSAEFEKNY
240 250 260 270 280 290
280 290 300 310 320 330
pF1KB9 SFMPHYPSSSLSSGHVHSTPFQAGT--PRYDVPID--MSYDSYPHHG--IGTQLNTVFTE
.: :::...:.... :.. : .:: :: ..::: ::.::. :: ...:::..:
CCDS22 AFTMHYPAATLAGAQSHGSIF-SGTAAPRCEIPIDNIMSFDSHSHHERVMSAQLNAIFHD
300 310 320 330 340 350
>>CCDS5434.1 NEUROD6 gene_id:63974|Hs108|chr7 (337 aa)
initn: 737 init1: 737 opt: 827 Z-score: 700.1 bits: 137.9 E(32554): 1.1e-32
Smith-Waterman score: 827; 51.3% identity (72.3% similar) in 267 aa overlap (49-307:54-318)
20 30 40 50 60 70
pF1KB9 SWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHDSIEEEEEEEEDGEK--PKRRGPKKKK
:: .. ::::..::. :. :.::: .:::
CCDS54 ECEDQKQIKKPESFSKQIVLRGKSIKRAPGEETEKEEEEEDREEEDENGLPRRRGLRKKK
30 40 50 60 70 80
80 90 100 110 120 130
pF1KB9 MTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKTQKLSKIETLRLARNYI
:: :::: . :: .::::::.:::::::::::::.:.::::::::::::::::::.:::
CCDS54 TTKLRLERVKFRRQEANARERNRMHGLNDALDNLRKVVPCYSKTQKLSKIETLRLAKNYI
90 100 110 120 130 140
140 150 160 170 180 190
pF1KB9 WALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQSVLLEKHEDKSPICDSA
:::::.:. :. :. ::. :::::::::.:::::::::. .: :. . . . :
CCDS54 WALSEILRIGKRPDLLTFVQNLCKGLSQPTTNLVAGCLQLNARSFLMGQGGEAAHHTRSP
150 160 170 180 190 200
200 210 220 230 240 250
pF1KB9 ISVHNFNYQSPGLPSPP-YGHMETHLLHLKPQVFKSLGESSFGSHLPDCSTPPYEGPLTP
:. :.:: : .:: .: ... .:: . : :: . : :.:..: .::::.:
CCDS54 YSTFYPPYHSPELTTPPGHGTLDNSK-SMKPYNYCSAYESFYESTSPECASPQFEGPLSP
210 220 230 240 250 260
260 270 280 290 300 310
pF1KB9 P-LSISGNFSLKQDGSPDLEKSYSFMPHY----PSSSLSSGHVHSTPFQAGTPRYDVPID
: .. .: :::::. . : :.:.. :: : . :..: . : .. : ::.
CCDS54 PPINYNGIFSLKQEETLDYGKNYNYGMHYCAVPPRGPLGQGAMFRLPTDSHFP-YDLHLR
270 280 290 300 310 320
320 330
pF1KB9 MSYDSYPHHGIGTQLNTVFTE
CCDS54 SQSLTMQDELNAVFHN
330
>>CCDS11338.1 NEUROD2 gene_id:4761|Hs108|chr17 (382 aa)
initn: 926 init1: 642 opt: 653 Z-score: 554.9 bits: 111.2 E(32554): 1.4e-24
Smith-Waterman score: 849; 48.4% identity (67.7% similar) in 316 aa overlap (39-329:65-380)
10 20 30 40 50 60
pF1KB9 KEMGELVNTPSWMDKGLGSQNEVKEEESRPGTYGMLSSLTEEHD-SIEEEEEEEED----
:: . :. . :: . . ::::::::.
CCDS11 DAPPPPPPAPGPGAPGPARAAKPVPLRGEEGTEATLAEVKEEGELGGEEEEEEEEEEGLD
40 50 60 70 80 90
70 80 90 100 110 120
pF1KB9 ---GEKPKRRGPKKKKMTKARLERFRARRVKANARERTRMHGLNDALDNLRRVMPCYSKT
::.::.:::::.::::::::: . :: :::::::.::: :: ::::::.:.::::::
CCDS11 EAEGERPKKRGPKKRKMTKARLERSKLRRQKANARERNRMHDLNAALDNLRKVVPCYSKT
100 110 120 130 140 150
130 140 150 160 170 180
pF1KB9 QKLSKIETLRLARNYIWALSEVLETGQTPEGKGFVEMLCKGLSQPTSNLVAGCLQLGPQS
::::::::::::.::::::::.:..:. :. ..:. :::::::::.:::::::::. ..
CCDS11 QKLSKIETLRLAKNYIWALSEILRSGKRPDLVSYVQTLCKGLSQPTTNLVAGCLQLNSRN
160 170 180 190 200 210
190 200 210 220
pF1KB9 VLLEKHEDKSPICDSA---ISVHNFNYQSPGLPSPP------YGHMETHLL--HLKPQVF
: :. : . .. ...: . : : . : .: : : ..
CCDS11 FLTEQGADGAGRFHGSGGPFAMHPYPYPCSRLAGAQCQAAGGLGGGAAHALRTHGYCAAY
220 230 240 250 260 270
230 240 250 260 270 280
pF1KB9 KSL-GESSFGSHLPDCSTPPYEGPLTPPLSISGNFSLKQDGSPDLEKSYSFMPHYPSSSL
..: . .. :. :: .. :::::.::: ..::::::::.::: :::: . :: .
CCDS11 ETLYAAAGGGGASPDYNSSEYEGPLSPPLCLNGNFSLKQDSSPDHEKSYHYSMHYSALPG
280 290 300 310 320 330
290 300 310 320 330
pF1KB9 SSGHVHSTPFQAGTPRYDVPID--MSYDSYPHHGIGT---QLNTVFTE
: :. : ... : : . .::: . :: : .::. :
CCDS11 SRPTGHGLVFGSSAVRGGVHSENLLSYDMHLHHDRGPMYEELNAFFHN
340 350 360 370 380
331 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 17:48:39 2016 done: Fri Nov 4 17:48:39 2016
Total Scan time: 3.010 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]