FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0120, 199 aa
1>>>pF1KSDA0120 199 - 199 aa - 199 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4700+/-0.000786; mu= 12.2069+/- 0.047
mean_var=66.2570+/-13.336, 0's: 0 Z-trim(107.8): 42 B-trim: 5 in 1/50
Lambda= 0.157564
statistics sampled from 9785 (9826) to 9785 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.693), E-opt: 0.2 (0.302), width: 16
Scan time: 1.900
The best scores are: opt bits E(32554)
CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1 ( 199) 1356 316.7 5.9e-87
CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1 ( 220) 1356 316.7 6.4e-87
CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3 ( 199) 1003 236.5 8.4e-63
CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11 ( 201) 919 217.4 4.7e-57
CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1 ( 288) 394 98.1 5.4e-21
CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1 ( 329) 394 98.1 6.1e-21
CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19 ( 309) 390 97.2 1.1e-20
CCDS12263.1 CNN1 gene_id:1264|Hs108|chr19 ( 297) 385 96.1 2.3e-20
CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19 ( 247) 371 92.9 1.8e-19
CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19 ( 270) 314 79.9 1.5e-15
>>CCDS1189.1 TAGLN2 gene_id:8407|Hs108|chr1 (199 aa)
initn: 1356 init1: 1356 opt: 1356 Z-score: 1674.7 bits: 316.7 E(32554): 5.9e-87
Smith-Waterman score: 1356; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:1-199)
10 20 30 40 50 60
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD VLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD NMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGT
130 140 150 160 170 180
190
pF1KSD NRGASQAGMTGYGMPRQIL
:::::::::::::::::::
CCDS11 NRGASQAGMTGYGMPRQIL
190
>>CCDS60314.1 TAGLN2 gene_id:8407|Hs108|chr1 (220 aa)
initn: 1356 init1: 1356 opt: 1356 Z-score: 1674.0 bits: 316.7 E(32554): 6.4e-87
Smith-Waterman score: 1356; 100.0% identity (100.0% similar) in 199 aa overlap (1-199:22-220)
10 20 30
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCR
:::::::::::::::::::::::::::::::::::::::
CCDS60 MSAFSLALALVSSPQPPPPIGMANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCR
10 20 30 40 50 60
40 50 60 70 80 90
pF1KSD KDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 KDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQA
70 80 90 100 110 120
100 110 120 130 140 150
pF1KSD AERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS60 AERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENP
130 140 150 160 170 180
160 170 180 190
pF1KSD RNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL
::::::::::::::::::::::::::::::::::::::::
CCDS60 RNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL
190 200 210 220
>>CCDS33816.1 TAGLN3 gene_id:29114|Hs108|chr3 (199 aa)
initn: 1019 init1: 1003 opt: 1003 Z-score: 1241.0 bits: 236.5 E(32554): 8.4e-63
Smith-Waterman score: 1003; 69.8% identity (89.4% similar) in 199 aa overlap (1-199:1-199)
10 20 30 40 50 60
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
::::::.::::::::.:::..::::::. :..:: :: .:. .: ::: .::.:: :::
CCDS33 MANRGPSYGLSREVQEKIEQKYDADLENKLVDWIILQCAEDIEHPPPGRAHFQKWLMDGT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD VLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGK
:::.:::.::: :: :. ::. : :::::::::::::.::: ::. ::::::::::::::
CCDS33 VLCKLINSLYPPGQEPIPKISESKMAFKQMEQISQFLKAAETYGVRTTDIFQTVDLWEGK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD NMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGT
.:: :::::: ::..::..::: . :.:.:: .:...: :.::..::..:.::::::::.
CCDS33 DMAAVQRTLMALGSVAVTKDDGCYRGEPSWFHRKAQQNRRGFSEEQLRQGQNVIGLQMGS
130 140 150 160 170 180
190
pF1KSD NRGASQAGMTGYGMPRQIL
:.::::::::::::::::.
CCDS33 NKGASQAGMTGYGMPRQIM
190
>>CCDS8381.1 TAGLN gene_id:6876|Hs108|chr11 (201 aa)
initn: 930 init1: 567 opt: 919 Z-score: 1137.7 bits: 217.4 E(32554): 4.7e-57
Smith-Waterman score: 919; 65.0% identity (87.5% similar) in 200 aa overlap (1-199:1-200)
10 20 30 40 50 60
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGT
:::.::.::.:::::.::::.:: .::. :..:: .:: :::::. :: .:: :::.:.
CCDS83 MANKGPSYGMSREVQSKIEKKYDEELEERLVEWIIVQCGPDVGRPDRGRLGFQVWLKNGV
10 20 30 40 50 60
70 80 90 100 110
pF1KSD VLCELINALYPEGQAPVKKIQAS-TMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEG
.: .:.:.:::.:. ::: . .:.::::::..:::.::: ::. ::.::::::.::
CCDS83 ILSKLVNSLYPDGSKPVKVPENPPSMVFKQMEQVAQFLKAAEDYGVIKTDMFQTVDLFEG
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD KNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMG
:.:: :::::: ::.:::...:: . :::::: ::..:. :.:...::::::.:::::::
CCDS83 KDMAAVQRTLMALGSLAVTKNDGHYRGDPNWFMKKAQEHKREFTESQLQEGKHVIGLQMG
130 140 150 160 170 180
180 190
pF1KSD TNRGASQAGMTGYGMPRQIL
.::::::::::::: ::::.
CCDS83 SNRGASQAGMTGYGRPRQIIS
190 200
>>CCDS65592.1 CNN3 gene_id:1266|Hs108|chr1 (288 aa)
initn: 539 init1: 174 opt: 394 Z-score: 490.3 bits: 98.1 E(32554): 5.4e-21
Smith-Waterman score: 394; 45.9% identity (73.0% similar) in 148 aa overlap (51-198:6-147)
30 40 50 60 70 80
pF1KSD QYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKI
::: :::: .:::::: : : . :::.
CCDS65 MSIGPNFQLGLKDGIILCELINKLQP---GSVKKV
10 20 30
90 100 110 120 130 140
pF1KSD QASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARD
. :.. . :.:.:..:..: . ::.. :::.. ::.:. ::. :: ::. :.:: :.
CCDS65 NESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLFENGNMTQVQTTLVALAGL--AKT
40 50 60 70 80 90
150 160 170 180 190
pF1KSD DGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL
: : . : .... : :....:. :..:::::::::. :::::::.:: :..
CCDS65 KG-FHTTIDIGVKYAEKQTRRFDEGKLKAGQSVIGLQMGTNKCASQAGMTAYGTRRHLYD
100 110 120 130 140
CCDS65 PKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRDIYDQKLTLQPVDNSTISLQMGTN
150 160 170 180 190 200
>>CCDS30775.1 CNN3 gene_id:1266|Hs108|chr1 (329 aa)
initn: 640 init1: 174 opt: 394 Z-score: 489.4 bits: 98.1 E(32554): 6.1e-21
Smith-Waterman score: 488; 44.4% identity (70.4% similar) in 196 aa overlap (3-198:5-188)
10 20 30 40 50
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWLKD
:.::.:::: ::..:: ..:: . :. : .:: ..: : ::: :::
CCDS30 MTHFNKGPSYGLSAEVKNKIASKYDHQAEEDLRNWIEEVTGMSIG-P-----NFQLGLKD
10 20 30 40 50
60 70 80 90 100 110
pF1KSD GTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDLWE
: .:::::: : : . :::.. :.. . :.:.:..:..: . ::.. :::.. ::.:
CCDS30 GIILCELINKLQP---GSVKKVNESSLNWPQLENIGNFIKAIQAYGMKPHDIFEANDLFE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD GKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQM
. ::. :: ::. :.::: . : : . : .... : :....:. :..::::::
CCDS30 NGNMTQVQTTLVALAGLA--KTKG-FHTTIDIGVKYAEKQTRRFDEGKLKAGQSVIGLQM
120 130 140 150 160
180 190
pF1KSD GTNRGASQAGMTGYGMPRQIL
:::. :::::::.:: :..
CCDS30 GTNKCASQAGMTAYGTRRHLYDPKMQTDKPFDQTTISLQMGTNKGASQAGMLAPGTRRDI
170 180 190 200 210 220
>>CCDS12053.1 CNN2 gene_id:1265|Hs108|chr19 (309 aa)
initn: 537 init1: 157 opt: 390 Z-score: 484.9 bits: 97.2 E(32554): 1.1e-20
Smith-Waterman score: 471; 43.4% identity (69.9% similar) in 196 aa overlap (3-198:7-190)
10 20 30 40 50
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWL
:.::.:::: ::.... ..:: . : : :: ..: : .::. :
CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-P-----DFQKGL
10 20 30 40 50
60 70 80 90 100 110
pF1KSD KDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDL
::::.:: :.: : : :..: ::. : . ..:.:..:.:..: ::.: .:.:.. ::
CCDS12 KDGTILCTLMNKLQP-GSVP--KINRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEANDL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD WEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGL
.:. ::. :: .:. :.: : . :: :: . : :... :::.: .. :. ::::
CCDS12 FESGNMTQVQVSLLALAGKA--KTKGLQSG-VDIGVKYSEKQERNFDDATMKAGQCVIGL
120 130 140 150 160
180 190
pF1KSD QMGTNRGASQAGMTGYGMPRQIL
:::::. :::.:::.:: :..
CCDS12 QMGTNKCASQSGMTAYGTRRHLYDPKNHILPPMDHSTISLQMGTNKCASQVGMTAPGTRR
170 180 190 200 210 220
>>CCDS12263.1 CNN1 gene_id:1264|Hs108|chr19 (297 aa)
initn: 597 init1: 166 opt: 385 Z-score: 479.1 bits: 96.1 E(32554): 2.3e-20
Smith-Waterman score: 494; 42.9% identity (70.9% similar) in 196 aa overlap (3-198:7-188)
10 20 30 40 50
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWL
::::::::: ::..:. ..:: . :: : .:: . .: .::.. :
CCDS12 MSSAHFNRGPAYGLSAEVKNKLAQKYDHQREQELREWIEGVTGRRIG------NNFMDGL
10 20 30 40 50
60 70 80 90 100 110
pF1KSD KDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDL
::: .:::.:: : : . ::::. ::. ..:.:.:..:..: .::.. :::.. ::
CCDS12 KDGIILCEFINKLQP---GSVKKINESTQNWHQLENIGNFIKAITKYGVKPHDIFEANDL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD WEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGL
.:. : . :: ::. :...: .. . . : : .... :.: ..:.::.:.:::
CCDS12 FENTNHTQVQSTLLALASMAKTKGNKVNVG-----VKYAEKQERKFEPGKLREGRNIIGL
120 130 140 150 160
180 190
pF1KSD QMGTNRGASQAGMTGYGMPRQIL
:::::. ::: :::.:: :..
CCDS12 QMGTNKFASQQGMTAYGTRRHLYDPKLGTDQPLDQATISLQMGTNKGASQAGMTAPGTKR
170 180 190 200 210 220
>>CCDS77238.1 CNN1 gene_id:1264|Hs108|chr19 (247 aa)
initn: 466 init1: 166 opt: 371 Z-score: 463.1 bits: 92.9 E(32554): 1.8e-19
Smith-Waterman score: 371; 43.4% identity (73.4% similar) in 143 aa overlap (56-198:4-138)
30 40 50 60 70 80
pF1KSD LEQILIQWITTQCRKDVGRPQPGRENFQNWLKDGTVLCELINALYPEGQAPVKKIQASTM
:::: .:::.:: : : . ::::. ::.
CCDS77 MDGLKDGIILCEFINKLQP---GSVKKINESTQ
10 20 30
90 100 110 120 130 140
pF1KSD AFKQMEQISQFLQAAERYGINTTDIFQTVDLWEGKNMACVQRTLMNLGGLAVARDDGLFS
..:.:.:..:..: .::.. :::.. ::.:. : . :: ::. :...: .. . .
CCDS77 NWHQLENIGNFIKAITKYGVKPHDIFEANDLFENTNHTQVQSTLLALASMAKTKGNKVNV
40 50 60 70 80 90
150 160 170 180 190
pF1KSD GDPNWFPKKSKENPRNFSDNQLQEGKNVIGLQMGTNRGASQAGMTGYGMPRQIL
: : .... :.: ..:.::.:.::::::::. ::: :::.:: :..
CCDS77 G-----VKYAEKQERKFEPGKLREGRNIIGLQMGTNKFASQQGMTAYGTRRHLYDPKLGT
100 110 120 130 140
CCDS77 DQPLDQATISLQMGTNKGASQAGMTAPGTKRQIFEPGLGMEHCDTLNVSLQMGSNKGASQ
150 160 170 180 190 200
>>CCDS12054.1 CNN2 gene_id:1265|Hs108|chr19 (270 aa)
initn: 469 init1: 153 opt: 314 Z-score: 392.5 bits: 79.9 E(32554): 1.5e-15
Smith-Waterman score: 395; 38.3% identity (66.3% similar) in 196 aa overlap (3-198:7-191)
10 20 30 40 50
pF1KSD MANRGPAYGLSREVQQKIEKQYDADLEQILIQWITTQCRKDVGRPQPGRENFQNWL
:.::.:::: ::.... ..:: . : : :: ..: : .::. :
CCDS12 MSSTQFNKGPSYGLSAEVKNRLLSKYDPQKEAELRTWIEGLTGLSIG-P-----DFQKGL
10 20 30 40 50
60 70 80 90 100 110
pF1KSD KDGTVLCELINALYPEGQAPVKKIQASTMAFKQMEQISQFLQAAERYGINTTDIFQTVDL
::::.:: :.: : : :..: ::. : . ..:.:..:.:..: ::.: .:.:.. ::
CCDS12 KDGTILCTLMNKLQP-GSVP--KINRSMQNWHQLENLSNFIKAMVSYGMNPVDLFEANDL
60 70 80 90 100 110
120 130 140 150 160 170
pF1KSD WEGKNMACVQRTLMNLGGLAVARDDGLFSGDPNWFPKKSKENPRNFSDNQLQEGKNVIGL
.:. ::. :: .:. :.: . . :: . .. .:.: .. ...:.:
CCDS12 FESGNMTQVQVSLLALAGKMGTNKCASQSGMTAYGTRRHLYDPKNHILPPMD--HSTISL
120 130 140 150 160
180 190
pF1KSD QMGTNRGASQAGMTGYGMPRQIL
:::::. :::.:::. : :.:
CCDS12 QMGTNKCASQVGMTAPGTRRHIYDTKLGTDKCDNSSMSLQMGYTQGANQSGQVFGLGRQI
170 180 190 200 210 220
199 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 00:05:34 2016 done: Thu Nov 3 00:05:34 2016
Total Scan time: 1.900 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]