FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1220, 241 aa
1>>>pF1KE1220 241 - 241 aa - 241 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.3803+/-0.000737; mu= 20.4060+/- 0.045
mean_var=73.6202+/-14.468, 0's: 0 Z-trim(109.6): 97 B-trim: 44 in 1/50
Lambda= 0.149477
statistics sampled from 10904 (11010) to 10904 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.724), E-opt: 0.2 (0.338), width: 16
Scan time: 2.350
The best scores are: opt bits E(32554)
CCDS8611.1 CLEC9A gene_id:283420|Hs108|chr12 ( 241) 1678 370.5 5.6e-103
CCDS44830.1 CLEC12B gene_id:387837|Hs108|chr12 ( 276) 350 84.2 9.8e-17
CCDS41753.1 CLEC7A gene_id:64581|Hs108|chr12 ( 247) 325 78.7 3.8e-15
CCDS8618.1 OLR1 gene_id:4973|Hs108|chr12 ( 273) 321 77.9 7.5e-15
CCDS8608.1 CLEC12A gene_id:160364|Hs108|chr12 ( 265) 315 76.6 1.8e-14
CCDS55803.1 CLEC12A gene_id:160364|Hs108|chr12 ( 275) 315 76.6 1.8e-14
CCDS8609.1 CLEC12A gene_id:160364|Hs108|chr12 ( 232) 306 74.6 6.3e-14
CCDS8614.1 CLEC7A gene_id:64581|Hs108|chr12 ( 168) 291 71.2 4.8e-13
CCDS8613.1 CLEC7A gene_id:64581|Hs108|chr12 ( 201) 291 71.3 5.4e-13
CCDS8610.1 CLEC12B gene_id:387837|Hs108|chr12 ( 232) 287 70.5 1.1e-12
CCDS8623.1 KLRK1 gene_id:22914|Hs108|chr12 ( 216) 278 68.5 4e-12
CCDS8612.1 CLEC1A gene_id:51267|Hs108|chr12 ( 280) 279 68.9 4e-12
CCDS41751.1 CLEC1B gene_id:51266|Hs108|chr12 ( 196) 269 66.5 1.4e-11
CCDS41752.1 CLEC1B gene_id:51266|Hs108|chr12 ( 229) 265 65.8 2.9e-11
CCDS8622.1 KLRD1 gene_id:3824|Hs108|chr12 ( 148) 262 64.9 3.4e-11
CCDS8621.1 KLRD1 gene_id:3824|Hs108|chr12 ( 179) 262 65.0 3.8e-11
CCDS73443.1 CLEC1A gene_id:51267|Hs108|chr12 ( 247) 262 65.2 4.7e-11
CCDS53743.1 KLRF2 gene_id:100431172|Hs108|chr12 ( 207) 258 64.2 7.6e-11
>>CCDS8611.1 CLEC9A gene_id:283420|Hs108|chr12 (241 aa)
initn: 1678 init1: 1678 opt: 1678 Z-score: 1962.3 bits: 370.5 E(32554): 5.6e-103
Smith-Waterman score: 1678; 100.0% identity (100.0% similar) in 241 aa overlap (1-241:1-241)
10 20 30 40 50 60
pF1KE1 MHEEEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 MHEEEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 VSTIAMQQQEKLIQQERALLNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 VSTIAMQQQEKLIQQERALLNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 RESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYDYWVGLSQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 RESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYDYWVGLSQD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 GHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS86 GHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSS
190 200 210 220 230 240
pF1KE1 V
:
CCDS86 V
>>CCDS44830.1 CLEC12B gene_id:387837|Hs108|chr12 (276 aa)
initn: 378 init1: 113 opt: 350 Z-score: 413.9 bits: 84.2 E(32554): 9.8e-17
Smith-Waterman score: 375; 33.0% identity (63.4% similar) in 224 aa overlap (34-236:50-267)
10 20 30 40 50
pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGV-----KL
::...:. : .:.. .: . ::
CCDS44 NNRDGNNLRKRGHPAPSPIWRHAALGLVTLCLMLLIGLV-TLGMMFLQISNDINSDSEKL
20 30 40 50 60 70
60 70 80 90 100
pF1KE1 LQVSTIAMQQQEKLIQQ---------ERALLNF---TEWKRSCALQMKYCQAFMQNSLSS
:.. .:::..: :: :. .:. . ::. . .: :: .. . .:
CCDS44 SQLQKTIQQQQDNLSQQLGNSNNLSMEEEFLKSQISSVLKRQEQMAIKLCQELIIH--TS
80 90 100 110 120 130
110 120 130 140 150 160
pF1KE1 AHNSSPCPNNWIQNRESCYY-VSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLR
: .:::. : ..:::: ... . : .:...:. ..:::..:.: :: ::. :
CCDS44 DHRCNPCPKMWQWYQNSCYYFTTNEEKTWANSRKDCIDKNSTLVKIDSLEEKDFLM-SQP
140 150 160 170 180 190
170 180 190 200 210 220
pF1KE1 KIKGSYDYWVGLSQDGHSGR-WLWQDGSSPSPGLLPAERSQSAN--QVCGYVKSNSLLSS
. :. .:.::: :. ::: :.:.::: :::.:. ... .. : . :.: ..... :
CCDS44 LLMFSF-FWLGLSWDS-SGRSWFWEDGSVPSPSLFSTKELDQINGSKGCAYFQKGNIYIS
200 210 220 230 240 250
230 240
pF1KE1 NCSTWKYFICEKYALRSSV
::. ..:::: :
CCDS44 RCSAEIFWICEKTAAPVKTEDLD
260 270
>>CCDS41753.1 CLEC7A gene_id:64581|Hs108|chr12 (247 aa)
initn: 308 init1: 171 opt: 325 Z-score: 385.3 bits: 78.7 E(32554): 3.8e-15
Smith-Waterman score: 325; 26.8% identity (59.4% similar) in 239 aa overlap (3-234:11-243)
10 20 30 40 50
pF1KE1 MHEEEIYTSLQWDSPAPDTYQKCLSSNKCSGACC--LVMVISCVFCMGLLTA
.:. ::.:..:: . ...:... :. :: ..:. .:.
CCDS41 MEYHPDLENLDEDGYTQLHFDSQSNTRIAVVSEKGSCAASPPWRLIAVILGILCLVILVI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE1 SIFLGVKLLQVSTIAMQQQEKLIQQERALLNFTEWKRSCALQMKYCQAFMQNSLSSAHNS
.. ::. . :. . . :. : : .. .: ... . . ... :
CCDS41 AVVLGTMAIWRSNSGSNTLENGYFLSRNKENHSQPTQS---SLEDSVTPTKAVKTTGVLS
70 80 90 100 110
120 130 140 150 160 170
pF1KE1 SPCPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGS
:::: ::: ..::: : . : :...: . ::.::.:.:..:. :: .......
CCDS41 SPCPPNWIIYEKSCYLFSMSLNSWDGSKRQCWQLGSNLLKIDSSNELGFI---VKQVSSQ
120 130 140 150 160 170
180 190 200 210 220
pF1KE1 YD--YWVGLSQDGHSGRWLWQDGSSPSPGLLPAERS---QSANQVCGYVKSNSLLSSNCS
: .:.:::. :::.:::. : .:. . . .. . : ... . . .. ::
CCDS41 PDNSFWIGLSRPQTEVPWLWEDGSTFSSNLFQIRTTATQENPSPNCVWIHVSVIYDQLCS
180 190 200 210 220 230
230 240
pF1KE1 TWKYFICEKYALRSSV
. .: ::::
CCDS41 VPSYSICEKKFSM
240
>>CCDS8618.1 OLR1 gene_id:4973|Hs108|chr12 (273 aa)
initn: 382 init1: 170 opt: 321 Z-score: 380.1 bits: 77.9 E(32554): 7.5e-15
Smith-Waterman score: 356; 29.7% identity (58.6% similar) in 239 aa overlap (34-239:36-272)
10 20 30 40 50 60
pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQVST
::. . :.:.::... . ::..: :::
CCDS86 LKIQTVKDQPDEKSNGKKAKGLQFLYSPWWCLAAATLGVLCLGLVVTIMVLGMQLSQVSD
10 20 30 40 50 60
70 80 90
pF1KE1 IAMQQQEKLIQQERALLN------------------FTEWKRSCA----------LQMKY
. :.: .: .:.. : . . : .. : .....
CCDS86 LLTQEQANLTHQKKKLEGQISARQQAEEASQESENELKEMIETLARKLNEKSKEQMELHH
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE1 CQAFMQNSLSSAHN-SSPCPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESK
. .:..:. . : :.:::..:: . :.:: : :. :::.::. . ::.:.:
CCDS86 QNLNLQETLKRVANCSAPCPQDWIWHGENCYLFSSGSFNWEKSQEKCLSLDAKLLKINST
130 140 150 160 170 180
160 170 180 190 200 210
pF1KE1 EEMDFITGSLRKIKGSYDYWVGLSQDGHSGRWLWQDGSSPSPGLLPAER--SQS-ANQVC
..::: .. .:. .:.:::. . : :::.::: : :. .. ::. . .:
CCDS86 ADLDFIQQAIS--YSSFPFWMGLSRRNPSYPWLWEDGSPLMPHLFRVRGAVSQTYPSGTC
190 200 210 220 230 240
220 230 240
pF1KE1 GYVKSNSLLSSNCSTWKYFICEKYA-LRSSV
.:.. ... . :: . ::.: : ::.
CCDS86 AYIQRGAVYAENCILAAFSICQKKANLRAQ
250 260 270
>>CCDS8608.1 CLEC12A gene_id:160364|Hs108|chr12 (265 aa)
initn: 283 init1: 164 opt: 315 Z-score: 373.3 bits: 76.6 E(32554): 1.8e-14
Smith-Waterman score: 316; 29.9% identity (61.2% similar) in 214 aa overlap (34-236:50-252)
10 20 30 40 50
pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIF---LGV---K
::...:. .:.: ::.: : . :
CCDS86 KIPEIGKFGEKAPPAPSHVWRPAALFLTLLCLLLLIG----LGVL-ASMFHVTLKIEMKK
20 30 40 50 60 70
60 70 80 90 100 110
pF1KE1 LLQVSTIAMQQQEKLIQQERALLNFTEWKR--SCALQM---KYCQAFMQNSLSSAHNSSP
. ....:. . :... : . .:... : : .:: : :. .. : . :. .:
CCDS86 MNKLQNISEELQRNISLQLMSNMNISNKIRNLSTTLQTIATKLCRELY--SKEQEHKCKP
80 90 100 110 120 130
120 130 140 150 160 170
pF1KE1 CPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD
:: :: ...:::..:. . :. :. : ....::.:..:. ..:: .. : :::
CCDS86 CPRRWIWHKDSCYFLSDDVQTWQESKMACAAQNASLLKINNKNALEFIKSQSR----SYD
140 150 160 170 180
180 190 200 210 220 230
pF1KE1 YWVGLSQDGHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFIC
::.::: . : : . :. : . . . . :. :::.. . .:. : .::
CCDS86 YWLGLSPEEDSTRGMRVDNIINSSAWVIRNAPDLNNMYCGYINRLYVQYYHCTYKKRMIC
190 200 210 220 230 240
240
pF1KE1 EKYALRSSV
::.:
CCDS86 EKMANPVQLGSTYFREA
250 260
>>CCDS55803.1 CLEC12A gene_id:160364|Hs108|chr12 (275 aa)
initn: 283 init1: 164 opt: 315 Z-score: 373.1 bits: 76.6 E(32554): 1.8e-14
Smith-Waterman score: 316; 29.9% identity (61.2% similar) in 214 aa overlap (34-236:60-262)
10 20 30 40 50
pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIF---LGV---K
::...:. .:.: ::.: : . :
CCDS55 KIPEIGKFGEKAPPAPSHVWRPAALFLTLLCLLLLIG----LGVL-ASMFHVTLKIEMKK
30 40 50 60 70 80
60 70 80 90 100 110
pF1KE1 LLQVSTIAMQQQEKLIQQERALLNFTEWKR--SCALQM---KYCQAFMQNSLSSAHNSSP
. ....:. . :... : . .:... : : .:: : :. .. : . :. .:
CCDS55 MNKLQNISEELQRNISLQLMSNMNISNKIRNLSTTLQTIATKLCRELY--SKEQEHKCKP
90 100 110 120 130 140
120 130 140 150 160 170
pF1KE1 CPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD
:: :: ...:::..:. . :. :. : ....::.:..:. ..:: .. : :::
CCDS55 CPRRWIWHKDSCYFLSDDVQTWQESKMACAAQNASLLKINNKNALEFIKSQSR----SYD
150 160 170 180 190
180 190 200 210 220 230
pF1KE1 YWVGLSQDGHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFIC
::.::: . : : . :. : . . . . :. :::.. . .:. : .::
CCDS55 YWLGLSPEEDSTRGMRVDNIINSSAWVIRNAPDLNNMYCGYINRLYVQYYHCTYKKRMIC
200 210 220 230 240 250
240
pF1KE1 EKYALRSSV
::.:
CCDS55 EKMANPVQLGSTYFREA
260 270
>>CCDS8609.1 CLEC12A gene_id:160364|Hs108|chr12 (232 aa)
initn: 299 init1: 164 opt: 306 Z-score: 363.5 bits: 74.6 E(32554): 6.3e-14
Smith-Waterman score: 306; 29.7% identity (61.6% similar) in 185 aa overlap (57-236:41-219)
30 40 50 60 70 80
pF1KE1 NKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQVSTIAMQQQEKLIQQERALLNFTEWK
:. ....:. . :... : . .:...
CCDS86 QFQNSSEMEKIPEIGKFGEKVHVTLKIEMKKMNKLQNISEELQRNISLQLMSNMNISNKI
20 30 40 50 60 70
90 100 110 120 130 140
pF1KE1 R--SCALQM---KYCQAFMQNSLSSAHNSSPCPNNWIQNRESCYYVSEIWSIWHTSQENC
: : .:: : :. .. : . :. .::: :: ...:::..:. . :. :. :
CCDS86 RNLSTTLQTIATKLCRELY--SKEQEHKCKPCPRRWIWHKDSCYFLSDDVQTWQESKMAC
80 90 100 110 120
150 160 170 180 190 200
pF1KE1 LKEGSTLLQIESKEEMDFITGSLRKIKGSYDYWVGLSQDGHSGRWLWQDGSSPSPGLLPA
....::.:..:. ..:: .. : :::::.::: . : : . :. : . .
CCDS86 AAQNASLLKINNKNALEFIKSQSR----SYDYWLGLSPEEDSTRGMRVDNIINSSAWVIR
130 140 150 160 170 180
210 220 230 240
pF1KE1 ERSQSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSSV
. . :. :::.. . .:. : .::::.:
CCDS86 NAPDLNNMYCGYINRLYVQYYHCTYKKRMICEKMANPVQLGSTYFREA
190 200 210 220 230
>>CCDS8614.1 CLEC7A gene_id:64581|Hs108|chr12 (168 aa)
initn: 289 init1: 171 opt: 291 Z-score: 347.7 bits: 71.2 E(32554): 4.8e-13
Smith-Waterman score: 291; 34.6% identity (66.2% similar) in 130 aa overlap (110-234:38-164)
80 90 100 110 120 130
pF1KE1 LNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQNRESCYYVSEIWSIWHTSQE
::::: ::: ..::: : . : :..
CCDS86 ENLDEDGYTQLHFDSQSNTRIAVVSEKGVLSSPCPPNWIIYEKSCYLFSMSLNSWDGSKR
10 20 30 40 50 60
140 150 160 170 180 190
pF1KE1 NCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD--YWVGLSQDGHSGRWLWQDGSSPSPG
.: . ::.::.:.:..:. :: ....... : .:.:::. :::.:::. : .
CCDS86 QCWQLGSNLLKIDSSNELGFI---VKQVSSQPDNSFWIGLSRPQTEVPWLWEDGSTFSSN
70 80 90 100 110 120
200 210 220 230 240
pF1KE1 LLPAERS---QSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSSV
:. . . .. . : ... . . .. ::. .: ::::
CCDS86 LFQIRTTATQENPSPNCVWIHVSVIYDQLCSVPSYSICEKKFSM
130 140 150 160
>>CCDS8613.1 CLEC7A gene_id:64581|Hs108|chr12 (201 aa)
initn: 289 init1: 171 opt: 291 Z-score: 346.7 bits: 71.3 E(32554): 5.4e-13
Smith-Waterman score: 291; 34.6% identity (66.2% similar) in 130 aa overlap (110-234:71-197)
80 90 100 110 120 130
pF1KE1 LNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQNRESCYYVSEIWSIWHTSQE
::::: ::: ..::: : . : :..
CCDS86 PPWRLIAVILGILCLVILVIAVVLGTMGVLSSPCPPNWIIYEKSCYLFSMSLNSWDGSKR
50 60 70 80 90 100
140 150 160 170 180 190
pF1KE1 NCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD--YWVGLSQDGHSGRWLWQDGSSPSPG
.: . ::.::.:.:..:. :: ....... : .:.:::. :::.:::. : .
CCDS86 QCWQLGSNLLKIDSSNELGFI---VKQVSSQPDNSFWIGLSRPQTEVPWLWEDGSTFSSN
110 120 130 140 150
200 210 220 230 240
pF1KE1 LLPAERS---QSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSSV
:. . . .. . : ... . . .. ::. .: ::::
CCDS86 LFQIRTTATQENPSPNCVWIHVSVIYDQLCSVPSYSICEKKFSM
160 170 180 190 200
>>CCDS8610.1 CLEC12B gene_id:387837|Hs108|chr12 (232 aa)
initn: 358 init1: 102 opt: 287 Z-score: 341.4 bits: 70.5 E(32554): 1.1e-12
Smith-Waterman score: 312; 34.2% identity (62.5% similar) in 184 aa overlap (34-198:50-227)
10 20 30 40 50
pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGV-----KL
::...:. : .:.. .: . ::
CCDS86 NNRDGNNLRKRGHPAPSPIWRHAALGLVTLCLMLLIGLV-TLGMMFLQISNDINSDSEKL
20 30 40 50 60 70
60 70 80 90 100
pF1KE1 LQVSTIAMQQQEKLIQQ---------ERALLNF---TEWKRSCALQMKYCQAFMQNSLSS
:.. .:::..: :: :. .:. . ::. . .: :: .. . .:
CCDS86 SQLQKTIQQQQDNLSQQLGNSNNLSMEEEFLKSQISSVLKRQEQMAIKLCQELIIH--TS
80 90 100 110 120 130
110 120 130 140 150 160
pF1KE1 AHNSSPCPNNWIQNRESCYY-VSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLR
: .:::. : ..:::: ... . : .:...:. ..:::..:.: :: ::. :
CCDS86 DHRCNPCPKMWQWYQNSCYYFTTNEEKTWANSRKDCIDKNSTLVKIDSLEEKDFLM-SQP
140 150 160 170 180 190
170 180 190 200 210 220
pF1KE1 KIKGSYDYWVGLSQDGHSGR-WLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNC
. :. .:.::: :. ::: :.:.::: :::.:
CCDS86 LLMFSF-FWLGLSWDS-SGRSWFWEDGSVPSPSLYVSNY
200 210 220 230
230 240
pF1KE1 STWKYFICEKYALRSSV
241 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 14:57:29 2016 done: Sun Nov 6 14:57:30 2016
Total Scan time: 2.350 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]