FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1220, 241 aa 1>>>pF1KE1220 241 - 241 aa - 241 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.3803+/-0.000737; mu= 20.4060+/- 0.045 mean_var=73.6202+/-14.468, 0's: 0 Z-trim(109.6): 97 B-trim: 44 in 1/50 Lambda= 0.149477 statistics sampled from 10904 (11010) to 10904 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.724), E-opt: 0.2 (0.338), width: 16 Scan time: 2.350 The best scores are: opt bits E(32554) CCDS8611.1 CLEC9A gene_id:283420|Hs108|chr12 ( 241) 1678 370.5 5.6e-103 CCDS44830.1 CLEC12B gene_id:387837|Hs108|chr12 ( 276) 350 84.2 9.8e-17 CCDS41753.1 CLEC7A gene_id:64581|Hs108|chr12 ( 247) 325 78.7 3.8e-15 CCDS8618.1 OLR1 gene_id:4973|Hs108|chr12 ( 273) 321 77.9 7.5e-15 CCDS8608.1 CLEC12A gene_id:160364|Hs108|chr12 ( 265) 315 76.6 1.8e-14 CCDS55803.1 CLEC12A gene_id:160364|Hs108|chr12 ( 275) 315 76.6 1.8e-14 CCDS8609.1 CLEC12A gene_id:160364|Hs108|chr12 ( 232) 306 74.6 6.3e-14 CCDS8614.1 CLEC7A gene_id:64581|Hs108|chr12 ( 168) 291 71.2 4.8e-13 CCDS8613.1 CLEC7A gene_id:64581|Hs108|chr12 ( 201) 291 71.3 5.4e-13 CCDS8610.1 CLEC12B gene_id:387837|Hs108|chr12 ( 232) 287 70.5 1.1e-12 CCDS8623.1 KLRK1 gene_id:22914|Hs108|chr12 ( 216) 278 68.5 4e-12 CCDS8612.1 CLEC1A gene_id:51267|Hs108|chr12 ( 280) 279 68.9 4e-12 CCDS41751.1 CLEC1B gene_id:51266|Hs108|chr12 ( 196) 269 66.5 1.4e-11 CCDS41752.1 CLEC1B gene_id:51266|Hs108|chr12 ( 229) 265 65.8 2.9e-11 CCDS8622.1 KLRD1 gene_id:3824|Hs108|chr12 ( 148) 262 64.9 3.4e-11 CCDS8621.1 KLRD1 gene_id:3824|Hs108|chr12 ( 179) 262 65.0 3.8e-11 CCDS73443.1 CLEC1A gene_id:51267|Hs108|chr12 ( 247) 262 65.2 4.7e-11 CCDS53743.1 KLRF2 gene_id:100431172|Hs108|chr12 ( 207) 258 64.2 7.6e-11 >>CCDS8611.1 CLEC9A gene_id:283420|Hs108|chr12 (241 aa) initn: 1678 init1: 1678 opt: 1678 Z-score: 1962.3 bits: 370.5 E(32554): 5.6e-103 Smith-Waterman score: 1678; 100.0% identity (100.0% similar) in 241 aa overlap (1-241:1-241) 10 20 30 40 50 60 pF1KE1 MHEEEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 MHEEEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 VSTIAMQQQEKLIQQERALLNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 VSTIAMQQQEKLIQQERALLNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYDYWVGLSQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 RESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYDYWVGLSQD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 GHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS86 GHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSS 190 200 210 220 230 240 pF1KE1 V : CCDS86 V >>CCDS44830.1 CLEC12B gene_id:387837|Hs108|chr12 (276 aa) initn: 378 init1: 113 opt: 350 Z-score: 413.9 bits: 84.2 E(32554): 9.8e-17 Smith-Waterman score: 375; 33.0% identity (63.4% similar) in 224 aa overlap (34-236:50-267) 10 20 30 40 50 pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGV-----KL ::...:. : .:.. .: . :: CCDS44 NNRDGNNLRKRGHPAPSPIWRHAALGLVTLCLMLLIGLV-TLGMMFLQISNDINSDSEKL 20 30 40 50 60 70 60 70 80 90 100 pF1KE1 LQVSTIAMQQQEKLIQQ---------ERALLNF---TEWKRSCALQMKYCQAFMQNSLSS :.. .:::..: :: :. .:. . ::. . .: :: .. . .: CCDS44 SQLQKTIQQQQDNLSQQLGNSNNLSMEEEFLKSQISSVLKRQEQMAIKLCQELIIH--TS 80 90 100 110 120 130 110 120 130 140 150 160 pF1KE1 AHNSSPCPNNWIQNRESCYY-VSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLR : .:::. : ..:::: ... . : .:...:. ..:::..:.: :: ::. : CCDS44 DHRCNPCPKMWQWYQNSCYYFTTNEEKTWANSRKDCIDKNSTLVKIDSLEEKDFLM-SQP 140 150 160 170 180 190 170 180 190 200 210 220 pF1KE1 KIKGSYDYWVGLSQDGHSGR-WLWQDGSSPSPGLLPAERSQSAN--QVCGYVKSNSLLSS . :. .:.::: :. ::: :.:.::: :::.:. ... .. : . :.: ..... : CCDS44 LLMFSF-FWLGLSWDS-SGRSWFWEDGSVPSPSLFSTKELDQINGSKGCAYFQKGNIYIS 200 210 220 230 240 250 230 240 pF1KE1 NCSTWKYFICEKYALRSSV ::. ..:::: : CCDS44 RCSAEIFWICEKTAAPVKTEDLD 260 270 >>CCDS41753.1 CLEC7A gene_id:64581|Hs108|chr12 (247 aa) initn: 308 init1: 171 opt: 325 Z-score: 385.3 bits: 78.7 E(32554): 3.8e-15 Smith-Waterman score: 325; 26.8% identity (59.4% similar) in 239 aa overlap (3-234:11-243) 10 20 30 40 50 pF1KE1 MHEEEIYTSLQWDSPAPDTYQKCLSSNKCSGACC--LVMVISCVFCMGLLTA .:. ::.:..:: . ...:... :. :: ..:. .:. CCDS41 MEYHPDLENLDEDGYTQLHFDSQSNTRIAVVSEKGSCAASPPWRLIAVILGILCLVILVI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 SIFLGVKLLQVSTIAMQQQEKLIQQERALLNFTEWKRSCALQMKYCQAFMQNSLSSAHNS .. ::. . :. . . :. : : .. .: ... . . ... : CCDS41 AVVLGTMAIWRSNSGSNTLENGYFLSRNKENHSQPTQS---SLEDSVTPTKAVKTTGVLS 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 SPCPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGS :::: ::: ..::: : . : :...: . ::.::.:.:..:. :: ....... CCDS41 SPCPPNWIIYEKSCYLFSMSLNSWDGSKRQCWQLGSNLLKIDSSNELGFI---VKQVSSQ 120 130 140 150 160 170 180 190 200 210 220 pF1KE1 YD--YWVGLSQDGHSGRWLWQDGSSPSPGLLPAERS---QSANQVCGYVKSNSLLSSNCS : .:.:::. :::.:::. : .:. . . .. . : ... . . .. :: CCDS41 PDNSFWIGLSRPQTEVPWLWEDGSTFSSNLFQIRTTATQENPSPNCVWIHVSVIYDQLCS 180 190 200 210 220 230 230 240 pF1KE1 TWKYFICEKYALRSSV . .: :::: CCDS41 VPSYSICEKKFSM 240 >>CCDS8618.1 OLR1 gene_id:4973|Hs108|chr12 (273 aa) initn: 382 init1: 170 opt: 321 Z-score: 380.1 bits: 77.9 E(32554): 7.5e-15 Smith-Waterman score: 356; 29.7% identity (58.6% similar) in 239 aa overlap (34-239:36-272) 10 20 30 40 50 60 pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQVST ::. . :.:.::... . ::..: ::: CCDS86 LKIQTVKDQPDEKSNGKKAKGLQFLYSPWWCLAAATLGVLCLGLVVTIMVLGMQLSQVSD 10 20 30 40 50 60 70 80 90 pF1KE1 IAMQQQEKLIQQERALLN------------------FTEWKRSCA----------LQMKY . :.: .: .:.. : . . : .. : ..... CCDS86 LLTQEQANLTHQKKKLEGQISARQQAEEASQESENELKEMIETLARKLNEKSKEQMELHH 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE1 CQAFMQNSLSSAHN-SSPCPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESK . .:..:. . : :.:::..:: . :.:: : :. :::.::. . ::.:.: CCDS86 QNLNLQETLKRVANCSAPCPQDWIWHGENCYLFSSGSFNWEKSQEKCLSLDAKLLKINST 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE1 EEMDFITGSLRKIKGSYDYWVGLSQDGHSGRWLWQDGSSPSPGLLPAER--SQS-ANQVC ..::: .. .:. .:.:::. . : :::.::: : :. .. ::. . .: CCDS86 ADLDFIQQAIS--YSSFPFWMGLSRRNPSYPWLWEDGSPLMPHLFRVRGAVSQTYPSGTC 190 200 210 220 230 240 220 230 240 pF1KE1 GYVKSNSLLSSNCSTWKYFICEKYA-LRSSV .:.. ... . :: . ::.: : ::. CCDS86 AYIQRGAVYAENCILAAFSICQKKANLRAQ 250 260 270 >>CCDS8608.1 CLEC12A gene_id:160364|Hs108|chr12 (265 aa) initn: 283 init1: 164 opt: 315 Z-score: 373.3 bits: 76.6 E(32554): 1.8e-14 Smith-Waterman score: 316; 29.9% identity (61.2% similar) in 214 aa overlap (34-236:50-252) 10 20 30 40 50 pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIF---LGV---K ::...:. .:.: ::.: : . : CCDS86 KIPEIGKFGEKAPPAPSHVWRPAALFLTLLCLLLLIG----LGVL-ASMFHVTLKIEMKK 20 30 40 50 60 70 60 70 80 90 100 110 pF1KE1 LLQVSTIAMQQQEKLIQQERALLNFTEWKR--SCALQM---KYCQAFMQNSLSSAHNSSP . ....:. . :... : . .:... : : .:: : :. .. : . :. .: CCDS86 MNKLQNISEELQRNISLQLMSNMNISNKIRNLSTTLQTIATKLCRELY--SKEQEHKCKP 80 90 100 110 120 130 120 130 140 150 160 170 pF1KE1 CPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD :: :: ...:::..:. . :. :. : ....::.:..:. ..:: .. : ::: CCDS86 CPRRWIWHKDSCYFLSDDVQTWQESKMACAAQNASLLKINNKNALEFIKSQSR----SYD 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 YWVGLSQDGHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFIC ::.::: . : : . :. : . . . . :. :::.. . .:. : .:: CCDS86 YWLGLSPEEDSTRGMRVDNIINSSAWVIRNAPDLNNMYCGYINRLYVQYYHCTYKKRMIC 190 200 210 220 230 240 240 pF1KE1 EKYALRSSV ::.: CCDS86 EKMANPVQLGSTYFREA 250 260 >>CCDS55803.1 CLEC12A gene_id:160364|Hs108|chr12 (275 aa) initn: 283 init1: 164 opt: 315 Z-score: 373.1 bits: 76.6 E(32554): 1.8e-14 Smith-Waterman score: 316; 29.9% identity (61.2% similar) in 214 aa overlap (34-236:60-262) 10 20 30 40 50 pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIF---LGV---K ::...:. .:.: ::.: : . : CCDS55 KIPEIGKFGEKAPPAPSHVWRPAALFLTLLCLLLLIG----LGVL-ASMFHVTLKIEMKK 30 40 50 60 70 80 60 70 80 90 100 110 pF1KE1 LLQVSTIAMQQQEKLIQQERALLNFTEWKR--SCALQM---KYCQAFMQNSLSSAHNSSP . ....:. . :... : . .:... : : .:: : :. .. : . :. .: CCDS55 MNKLQNISEELQRNISLQLMSNMNISNKIRNLSTTLQTIATKLCRELY--SKEQEHKCKP 90 100 110 120 130 140 120 130 140 150 160 170 pF1KE1 CPNNWIQNRESCYYVSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD :: :: ...:::..:. . :. :. : ....::.:..:. ..:: .. : ::: CCDS55 CPRRWIWHKDSCYFLSDDVQTWQESKMACAAQNASLLKINNKNALEFIKSQSR----SYD 150 160 170 180 190 180 190 200 210 220 230 pF1KE1 YWVGLSQDGHSGRWLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNCSTWKYFIC ::.::: . : : . :. : . . . . :. :::.. . .:. : .:: CCDS55 YWLGLSPEEDSTRGMRVDNIINSSAWVIRNAPDLNNMYCGYINRLYVQYYHCTYKKRMIC 200 210 220 230 240 250 240 pF1KE1 EKYALRSSV ::.: CCDS55 EKMANPVQLGSTYFREA 260 270 >>CCDS8609.1 CLEC12A gene_id:160364|Hs108|chr12 (232 aa) initn: 299 init1: 164 opt: 306 Z-score: 363.5 bits: 74.6 E(32554): 6.3e-14 Smith-Waterman score: 306; 29.7% identity (61.6% similar) in 185 aa overlap (57-236:41-219) 30 40 50 60 70 80 pF1KE1 NKCSGACCLVMVISCVFCMGLLTASIFLGVKLLQVSTIAMQQQEKLIQQERALLNFTEWK :. ....:. . :... : . .:... CCDS86 QFQNSSEMEKIPEIGKFGEKVHVTLKIEMKKMNKLQNISEELQRNISLQLMSNMNISNKI 20 30 40 50 60 70 90 100 110 120 130 140 pF1KE1 R--SCALQM---KYCQAFMQNSLSSAHNSSPCPNNWIQNRESCYYVSEIWSIWHTSQENC : : .:: : :. .. : . :. .::: :: ...:::..:. . :. :. : CCDS86 RNLSTTLQTIATKLCRELY--SKEQEHKCKPCPRRWIWHKDSCYFLSDDVQTWQESKMAC 80 90 100 110 120 150 160 170 180 190 200 pF1KE1 LKEGSTLLQIESKEEMDFITGSLRKIKGSYDYWVGLSQDGHSGRWLWQDGSSPSPGLLPA ....::.:..:. ..:: .. : :::::.::: . : : . :. : . . CCDS86 AAQNASLLKINNKNALEFIKSQSR----SYDYWLGLSPEEDSTRGMRVDNIINSSAWVIR 130 140 150 160 170 180 210 220 230 240 pF1KE1 ERSQSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSSV . . :. :::.. . .:. : .::::.: CCDS86 NAPDLNNMYCGYINRLYVQYYHCTYKKRMICEKMANPVQLGSTYFREA 190 200 210 220 230 >>CCDS8614.1 CLEC7A gene_id:64581|Hs108|chr12 (168 aa) initn: 289 init1: 171 opt: 291 Z-score: 347.7 bits: 71.2 E(32554): 4.8e-13 Smith-Waterman score: 291; 34.6% identity (66.2% similar) in 130 aa overlap (110-234:38-164) 80 90 100 110 120 130 pF1KE1 LNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQNRESCYYVSEIWSIWHTSQE ::::: ::: ..::: : . : :.. CCDS86 ENLDEDGYTQLHFDSQSNTRIAVVSEKGVLSSPCPPNWIIYEKSCYLFSMSLNSWDGSKR 10 20 30 40 50 60 140 150 160 170 180 190 pF1KE1 NCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD--YWVGLSQDGHSGRWLWQDGSSPSPG .: . ::.::.:.:..:. :: ....... : .:.:::. :::.:::. : . CCDS86 QCWQLGSNLLKIDSSNELGFI---VKQVSSQPDNSFWIGLSRPQTEVPWLWEDGSTFSSN 70 80 90 100 110 120 200 210 220 230 240 pF1KE1 LLPAERS---QSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSSV :. . . .. . : ... . . .. ::. .: :::: CCDS86 LFQIRTTATQENPSPNCVWIHVSVIYDQLCSVPSYSICEKKFSM 130 140 150 160 >>CCDS8613.1 CLEC7A gene_id:64581|Hs108|chr12 (201 aa) initn: 289 init1: 171 opt: 291 Z-score: 346.7 bits: 71.3 E(32554): 5.4e-13 Smith-Waterman score: 291; 34.6% identity (66.2% similar) in 130 aa overlap (110-234:71-197) 80 90 100 110 120 130 pF1KE1 LNFTEWKRSCALQMKYCQAFMQNSLSSAHNSSPCPNNWIQNRESCYYVSEIWSIWHTSQE ::::: ::: ..::: : . : :.. CCDS86 PPWRLIAVILGILCLVILVIAVVLGTMGVLSSPCPPNWIIYEKSCYLFSMSLNSWDGSKR 50 60 70 80 90 100 140 150 160 170 180 190 pF1KE1 NCLKEGSTLLQIESKEEMDFITGSLRKIKGSYD--YWVGLSQDGHSGRWLWQDGSSPSPG .: . ::.::.:.:..:. :: ....... : .:.:::. :::.:::. : . CCDS86 QCWQLGSNLLKIDSSNELGFI---VKQVSSQPDNSFWIGLSRPQTEVPWLWEDGSTFSSN 110 120 130 140 150 200 210 220 230 240 pF1KE1 LLPAERS---QSANQVCGYVKSNSLLSSNCSTWKYFICEKYALRSSV :. . . .. . : ... . . .. ::. .: :::: CCDS86 LFQIRTTATQENPSPNCVWIHVSVIYDQLCSVPSYSICEKKFSM 160 170 180 190 200 >>CCDS8610.1 CLEC12B gene_id:387837|Hs108|chr12 (232 aa) initn: 358 init1: 102 opt: 287 Z-score: 341.4 bits: 70.5 E(32554): 1.1e-12 Smith-Waterman score: 312; 34.2% identity (62.5% similar) in 184 aa overlap (34-198:50-227) 10 20 30 40 50 pF1KE1 EEIYTSLQWDSPAPDTYQKCLSSNKCSGACCLVMVISCVFCMGLLTASIFLGV-----KL ::...:. : .:.. .: . :: CCDS86 NNRDGNNLRKRGHPAPSPIWRHAALGLVTLCLMLLIGLV-TLGMMFLQISNDINSDSEKL 20 30 40 50 60 70 60 70 80 90 100 pF1KE1 LQVSTIAMQQQEKLIQQ---------ERALLNF---TEWKRSCALQMKYCQAFMQNSLSS :.. .:::..: :: :. .:. . ::. . .: :: .. . .: CCDS86 SQLQKTIQQQQDNLSQQLGNSNNLSMEEEFLKSQISSVLKRQEQMAIKLCQELIIH--TS 80 90 100 110 120 130 110 120 130 140 150 160 pF1KE1 AHNSSPCPNNWIQNRESCYY-VSEIWSIWHTSQENCLKEGSTLLQIESKEEMDFITGSLR : .:::. : ..:::: ... . : .:...:. ..:::..:.: :: ::. : CCDS86 DHRCNPCPKMWQWYQNSCYYFTTNEEKTWANSRKDCIDKNSTLVKIDSLEEKDFLM-SQP 140 150 160 170 180 190 170 180 190 200 210 220 pF1KE1 KIKGSYDYWVGLSQDGHSGR-WLWQDGSSPSPGLLPAERSQSANQVCGYVKSNSLLSSNC . :. .:.::: :. ::: :.:.::: :::.: CCDS86 LLMFSF-FWLGLSWDS-SGRSWFWEDGSVPSPSLYVSNY 200 210 220 230 230 240 pF1KE1 STWKYFICEKYALRSSV 241 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 14:57:29 2016 done: Sun Nov 6 14:57:30 2016 Total Scan time: 2.350 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]