FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB0998, 230 aa
1>>>pF1KB0998 230 - 230 aa - 230 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.0588+/-0.000674; mu= 16.2141+/- 0.041
mean_var=66.6318+/-13.389, 0's: 0 Z-trim(110.1): 44 B-trim: 0 in 0/51
Lambda= 0.157121
statistics sampled from 11332 (11376) to 11332 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.349), width: 16
Scan time: 2.330
The best scores are: opt bits E(32554)
CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 1507 349.7 9e-97
CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 741 176.1 1.7e-44
CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 591 142.1 2.8e-34
CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 578 139.1 2.1e-33
CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 576 138.7 2.9e-33
CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 576 138.7 3e-33
CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 571 137.5 6.4e-33
CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 565 136.2 1.6e-32
CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 559 134.8 4.1e-32
CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 529 128.0 4.6e-30
CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 525 127.1 8.9e-30
CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 504 122.4 2.4e-28
CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 503 122.1 2.9e-28
CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 498 121.1 8e-28
CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 447 109.4 1.9e-24
CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 429 105.4 3.3e-23
CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 392 96.9 7.6e-21
CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 392 97.0 1.1e-20
CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 364 90.6 8.8e-19
CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 354 88.4 4.1e-18
CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 345 86.3 1.7e-17
CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 308 77.9 5.9e-15
CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 293 74.6 6.9e-14
CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 287 73.2 1.8e-13
CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 261 67.3 8.8e-12
>>CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX (230 aa)
initn: 1507 init1: 1507 opt: 1507 Z-score: 1850.8 bits: 349.7 E(32554): 9e-97
Smith-Waterman score: 1507; 100.0% identity (100.0% similar) in 230 aa overlap (1-230:1-230)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII
130 140 150 160 170 180
190 200 210 220 230
pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
190 200 210 220 230
>>CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 (239 aa)
initn: 766 init1: 707 opt: 741 Z-score: 912.2 bits: 176.1 E(32554): 1.7e-44
Smith-Waterman score: 741; 47.8% identity (78.3% similar) in 230 aa overlap (1-227:1-226)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::: ..::.:..:..::..:::.. .:: :. ...::..:.:::.. :::::::. ::::
CCDS13 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA
: ::.:: .::.:: :.:::.:.:: : .:..:: .:.::.:: . . :: :.
CCDS13 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII
::..:::.::: .. :.:. . ....::.::.:..::::::.:::::.::: .:::.: .
CCDS13 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL
130 140 150 160 170 180
190 200 210 220 230
pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPR--PG-QPPKVKSEFNSYSLTGYV
::.::... : ::: : :: .. :. ::: . .. . :.:
CCDS13 LCLSCQDEAP----YRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLN
190 200 210 220 230
CCDS13 DYV
>>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa)
initn: 625 init1: 574 opt: 591 Z-score: 728.9 bits: 142.1 E(32554): 2.8e-34
Smith-Waterman score: 591; 39.0% identity (78.6% similar) in 210 aa overlap (3-212:2-207)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
:.::...: :..:: :::.: :: :..:...:..:.:. .. .::::.:...:::
CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG
10 20 30 40 50
70 80 90 100 110 120
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA
:: .:..::.:: :.:::.:..:.. ..... ....:: .:: :.. :: .....
CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDTAKAKITIV
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII
.::.:.:..:: ..::.:. . :.::::.:.::...: :.: .::.: .. ..:..: .
CCDS55 AGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGAL
120 130 140 150 160 170
190 200 210 220 230
pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
:: :: .... : : .. : ::. ::
CCDS55 LCCSCPPREKK---YTATKVVYSAPRSTG-PGASLGTGYDRKDYV
180 190 200 210 220
>>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa)
initn: 599 init1: 572 opt: 578 Z-score: 713.3 bits: 139.1 E(32554): 2.1e-33
Smith-Waterman score: 578; 39.4% identity (76.4% similar) in 208 aa overlap (1-208:1-203)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
:::.:::..: :..:: :.... :: :......:..:::. . .::::.:...:::
CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA
:: .:..::.:: :.:::.:... : ...:. ..:::: .:: .. :: .. ..
CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCLEDESAKAKTMIV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII
.:: :.:.::. ..::.:. :.:..:::.::: ...: :.: .::.: .: . :..: .
CCDS55 AGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGGL
130 140 150 160 170 180
190 200 210 220 230
pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
:: .: . .. :.:. :.::.
CCDS55 LCCNCPPRTDKP-----YSAKYSAARSAAASNYV
190 200
>>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa)
initn: 593 init1: 567 opt: 576 Z-score: 710.5 bits: 138.7 E(32554): 2.9e-33
Smith-Waterman score: 576; 39.8% identity (74.4% similar) in 211 aa overlap (1-209:1-211)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::: :.:..: .: ::: .. ::. :: ::.....: :::.: .:::: :...:::
CCDS10 MASAGMQILGVVLTLLGWVNGLVSCALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA
:: .:..::.:: :.:::.:. : . .. .. .. ..: .::. .:. .: :....
CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCVEEKDSKARLVLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII
.:. :...:.: .::: :. :.:.::::.::: ...: :.: .:::: .: . :..: .
CCDS10 SGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGGGL
130 140 150 160 170 180
190 200 210 220 230
pF1KB0 LCFSCSS--QRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
:: .: : ... :.:. :... : .:
CCDS10 LCCTCPSGGSQGPSHYMARYSTSAPAISRGPSEYPTKNYV
190 200 210 220
>>CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 (224 aa)
initn: 581 init1: 374 opt: 576 Z-score: 710.4 bits: 138.7 E(32554): 3e-33
Smith-Waterman score: 576; 40.6% identity (72.1% similar) in 219 aa overlap (1-218:1-219)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::. ::::.::.:.: : .: ... ::.:: :::.: .:.::::. .:::: ::..:::
CCDS47 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCT-VFCQESRAKDRVAV
.:: .:..::.: . ::.:.:.::.. .. .: ..:::::.:: : .. :: :::.
CCDS47 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 AGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGI
:::..:::.:: . :.: . ..:..: .: . ..:.: ::..: :. .....:
CCDS47 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 ILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
.:: .: . .. . :. : :. : : ..:
CCDS47 FLCCTCPEPERPNSSPQPYRPGPSAAAREPVVKLPASAKGPLGV
190 200 210 220
>>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa)
initn: 648 init1: 571 opt: 571 Z-score: 704.5 bits: 137.5 E(32554): 6.4e-33
Smith-Waterman score: 571; 43.2% identity (78.4% similar) in 185 aa overlap (1-185:1-185)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::: ::.:.:. :..:: :::::. :: ::.....: :::.: .:::: :...:::
CCDS10 MASTGLELLGMTLAVLGWLGTLVSCALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA
:: .:..::.:: :.:::.:. : . .. :. .....: .::. .. :: :....
CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCVEDEGAKARIVLT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB0 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII
.::...:.:.: .::: :. :.:..:::.::: ...: :.: .:::: .. . ...: .
CCDS10 AGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGGGL
130 140 150 160 170 180
190 200 210 220 230
pF1KB0 LCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
:: .:
CCDS10 LCCTCPPPQVERPRGPRLGYSIPSRSGASGLDKRDYV
190 200 210
>>CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 (211 aa)
initn: 581 init1: 374 opt: 565 Z-score: 697.3 bits: 136.2 E(32554): 1.6e-32
Smith-Waterman score: 565; 42.0% identity (74.1% similar) in 205 aa overlap (1-204:1-205)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::. ::::.::.:.: : .: ... ::.:: :::.: .:.::::. .:::: ::..:::
CCDS44 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCT-VFCQESRAKDRVAV
.:: .:..::.: . ::.:.:.::.. .. .: ..:::::.:: : .. :: :::.
CCDS44 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 AGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGI
:::..:::.:: . :.: . ..:..: .: . ..:.: ::..: :. .....:
CCDS44 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 ILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
.:: .: . .. . :. : :
CCDS44 FLCCTCPEPERPNSSPQPYRPGPSAAAREYV
190 200 210
>>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa)
initn: 577 init1: 349 opt: 559 Z-score: 690.0 bits: 134.8 E(32554): 4.1e-32
Smith-Waterman score: 559; 39.0% identity (79.0% similar) in 195 aa overlap (1-194:1-195)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::. ::::.:. ..::: .: .. .:.:. :::.: .:.:: .. :::::.:.:.:::
CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKD-RVAV
. .: .:...:.: : .::..:.::.: ... :: .....::.:: ....: :.:.
CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB0 AGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGI
.::..::..:: ... .: : :. :::.::.: ..:.:.: :...: .: . ...:
CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB0 ILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
.: :: .......:
CCDS11 LLSCSCPGNESKAGYRVPRSYPKSNSSKEYV
190 200 210
>>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa)
initn: 527 init1: 335 opt: 529 Z-score: 653.2 bits: 128.0 E(32554): 4.6e-30
Smith-Waterman score: 530; 38.0% identity (71.0% similar) in 221 aa overlap (1-219:1-206)
10 20 30 40 50 60
pF1KB0 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG
::. ::::.:.::..:: .:..:. ::.:. ::.: .:::: .. .:::: :...:::
CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG
10 20 30 40 50 60
70 80 90 100 110
pF1KB0 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRA--KDRVA
:: ....::.: . .::..:.::.. .. .: ....:::.: . : :. : :.:
CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKC-MKCLEDDEVQKMRMA
70 80 90 100 110
120 130 140 150 160 170
pF1KB0 VAGGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAG
: ::..:.:.:: .. .:: . :...::.:..: . ..:.:.::. : .. . :..:
CCDS32 VIGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGG
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB0 IILCFSCSSQRNRSNYYDAYQAQPLATRSSPRPGQPPKVKSEFNSYSLTGYV
.:: :: :. ..: : .::: : .:
CCDS32 ALLC--CSCPRKTTSY-------P-----TPRPYPKPAPSSGKDYV
180 190 200 210
230 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 20:25:51 2016 done: Fri Nov 4 20:25:51 2016
Total Scan time: 2.330 Total Display time: -0.020
Function used was FASTA [36.3.4 Apr, 2011]