FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB6949, 211 aa
1>>>pF1KB6949 211 - 211 aa - 211 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 4.9147+/-0.000794; mu= 15.4973+/- 0.048
mean_var=59.3690+/-12.013, 0's: 0 Z-trim(107.5): 41 B-trim: 0 in 0/49
Lambda= 0.166454
statistics sampled from 9577 (9617) to 9577 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.295), width: 16
Scan time: 1.750
The best scores are: opt bits E(32554)
CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 1414 347.6 3.4e-96
CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 925 230.1 7.7e-61
CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 864 215.4 1.5e-56
CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 841 210.0 9.1e-55
CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 830 207.3 6e-54
CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 714 179.5 1.4e-45
CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 710 178.5 2.8e-45
CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 700 176.1 1.4e-44
CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 685 172.5 1.8e-43
CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 663 167.3 9e-42
CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 625 158.1 4.1e-39
CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 624 157.9 4.7e-39
CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 611 154.7 3.9e-38
CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 584 148.3 3.6e-36
CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 561 142.7 1.7e-34
CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 549 139.8 1.2e-33
CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 536 136.7 1.1e-32
CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 530 135.3 2.9e-32
CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 493 126.4 1.4e-29
CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 445 114.9 4e-26
CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 438 113.2 1.3e-25
CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 388 101.2 6e-22
CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 381 99.5 1.9e-21
CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 366 95.9 2.1e-20
CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 357 93.7 8.7e-20
CCDS3296.1 CLDN16 gene_id:10686|Hs108|chr3 ( 305) 293 78.5 5.1e-15
CCDS55195.1 CLDN23 gene_id:137075|Hs108|chr8 ( 292) 250 68.1 6.3e-12
>>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa)
initn: 1414 init1: 1414 opt: 1414 Z-score: 1840.4 bits: 347.6 E(32554): 3.4e-96
Smith-Waterman score: 1414; 99.5% identity (100.0% similar) in 211 aa overlap (1-211:1-211)
10 20 30 40 50 60
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
130 140 150 160 170 180
190 200 210
pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV
::::::::::::::::.::::::::::::::
CCDS11 LLSCSCPGNESKAGYRVPRSYPKSNSSKEYV
190 200 210
>>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa)
initn: 911 init1: 911 opt: 925 Z-score: 1205.8 bits: 230.1 E(32554): 7.7e-61
Smith-Waterman score: 925; 60.6% identity (86.4% similar) in 213 aa overlap (1-211:1-211)
10 20 30 40 50 60
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
:::.::::::: .:.:::.: .. ::.:::.. :::::::.::::::.::::.::.::::
CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
...::..::.: ::..::::::::::...:: .:.::::.:::: .: ::.:.: :.:.
CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKCMKCLEDDEVQKMRMAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
:: ::..:::: ::: .:::..:: .::.:. :.: .:::: :.: :::...: .::::
CCDS32 IGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGGA
130 140 150 160 170 180
190 200 210
pF1KB6 LLSCSCPGNESKAGYRAPRSYPKS--NSSKEYV
:: :::: .. ..: .:: ::: .:.:.::
CCDS32 LLCCSCP--RKTTSYPTPRPYPKPAPSSGKDYV
190 200 210
>>CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 (145 aa)
initn: 878 init1: 864 opt: 864 Z-score: 1129.0 bits: 215.4 E(32554): 1.5e-56
Smith-Waterman score: 864; 98.5% identity (100.0% similar) in 132 aa overlap (1-132:1-132)
10 20 30 40 50 60
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
::::::::::..
CCDS54 GGGIIFIVAGMSLALPSLLAGQGLP
130 140
>>CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 (211 aa)
initn: 841 init1: 841 opt: 841 Z-score: 1096.7 bits: 210.0 E(32554): 9.1e-55
Smith-Waterman score: 841; 53.6% identity (83.4% similar) in 211 aa overlap (1-211:1-211)
10 20 30 40 50 60
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
::::::::::. .:: ::::..: ::.:::..:::::: :::: ..:.::::.:..::::
CCDS44 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
...::.:::.:::.. .:..::::::...:::.:: ....:::::: : .. . :.:.:.
CCDS44 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
.:: .::.::: .:.: :::. .. .:.:: :.: .::::::.:.:::...:..:::.
CCDS44 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS
130 140 150 160 170 180
190 200 210
pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV
.: :.:: : . : : ...:::
CCDS44 FLCCTCPEPERPNSSPQPYRPGPSAAAREYV
190 200 210
>>CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 (224 aa)
initn: 819 init1: 819 opt: 830 Z-score: 1082.1 bits: 207.3 E(32554): 6e-54
Smith-Waterman score: 830; 53.1% identity (82.9% similar) in 211 aa overlap (1-211:1-211)
10 20 30 40 50 60
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
::::::::::. .:: ::::..: ::.:::..:::::: :::: ..:.::::.:..::::
CCDS47 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
...::.:::.:::.. .:..::::::...:::.:: ....:::::: : .. . :.:.:.
CCDS47 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
.:: .::.::: .:.: :::. .. .:.:: :.: .::::::.:.:::...:..:::.
CCDS47 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS
130 140 150 160 170 180
190 200 210
pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV
.: :.:: : . : : ...: :
CCDS47 FLCCTCPEPERPNSSPQPYRPGPSAAAREPVVKLPASAKGPLGV
190 200 210 220
>>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa)
initn: 744 init1: 438 opt: 714 Z-score: 932.0 bits: 179.5 E(32554): 1.4e-45
Smith-Waterman score: 714; 44.1% identity (82.0% similar) in 211 aa overlap (1-211:1-209)
10 20 30 40 50 60
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
::. :::..:...:.:::.... : :.:.:..... :.::.:.:....::::.::.::::
CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
.:.::.:::.::: :::.:::...:.... :.......: ::: : .:. ::. .
CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCL-EDESAKAKTMI
70 80 90 100 110
130 140 150 160 170 180
pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
.:..:..::: ..: :: .:.:. ::::::. .. : :.: ....:::.:.:..:::.
CCDS55 VAGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGG
120 130 140 150 160 170
190 200 210
pF1KB6 LLSCSCPGNESKAGYRAPRSYPKSNSSKEYV
:: :.:: .: : : : .: ....::
CCDS55 LLCCNCPPRTDKP-YSAKYSAARSAAASNYV
180 190 200
>>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa)
initn: 726 init1: 430 opt: 710 Z-score: 926.5 bits: 178.5 E(32554): 2.8e-45
Smith-Waterman score: 710; 48.8% identity (80.1% similar) in 201 aa overlap (5-200:4-203)
10 20 30 40 50 60
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
::.. : ..:.:::.: ..: :.:.:..:.. :.::::.: ...::::.::.::::
CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG
10 20 30 40 50
70 80 90 100 110 120
pF1KB6 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
.:.::.:::.::: :::.:::.::...:. ....:: .: .:: : :: .: :.:..
CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDTAK-AKITI
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB6 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
.:..:..:.: .:: :: .. :. :::::..: : :.: ....:::..:: .::::
CCDS55 VAGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGA
120 130 140 150 160 170
190 200 210
pF1KB6 LLSCSCPGNE-----SKAGYRAPRSYPKSNSSKEYV
:: :::: : .:. : ::::
CCDS55 LLCCSCPPREKKYTATKVVYSAPRSTGPGASLGTGYDRKDYV
180 190 200 210 220
>>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa)
initn: 443 init1: 443 opt: 700 Z-score: 913.6 bits: 176.1 E(32554): 1.4e-44
Smith-Waterman score: 700; 45.2% identity (79.0% similar) in 219 aa overlap (1-211:1-217)
10 20 30 40 50
pF1KB6 MANSGLQLLGFSMALLGWVG-LVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQST
::..::.:::...:.:::.: ::.: :.: :..... :..:..::....::::.::.:::
CCDS10 MASTGLELLGMTLAVLGWLGTLVSC-ALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQST
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 GMMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIA
:.:.::.:::.::: :::.::: :..:.:..:...:: : .:: : .:. ::::.
CCDS10 GQMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCV-EDEGAKARIV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 MGGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGG
. .:.:...::. .:. : .: :. ::::::. .: :.: ....:::..::..:::
CCDS10 LTAGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGG
120 130 140 150 160 170
180 190 200 210
pF1KB6 ALLSCSCPGNE------SKAGYRAP-RSYPKSNSSKEYV
.:: :.:: . . :: : :: .. ....::
CCDS10 GLLCCTCPPPQVERPRGPRLGYSIPSRSGASGLDKRDYV
180 190 200 210
>>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa)
initn: 676 init1: 407 opt: 685 Z-score: 894.0 bits: 172.5 E(32554): 1.8e-43
Smith-Waterman score: 685; 44.9% identity (78.7% similar) in 216 aa overlap (1-210:1-214)
10 20 30 40 50
pF1KB6 MANSGLQLLGFSMALLGWV-GLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQST
::..:.:.:: ..::::: :::.: :.:.:..... :..:..::....::::.::.:::
CCDS10 MASAGMQILGVVLTLLGWVNGLVSC-ALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQST
10 20 30 40 50
60 70 80 90 100 110
pF1KB6 GMMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIA
:.:.::.:::.::: :::.::: :..:........: : ::: : ..: .:::..
CCDS10 GQMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCV-EEKDSKARLV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB6 MGGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGG
. .::.:...:. .:. : .: :. ::::::. : :.: ....:::.:.:..:::
CCDS10 LTSGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGG
120 130 140 150 160 170
180 190 200 210
pF1KB6 ALLSCSCP--GNESKAGY--RAPRSYPK-SNSSKEYV
.:: :.:: :... . : : : : : . .::
CCDS10 GLLCCTCPSGGSQGPSHYMARYSTSAPAISRGPSEYPTKNYV
180 190 200 210 220
>>CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 (303 aa)
initn: 663 init1: 412 opt: 663 Z-score: 863.4 bits: 167.3 E(32554): 9e-42
Smith-Waterman score: 663; 43.8% identity (74.9% similar) in 219 aa overlap (1-211:86-303)
10 20 30
pF1KB6 MANSGLQLLGFSMALLGWVGLVACTAIPQW
:....:..::. . :.:: ::. ..:.:
CCDS13 GAKAPGPAQGAAQHGLGGSAGLRVRVSPLAMGSAALEILGLVLCLVGWGGLILACGLPMW
60 70 80 90 100 110
40 50 60 70 80 90
pF1KB6 QMSSYAGDNIITAQAMYKGLWMDCVTQSTGMMSCKMYDSVLALSAALQATRALMVVSLVL
:.... ::.:::. .:::::.::.:::: :.::.::::::::. .::.::: : ...:
CCDS13 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL
120 130 140 150 160 170
100 110 120 130 140 150
pF1KB6 GFLAMFVATMGMKCTRCGGDDKVKKARIAMGGGIIFIVAGLAALVACSWYGHQIVTDFYN
.:.:.::. : .:: : . .: ::.:. ::.... :: ::: :... .: .::.
CCDS13 AFVALFVTLAGAQCTTCVAPGPAK-ARVALTGGVLYLFCGLLALVPLCWFANIVVREFYD
180 190 200 210 220 230
160 170 180 190 200
pF1KB6 PLIPTNIKYEFGPAIFIGWAGSALVILGGALLSCS---CPGNES---KAGYRAPRSYPKS
: .:.. :::.: :..::::..::...:: :: :. : : . . : ::: .
CCDS13 PSVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTAT
240 250 260 270 280 290
210
pF1KB6 NS--SKEYV
.. .:.::
CCDS13 GDYDKKNYV
300
211 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 11:30:50 2016 done: Fri Nov 4 11:30:51 2016
Total Scan time: 1.750 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]