FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2160, 225 aa
1>>>pF1KE2160 225 - 225 aa - 225 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3994+/-0.000922; mu= 13.6130+/- 0.055
mean_var=66.3874+/-13.671, 0's: 0 Z-trim(105.6): 38 B-trim: 490 in 1/47
Lambda= 0.157410
statistics sampled from 8498 (8532) to 8498 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.62), E-opt: 0.2 (0.262), width: 16
Scan time: 2.000
The best scores are: opt bits E(32554)
CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 1499 349.1 1.4e-96
CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 905 214.2 5.5e-56
CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 694 166.3 1.4e-41
CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 685 164.2 5.9e-41
CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 671 161.0 5.4e-40
CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 655 157.4 6.4e-39
CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 630 151.8 4.5e-37
CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 624 150.4 8.5e-37
CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 588 142.2 2.5e-34
CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 552 134.0 7.9e-32
CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 549 133.3 1.1e-31
CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 549 133.3 1.2e-31
CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 503 122.9 1.7e-28
CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 472 115.9 2.2e-26
CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 452 111.2 3.5e-25
CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 450 110.9 7.1e-25
CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 448 110.4 9.5e-25
CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 446 109.9 1.3e-24
CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 421 104.3 6.6e-23
CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 418 103.6 1.1e-22
CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 417 103.4 1.2e-22
CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 350 88.1 4.9e-18
CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 338 85.4 3.6e-17
CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 335 84.8 5.8e-17
CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 253 66.1 1.9e-11
>>CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 (225 aa)
initn: 1499 init1: 1499 opt: 1499 Z-score: 1847.6 bits: 349.1 E(32554): 1.4e-96
Smith-Waterman score: 1499; 100.0% identity (100.0% similar) in 225 aa overlap (1-225:1-225)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
130 140 150 160 170 180
190 200 210 220
pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
:::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
190 200 210 220
>>CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 (224 aa)
initn: 954 init1: 901 opt: 905 Z-score: 1118.6 bits: 214.2 E(32554): 5.5e-56
Smith-Waterman score: 905; 57.9% identity (86.4% similar) in 214 aa overlap (1-214:1-210)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
:: . :.:::: :: .:::::.:.:..::::::::. .::.::: .::::::::.::: .
CCDS13 MAFYPLQIAGLVLGFLGMVGTLATTLLPQWRVSAFVGSNIIVFERLWEGLWMNCIRQARV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
:.:::.:.::::: : :..::.:::.: ..:..:....: ::: ..:::.::..::..:
CCDS13 RLQCKFYSSLLALPPALETARALMCVAVALSLIALLIGICGMKQVQCTGSNERAKAYLLG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
:.:..::.::. :::::::.:: ::::::: ....:::::: ::.:::..: ::..::.
CCDS13 TSGVLFILTGIFVLIPVSWTANIIIRDFYNPAIHIGQKRELGAALFLGWASAAVLFIGGG
130 140 150 160 170 180
190 200 210 220
pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
:.: :::.:...::: .:..:. :: :.
CCDS13 LLCGFCCCNRKKQGYRYPVPGYRVP----HTDKRRNTTMLSKTSTSYV
190 200 210 220
>>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa)
initn: 396 init1: 396 opt: 694 Z-score: 859.7 bits: 166.3 E(32554): 1.4e-41
Smith-Waterman score: 694; 44.8% identity (78.0% similar) in 223 aa overlap (3-225:2-220)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
. .:::.: :. .: .::.. ..:.::::::: .::.. .:.::::::::: :..
CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG
10 20 30 40 50
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
.::::.::::::: ::::::.:. .: ... .....:..: .:: :. :. .::.: .
CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDT-AKAKITI
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
.::..:.......:.:::: ::.::::::: .: :::::.: .::.::..: . ..:::
CCDS55 VAGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGA
120 130 140 150 160 170
190 200 210 220
pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
:.:: : . ..: . . .. .: : . . :.:..::
CCDS55 LLCC--SCPPREKKYTATKVVY-SAPRSTGPGASLGTGYDRKDYV
180 190 200 210 220
>>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa)
initn: 407 init1: 388 opt: 685 Z-score: 848.8 bits: 164.2 E(32554): 5.9e-41
Smith-Waterman score: 685; 51.2% identity (78.3% similar) in 207 aa overlap (1-201:1-204)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
::. .::. :. :. .: .::.. ..: :.:.::: :.::: . ::::::.:: :..
CCDS10 MASTGLELLGMTLAVLGWLGTLVSCALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
.::::.::::::: ::::::.: : ....:....:: : .:: :. : : .::.:.:
CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCVED-EGAKARIVL
70 80 90 100 110
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
:::.:....:..::::: :.:.:::.:::: .: : ::::: .:::::..: .:..::.
CCDS10 TAGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGGG
120 130 140 150 160 170
190 200 210 220
pF1KE2 LFCCVFCCN----EKSSSYR--YSIPSHRTTQKSYHTGKKSPSVYSRSQYV
:.::. : :. . : :::::
CCDS10 LLCCT--CPPPQVERPRGPRLGYSIPSRSGASGLDKRDYV
180 190 200 210
>>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa)
initn: 357 init1: 330 opt: 671 Z-score: 831.5 bits: 161.0 E(32554): 5.4e-40
Smith-Waterman score: 671; 44.9% identity (76.0% similar) in 225 aa overlap (1-225:1-220)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
::. ...: :. : .: :. .. ..:.:.:.::: :.::: . ::::::.:: :..
CCDS10 MASAGMQILGVVLTLLGWVNGLVSCALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
.::::.::::::: ::::::.: : ......... . : ::: :. .... ::...:
CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCVEEKDS-KARLVL
70 80 90 100 110
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
:.::.:.:.:...:::: :.:.:::::::: .: ::::::: .:::::... .:..::.
CCDS10 TSGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGGG
120 130 140 150 160 170
190 200 210 220
pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
:.::. : . :.. . . . :. . : :: : ..::
CCDS10 LLCCT-CPSGGSQGPSHYMARYSTSAPAISRG---PSEYPTKNYV
180 190 200 210 220
>>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa)
initn: 396 init1: 396 opt: 655 Z-score: 812.2 bits: 157.4 E(32554): 6.4e-39
Smith-Waterman score: 655; 45.3% identity (80.1% similar) in 201 aa overlap (1-198:1-198)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
::. .:.. :. :. .: .... ..:.:::.::: .:::. ...::::::::: :..
CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
.::::.::::::: ::::::.:. . ... :. .....: ::: : : :..::. ..
CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCLED-ESAKAKTMI
70 80 90 100 110
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
.::..:...:..:..::::.:. ::.:::: .: .::::.: .::.::... .:..::.
CCDS55 VAGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGG
120 130 140 150 160 170
190 200 210 220
pF1KE2 LFCCVFCC---NEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
:.:: : ..: : .::
CCDS55 LLCC--NCPPRTDKPYSAKYSAARSAAASNYV
180 190 200
>>CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 (303 aa)
initn: 614 init1: 359 opt: 630 Z-score: 779.1 bits: 151.8 E(32554): 4.5e-37
Smith-Waterman score: 630; 42.3% identity (76.1% similar) in 213 aa overlap (1-209:86-297)
10 20 30
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQW
:.. :::: :: : :: : . . .:.:
CCDS13 GAKAPGPAQGAAQHGLGGSAGLRVRVSPLAMGSAALEILGLVLCLVGWGGLILACGLPMW
60 70 80 90 100 110
40 50 60 70 80 90
pF1KE2 RVSAFIENNIVVFENFWEGLWMNCVRQANIRMQCKIYDSLLALSPDLQAARGLMCAASVM
.:.::...:::. .. :.::::.:: :.. .::::.:::.:::: ..::::.: .: ..
CCDS13 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL
120 130 140 150 160 170
100 110 120 130 140 150
pF1KE2 SFLAFMMAILGMKCTRCTGDNEKVKAHILLTAGIIFIITGMVVLIPVSWVANAIIRDFYN
.:.:..... : .:: :.. . .::.. ::.:..... :...:.:. : :: ..:.::.
CCDS13 AFVALFVTLAGAQCTTCVAPGP-AKARVALTGGVLYLFCGLLALVPLCWFANIVVREFYD
180 190 200 210 220 230
160 170 180 190 200
pF1KE2 SIVNVAQKRELGEALYLGWTTALVLIVGGALFCC--VFCCNEKSSSY--RYSIPSHRTTQ
: :.:: ::: :::.::... .:.::: :.:: : .. . :. .:: : . :.
CCDS13 PSVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTAT
240 250 260 270 280 290
210 220
pF1KE2 KSYHTGKKSPSVYSRSQYV
.:
CCDS13 GDYDKKNYV
300
>>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa)
initn: 620 init1: 620 opt: 624 Z-score: 774.1 bits: 150.4 E(32554): 8.5e-37
Smith-Waterman score: 624; 42.1% identity (77.0% similar) in 209 aa overlap (1-207:1-209)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
::. .:.. :. .. .: :: :: :..:::..:.. .::.. . ...::::.:: :..
CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
:.::.:::.:::: :::.:.:: .. :..:::...: .::::::: ::.. ::.: .
CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
.:::::..:...:. :: .. :. :::: .. . : :.: :...::. . ..:.:::
CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA
130 140 150 160 170 180
190 200 210 220
pF1KE2 LFCCVFCCNEKSSSYRY--SIPSHRTTQKSYHTGKKSPSVYSRSQYV
:. : ::....:: : :. ....
CCDS11 LLSCSCPGNESKAGYRVPRSYPKSNSSKEYV
190 200 210
>>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa)
initn: 567 init1: 567 opt: 588 Z-score: 729.9 bits: 142.2 E(32554): 2.5e-34
Smith-Waterman score: 588; 37.5% identity (75.5% similar) in 208 aa overlap (1-208:1-206)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
::. .:.. :..:. .: .:... :..::::. .. .:::. . ..:::::.:: :..
CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
..:::..:::: :: :::.:.:: .. ... .:...: .:::: .: :.: : .. .
CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKCMKCLEDDEVQKMRMAV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
.: ::...:...:. ..: .: :...::. .. : . :.:.::. ::..: . ..:::
CCDS32 IGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGGA
130 140 150 160 170 180
190 200 210 220
pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV
:.:: : .:..:: : . . .:
CCDS32 LLCC--SCPRKTTSYPTPRPYPKPAPSSGKDYV
190 200 210
>>CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 (239 aa)
initn: 532 init1: 349 opt: 552 Z-score: 684.9 bits: 134.0 E(32554): 7.9e-32
Smith-Waterman score: 552; 37.1% identity (73.8% similar) in 221 aa overlap (1-219:1-217)
10 20 30 40 50 60
pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI
::. :... :..:. .:::::. .:..:.:: .: . .::.. .. .::::.:: ...
CCDS13 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL
.::.:: ::::: ::::::.:: . ..: .: :..:::::::. . .:. . .
CCDS13 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCA-KGTPAKTTFAI
70 80 90 100 110
130 140 150 160 170 180
pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA
.: .::..:.. .. :::..: ....::: .. ..: :.:.:::::. .. . ..::.
CCDS13 LGGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGT
120 130 140 150 160 170
190 200 210 220
pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGK--KSPSVYSRSQYV
:.: . :.... :. : :.: . .:. . :..:
CCDS13 LLC--LSCQDEAPYRPYQAPP-RATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLN
180 190 200 210 220 230
CCDS13 DYV
225 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 00:42:14 2016 done: Mon Nov 7 00:42:14 2016
Total Scan time: 2.000 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]