FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6236, 239 aa 1>>>pF1KE6236 239 - 239 aa - 239 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6773+/-0.000752; mu= 13.8615+/- 0.046 mean_var=82.6424+/-16.647, 0's: 0 Z-trim(110.5): 38 B-trim: 44 in 1/50 Lambda= 0.141082 statistics sampled from 11646 (11684) to 11646 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.718), E-opt: 0.2 (0.359), width: 16 Scan time: 2.010 The best scores are: opt bits E(32554) CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 1598 334.2 4.6e-92 CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 741 159.8 1.4e-39 CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 661 143.5 1.1e-34 CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 651 141.4 4.6e-34 CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 649 141.0 5.8e-34 CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 639 139.0 2.5e-33 CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 631 137.4 7.3e-33 CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 630 137.2 8.6e-33 CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 623 135.7 2.3e-32 CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 606 132.3 2.6e-31 CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 580 127.0 1e-29 CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 558 122.5 2.3e-28 CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 558 122.6 2.9e-28 CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 552 121.3 5.4e-28 CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 462 103.0 1.8e-22 CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 442 98.9 2.9e-21 CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 435 97.5 8e-21 CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 417 93.7 7e-20 CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 392 88.7 3.3e-18 CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 373 84.9 5e-17 CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 369 84.0 8.6e-17 CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 352 80.6 9.7e-16 CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 334 77.0 1.4e-14 CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 323 74.7 6.5e-14 CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 293 68.6 3.7e-12 >>CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 (239 aa) initn: 1598 init1: 1598 opt: 1598 Z-score: 1766.4 bits: 334.2 E(32554): 4.6e-92 Smith-Waterman score: 1598; 100.0% identity (100.0% similar) in 239 aa overlap (1-239:1-239) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LCLSCQDEAPYRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLNDYV ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LCLSCQDEAPYRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLNDYV 190 200 210 220 230 >>CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX (230 aa) initn: 766 init1: 707 opt: 741 Z-score: 823.9 bits: 159.8 E(32554): 1.4e-39 Smith-Waterman score: 741; 47.8% identity (78.3% similar) in 230 aa overlap (1-226:1-227) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG ::: ..::.:..:..::..:::.. .:: :. ...::..:.:::.. :::::::. :::: CCDS14 MASLGLQLVGYILGLLGLLGTLVAMLLPSWKTSSYVGASIVTAVGFSKGLWMECATHSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL : ::.:: .::.:: :.:::.:.:: : .:..:: .:.::.:: . . :: :. CCDS14 ITQCDIYSTLLGLPADIQAAQAMMVTSSAISSLACIISVVGMRCTVFCQESRAKDRVAVA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL ::..:::.::: .. :.:. . ....::.::.:..::::::.:::::.::: .:::.: . CCDS14 GGVFFILGGLLGFIPVAWNLHGILRDFYSPLVPDSMKFEIGEALYLGIISSLFSLIAGII 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LCLSCQDEAP----YRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLN ::.::... : ::: : :: .. :. ::: . .. . :.: CCDS14 LCFSCSSQRNRSNYYDAYQAQPLATRSSPR--PG-QPPKVKSEFNSYSLTGYV 190 200 210 220 230 pF1KE6 DYV >>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa) initn: 708 init1: 643 opt: 661 Z-score: 736.5 bits: 143.5 E(32554): 1.1e-34 Smith-Waterman score: 661; 45.9% identity (77.3% similar) in 207 aa overlap (1-207:1-206) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG ::: ..:..:. :. :: ..... :: :: :: .:.::.:. . .::::.:: .::: CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL .::..: :::::::::::::::..:: ...... .:.: ::: : . ::. :. CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCLEDESAKAKTMIV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL .:..:.::::. .: ::::.....:.:::::. ::.: :.: .::.:. .:.: :.:: : CCDS55 AGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGGL 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LCLSCQDEAPYRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLNDYV :: .: .. .::.: :. ..: . CCDS55 LCCNCPPRTD-KPYSAKYSAARSAAASNYV 190 200 >>CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 (224 aa) initn: 669 init1: 386 opt: 651 Z-score: 725.1 bits: 141.4 E(32554): 4.6e-34 Smith-Waterman score: 651; 44.8% identity (75.1% similar) in 221 aa overlap (1-218:1-219) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG ::....::::..:.. : :: . .: ::.:......: :.:::. .:::: :. .::: CCDS47 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTP-AKTTFAI ::..: ::::: .:.::::::.. ::. .: . .:.:::::: . ..: :: :: CCDS47 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 LGGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGT ::.::::::: ..:::: .. :.:.:.:: : . ..:.: ::..:. :..:...::. CCDS47 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 LLCLSCQDEAPYRPYQAP-P-RATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLND .:: .: . : :: ..: : : ..: :. . ::. : CCDS47 FLCCTCPE--PERPNSSPQPYRPGPSAAAREPVVKLPASAKGPLGV 190 200 210 220 pF1KE6 YV >>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa) initn: 639 init1: 386 opt: 649 Z-score: 723.2 bits: 141.0 E(32554): 5.8e-34 Smith-Waterman score: 653; 44.8% identity (72.4% similar) in 221 aa overlap (1-219:1-209) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG ::....:::::.:.::: .:....: ::.:: ...: ::.:: .. .:::: :: .::: CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPA-KTTFAI ::... ::: : . :::.:::::.. ::. :: :..:::: .: . . : .:. CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKCMKCLEDDEVQKMRMAV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 LGGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGT .::..:.:::: .::..: : .::.::.:. : . ..:.::::. :. ..:: :.::. CCDS32 IGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGGA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 LLCLSCQDEAPYRPYQAPPRATTTTANTAPAYQP-PAAYKDNRAPSVTSATHSGYRLNDY ::: :: :: ::. . : .: :.. :: CCDS32 LLCCSC------------PRKTTSYPTPRPYPKPAPSSGKDYV 190 200 210 pF1KE6 V >>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa) initn: 683 init1: 629 opt: 639 Z-score: 712.0 bits: 139.0 E(32554): 2.5e-33 Smith-Waterman score: 648; 42.2% identity (71.3% similar) in 237 aa overlap (3-239:2-220) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG : .... : :. :: .::.. :: :: .: .:.::.:. . .::::.:: .::: CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL .::..: :::::::::::::::.:.. ::.... :..: .:: :.. ::. ..:. CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDTAKAKITIV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL .:.::.::.:: .: :::..: ....::::..: ..: :.: .::.:. ...:.:.::.: CCDS55 AGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGAL 120 130 140 150 160 170 190 200 210 220 230 pF1KE6 LCLSCQDEAPYRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLNDYV :: :: ::: :: : .:. : :. . .. .:: .::: CCDS55 LCCSC-----------PPREKKYTA-TKVVYSAP------RSTGPGASLGTGYDRKDYV 180 190 200 210 220 >>CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 (211 aa) initn: 642 init1: 386 opt: 631 Z-score: 703.4 bits: 137.4 E(32554): 7.3e-33 Smith-Waterman score: 631; 46.5% identity (77.8% similar) in 198 aa overlap (1-197:1-196) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG ::....::::..:.. : :: . .: ::.:......: :.:::. .:::: :. .::: CCDS44 MANSGLQLLGYFLALGGWVGIIASTALPQWKQSSYAGDAIITAVGLYEGLWMSCASQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTP-AKTTFAI ::..: ::::: .:.::::::.. ::. .: . .:.:::::: . ..: :: :: CCDS44 QVQCKLYDSLLALDGHIQSARALMVVAVLLGFVAMVLSVVGMKCTRVGDSNPIAKGRVAI 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 LGGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGT ::.::::::: ..:::: .. :.:.:.:: : . ..:.: ::..:. :..:...::. CCDS44 AGGALFILAGLCTLTAVSWYATLVTQEFFNPSTPVNARYEFGPALFVGWASAGLAVLGGS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 LLCLSCQDEAPYRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLNDYV .:: .: . : :: ..: CCDS44 FLCCTCPE--PERPNSSPQPYRPGPSAAAREYV 190 200 210 >>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa) initn: 623 init1: 623 opt: 630 Z-score: 702.2 bits: 137.2 E(32554): 8.6e-33 Smith-Waterman score: 630; 45.6% identity (73.8% similar) in 206 aa overlap (1-200:1-206) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG ::::...:::. :. :: .:::.. :: :. :: .:..:..: .:::: :: .::: CCDS10 MASTGLELLGMTLAVLGWLGTLVSCALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL .::..: ::::::::::::::: ::. ::. .. :. : .:: :.. ::. ... CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCVEDEGAKARIVLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL .:....:::.: .. : ::.. ..:.:::::. ..: :.: .::::. ...: ..:: : CCDS10 AGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGGGL 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LCLSC---QDEAPYRP---YQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYR :: .: : : : : :. : :. CCDS10 LCCTCPPPQVERPRGPRLGYSIPSRSGASGLDKRDYV 190 200 210 >>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa) initn: 396 init1: 396 opt: 623 Z-score: 694.6 bits: 135.7 E(32554): 2.3e-32 Smith-Waterman score: 623; 44.0% identity (77.8% similar) in 207 aa overlap (1-203:1-207) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG ::....::::: ...:: :: . : .:.:. ....: ::.:: .. :::::.:: .::: CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTT-FAI ...:..: :.::: :::.:::::.: .:. .: :..:::::::. .: . .:. CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 LGGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGT :: .::.::: .:: :: ...: .:::::.:...:.:.: :...:. .:.: ..::. CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 LLCLSC---QDEAPYRPYQAPPRATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLN :: :: ...: :: .. :..... CCDS11 LLSCSCPGNESKAGYRVPRSYPKSNSSKEYV 190 200 210 >>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa) initn: 614 init1: 586 opt: 606 Z-score: 675.7 bits: 132.3 E(32554): 2.6e-31 Smith-Waterman score: 606; 41.7% identity (72.0% similar) in 218 aa overlap (1-217:1-214) 10 20 30 40 50 60 pF1KE6 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG :::...:.:: .:..:: :. :.. :: :. :: .:..:..: .:::: :: .::: CCDS10 MASAGMQILGVVLTLLGWVNGLVSCALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCAKGTPAKTTFAIL .::..: ::::::::::::::: ::. :.. .. . : ::: :.. .:. ... CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCVEEKDSKARLVLT 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGTL .: .:...:.: .. : ::.. ....:::::. ..: :.: .::::. .:.: :.:: : CCDS10 SGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGGGL 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LCLSCQDEAPYRPYQAPPRATTTTANTAPAY-QPPAAYKDNRAPSVTSATHSGYRLNDYV :: .: : :.: . . ...::: . :. : CCDS10 LCCTC----PSGGSQGPSHYMARYSTSAPAISRGPSEYPTKNYV 190 200 210 220 239 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 11:20:17 2016 done: Tue Nov 8 11:20:17 2016 Total Scan time: 2.010 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]