FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2160, 225 aa 1>>>pF1KE2160 225 - 225 aa - 225 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3994+/-0.000922; mu= 13.6130+/- 0.055 mean_var=66.3874+/-13.671, 0's: 0 Z-trim(105.6): 38 B-trim: 490 in 1/47 Lambda= 0.157410 statistics sampled from 8498 (8532) to 8498 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.62), E-opt: 0.2 (0.262), width: 16 Scan time: 2.000 The best scores are: opt bits E(32554) CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 ( 225) 1499 349.1 1.4e-96 CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 ( 224) 905 214.2 5.5e-56 CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 ( 220) 694 166.3 1.4e-41 CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 ( 217) 685 164.2 5.9e-41 CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 ( 220) 671 161.0 5.4e-40 CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 ( 209) 655 157.4 6.4e-39 CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 ( 303) 630 151.8 4.5e-37 CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 ( 211) 624 150.4 8.5e-37 CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 ( 211) 588 142.2 2.5e-34 CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 ( 239) 552 134.0 7.9e-32 CCDS44125.1 CLDN19 gene_id:149461|Hs108|chr1 ( 211) 549 133.3 1.1e-31 CCDS471.1 CLDN19 gene_id:149461|Hs108|chr1 ( 224) 549 133.3 1.2e-31 CCDS14524.1 CLDN2 gene_id:9075|Hs108|chrX ( 230) 503 122.9 1.7e-28 CCDS9476.1 CLDN10 gene_id:9071|Hs108|chr13 ( 228) 472 115.9 2.2e-26 CCDS54081.1 CLDN7 gene_id:1366|Hs108|chr17 ( 145) 452 111.2 3.5e-25 CCDS5717.1 CLDN15 gene_id:24146|Hs108|chr7 ( 228) 450 110.9 7.1e-25 CCDS54824.1 CLDN24 gene_id:100132463|Hs108|chr4 ( 220) 448 110.4 9.5e-25 CCDS9475.1 CLDN10 gene_id:9071|Hs108|chr13 ( 226) 446 109.9 1.3e-24 CCDS43286.1 CLDN22 gene_id:53842|Hs108|chr4 ( 220) 421 104.3 6.6e-23 CCDS5249.1 CLDN20 gene_id:49861|Hs108|chr6 ( 219) 418 103.6 1.1e-22 CCDS53306.1 CLDN19 gene_id:149461|Hs108|chr1 ( 218) 417 103.4 1.2e-22 CCDS44736.1 CLDN25 gene_id:644672|Hs108|chr11 ( 229) 350 88.1 4.9e-18 CCDS33862.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 338 85.4 3.6e-17 CCDS3095.1 CLDN18 gene_id:51208|Hs108|chr3 ( 261) 335 84.8 5.8e-17 CCDS3213.1 CLDN11 gene_id:5010|Hs108|chr3 ( 207) 253 66.1 1.9e-11 >>CCDS13587.1 CLDN8 gene_id:9073|Hs108|chr21 (225 aa) initn: 1499 init1: 1499 opt: 1499 Z-score: 1847.6 bits: 349.1 E(32554): 1.4e-96 Smith-Waterman score: 1499; 100.0% identity (100.0% similar) in 225 aa overlap (1-225:1-225) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA 130 140 150 160 170 180 190 200 210 220 pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV ::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV 190 200 210 220 >>CCDS13586.1 CLDN17 gene_id:26285|Hs108|chr21 (224 aa) initn: 954 init1: 901 opt: 905 Z-score: 1118.6 bits: 214.2 E(32554): 5.5e-56 Smith-Waterman score: 905; 57.9% identity (86.4% similar) in 214 aa overlap (1-214:1-210) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI :: . :.:::: :: .:::::.:.:..::::::::. .::.::: .::::::::.::: . CCDS13 MAFYPLQIAGLVLGFLGMVGTLATTLLPQWRVSAFVGSNIIVFERLWEGLWMNCIRQARV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL :.:::.:.::::: : :..::.:::.: ..:..:....: ::: ..:::.::..::..: CCDS13 RLQCKFYSSLLALPPALETARALMCVAVALSLIALLIGICGMKQVQCTGSNERAKAYLLG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA :.:..::.::. :::::::.:: ::::::: ....:::::: ::.:::..: ::..::. CCDS13 TSGVLFILTGIFVLIPVSWTANIIIRDFYNPAIHIGQKRELGAALFLGWASAAVLFIGGG 130 140 150 160 170 180 190 200 210 220 pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV :.: :::.:...::: .:..:. :: :. CCDS13 LLCGFCCCNRKKQGYRYPVPGYRVP----HTDKRRNTTMLSKTSTSYV 190 200 210 220 >>CCDS5559.1 CLDN3 gene_id:1365|Hs108|chr7 (220 aa) initn: 396 init1: 396 opt: 694 Z-score: 859.7 bits: 166.3 E(32554): 1.4e-41 Smith-Waterman score: 694; 44.8% identity (78.0% similar) in 223 aa overlap (3-225:2-220) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI . .:::.: :. .: .::.. ..:.::::::: .::.. .:.::::::::: :.. CCDS55 MSMGLEITGTALAVLGWLGTIVCCALPMWRVSAFIGSNIITSQNIWEGLWMNCVVQSTG 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL .::::.::::::: ::::::.:. .: ... .....:..: .:: :. :. .::.: . CCDS55 QMQCKVYDSLLALPQDLQAARALIVVAILLAAFGLLVALVGAQCTNCVQDDT-AKAKITI 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA .::..:.......:.:::: ::.::::::: .: :::::.: .::.::..: . ..::: CCDS55 VAGVLFLLAALLTLVPVSWSANTIIRDFYNPVVPEAQKREMGAGLYVGWAAAALQLLGGA 120 130 140 150 160 170 190 200 210 220 pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV :.:: : . ..: . . .. .: : . . :.:..:: CCDS55 LLCC--SCPPREKKYTATKVVY-SAPRSTGPGASLGTGYDRKDYV 180 190 200 210 220 >>CCDS10487.1 CLDN9 gene_id:9080|Hs108|chr16 (217 aa) initn: 407 init1: 388 opt: 685 Z-score: 848.8 bits: 164.2 E(32554): 5.9e-41 Smith-Waterman score: 685; 51.2% identity (78.3% similar) in 207 aa overlap (1-201:1-204) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI ::. .::. :. :. .: .::.. ..: :.:.::: :.::: . ::::::.:: :.. CCDS10 MASTGLELLGMTLAVLGWLGTLVSCALPLWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL .::::.::::::: ::::::.: : ....:....:: : .:: :. : : .::.:.: CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLLALLGLLVAITGAQCTTCVED-EGAKARIVL 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA :::.:....:..::::: :.:.:::.:::: .: : ::::: .:::::..: .:..::. CCDS10 TAGVILLLAGILVLIPVCWTAHAIIQDFYNPLVAEALKRELGASLYLGWAAAALLMLGGG 120 130 140 150 160 170 190 200 210 220 pF1KE2 LFCCVFCCN----EKSSSYR--YSIPSHRTTQKSYHTGKKSPSVYSRSQYV :.::. : :. . : ::::: CCDS10 LLCCT--CPPPQVERPRGPRLGYSIPSRSGASGLDKRDYV 180 190 200 210 >>CCDS10488.1 CLDN6 gene_id:9074|Hs108|chr16 (220 aa) initn: 357 init1: 330 opt: 671 Z-score: 831.5 bits: 161.0 E(32554): 5.4e-40 Smith-Waterman score: 671; 44.9% identity (76.0% similar) in 225 aa overlap (1-225:1-220) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI ::. ...: :. : .: :. .. ..:.:.:.::: :.::: . ::::::.:: :.. CCDS10 MASAGMQILGVVLTLLGWVNGLVSCALPMWKVTAFIGNSIVVAQVVWEGLWMSCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL .::::.::::::: ::::::.: : ......... . : ::: :. .... ::...: CCDS10 QMQCKVYDSLLALPQDLQAARALCVIALLVALFGLLVYLAGAKCTTCVEEKDS-KARLVL 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA :.::.:.:.:...:::: :.:.:::::::: .: ::::::: .:::::... .:..::. CCDS10 TSGIVFVISGVLTLIPVCWTAHAIIRDFYNPLVAEAQKRELGASLYLGWAASGLLLLGGG 120 130 140 150 160 170 190 200 210 220 pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV :.::. : . :.. . . . :. . : :: : ..:: CCDS10 LLCCT-CPSGGSQGPSHYMARYSTSAPAISRG---PSEYPTKNYV 180 190 200 210 220 >>CCDS5560.1 CLDN4 gene_id:1364|Hs108|chr7 (209 aa) initn: 396 init1: 396 opt: 655 Z-score: 812.2 bits: 157.4 E(32554): 6.4e-39 Smith-Waterman score: 655; 45.3% identity (80.1% similar) in 201 aa overlap (1-198:1-198) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI ::. .:.. :. :. .: .... ..:.:::.::: .:::. ...::::::::: :.. CCDS55 MASMGLQVMGIALAVLGWLAVMLCCALPMWRVTAFIGSNIVTSQTIWEGLWMNCVVQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL .::::.::::::: ::::::.:. . ... :. .....: ::: : : :..::. .. CCDS55 QMQCKVYDSLLALPQDLQAARALVIISIIVAALGVLLSVVGGKCTNCLED-ESAKAKTMI 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA .::..:...:..:..::::.:. ::.:::: .: .::::.: .::.::... .:..::. CCDS55 VAGVVFLLAGLMVIVPVSWTAHNIIQDFYNPLVASGQKREMGASLYVGWAASGLLLLGGG 120 130 140 150 160 170 190 200 210 220 pF1KE2 LFCCVFCC---NEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV :.:: : ..: : .:: CCDS55 LLCC--NCPPRTDKPYSAKYSAARSAAASNYV 180 190 200 >>CCDS13763.2 CLDN5 gene_id:7122|Hs108|chr22 (303 aa) initn: 614 init1: 359 opt: 630 Z-score: 779.1 bits: 151.8 E(32554): 4.5e-37 Smith-Waterman score: 630; 42.3% identity (76.1% similar) in 213 aa overlap (1-209:86-297) 10 20 30 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQW :.. :::: :: : :: : . . .:.: CCDS13 GAKAPGPAQGAAQHGLGGSAGLRVRVSPLAMGSAALEILGLVLCLVGWGGLILACGLPMW 60 70 80 90 100 110 40 50 60 70 80 90 pF1KE2 RVSAFIENNIVVFENFWEGLWMNCVRQANIRMQCKIYDSLLALSPDLQAARGLMCAASVM .:.::...:::. .. :.::::.:: :.. .::::.:::.:::: ..::::.: .: .. CCDS13 QVTAFLDHNIVTAQTTWKGLWMSCVVQSTGHMQCKVYDSVLALSTEVQAARALTVSAVLL 120 130 140 150 160 170 100 110 120 130 140 150 pF1KE2 SFLAFMMAILGMKCTRCTGDNEKVKAHILLTAGIIFIITGMVVLIPVSWVANAIIRDFYN .:.:..... : .:: :.. . .::.. ::.:..... :...:.:. : :: ..:.::. CCDS13 AFVALFVTLAGAQCTTCVAPGP-AKARVALTGGVLYLFCGLLALVPLCWFANIVVREFYD 180 190 200 210 220 230 160 170 180 190 200 pF1KE2 SIVNVAQKRELGEALYLGWTTALVLIVGGALFCC--VFCCNEKSSSY--RYSIPSHRTTQ : :.:: ::: :::.::... .:.::: :.:: : .. . :. .:: : . :. CCDS13 PSVPVSQKYELGAALYIGWAATALLMVGGCLLCCGAWVCTGRPDLSFPVKYSAPRRPTAT 240 250 260 270 280 290 210 220 pF1KE2 KSYHTGKKSPSVYSRSQYV .: CCDS13 GDYDKKNYV 300 >>CCDS11096.1 CLDN7 gene_id:1366|Hs108|chr17 (211 aa) initn: 620 init1: 620 opt: 624 Z-score: 774.1 bits: 150.4 E(32554): 8.5e-37 Smith-Waterman score: 624; 42.1% identity (77.0% similar) in 209 aa overlap (1-207:1-209) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI ::. .:.. :. .. .: :: :: :..:::..:.. .::.. . ...::::.:: :.. CCDS11 MANSGLQLLGFSMALLGWVGLVACTAIPQWQMSSYAGDNIITAQAMYKGLWMDCVTQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL :.::.:::.:::: :::.:.:: .. :..:::...: .::::::: ::.. ::.: . CCDS11 MMSCKMYDSVLALSAALQATRALMVVSLVLGFLAMFVATMGMKCTRCGGDDKVKKARIAM 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA .:::::..:...:. :: .. :. :::: .. . : :.: :...::. . ..:.::: CCDS11 GGGIIFIVAGLAALVACSWYGHQIVTDFYNPLIPTNIKYEFGPAIFIGWAGSALVILGGA 130 140 150 160 170 180 190 200 210 220 pF1KE2 LFCCVFCCNEKSSSYRY--SIPSHRTTQKSYHTGKKSPSVYSRSQYV :. : ::....:: : :. .... CCDS11 LLSCSCPGNESKAGYRVPRSYPKSNSSKEYV 190 200 210 >>CCDS3295.1 CLDN1 gene_id:9076|Hs108|chr3 (211 aa) initn: 567 init1: 567 opt: 588 Z-score: 729.9 bits: 142.2 E(32554): 2.5e-34 Smith-Waterman score: 588; 37.5% identity (75.5% similar) in 208 aa overlap (1-208:1-206) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI ::. .:.. :..:. .: .:... :..::::. .. .:::. . ..:::::.:: :.. CCDS32 MANAGLQLLGFILAFLGWIGAIVSTALPQWRIYSYAGDNIVTAQAMYEGLWMSCVSQSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL ..:::..:::: :: :::.:.:: .. ... .:...: .:::: .: :.: : .. . CCDS32 QIQCKVFDSLLNLSSTLQATRALMVVGILLGVIAIFVATVGMKCMKCLEDDEVQKMRMAV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA .: ::...:...:. ..: .: :...::. .. : . :.:.::. ::..: . ..::: CCDS32 IGGAIFLLAGLAILVATAWYGNRIVQEFYDPMTPVNARYEFGQALFTGWAAASLCLLGGA 130 140 150 160 170 180 190 200 210 220 pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGKKSPSVYSRSQYV :.:: : .:..:: : . . .: CCDS32 LLCC--SCPRKTTSYPTPRPYPKPAPSSGKDYV 190 200 210 >>CCDS13645.1 CLDN14 gene_id:23562|Hs108|chr21 (239 aa) initn: 532 init1: 349 opt: 552 Z-score: 684.9 bits: 134.0 E(32554): 7.9e-32 Smith-Waterman score: 552; 37.1% identity (73.8% similar) in 221 aa overlap (1-219:1-217) 10 20 30 40 50 60 pF1KE2 MATHALEIAGLFLGGVGMVGTVAVTVMPQWRVSAFIENNIVVFENFWEGLWMNCVRQANI ::. :... :..:. .:::::. .:..:.:: .: . .::.. .. .::::.:: ... CCDS13 MASTAVQLLGFLLSFLGMVGTLITTILPHWRRTAHVGTNILTAVSYLKGLWMECVWHSTG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RMQCKIYDSLLALSPDLQAARGLMCAASVMSFLAFMMAILGMKCTRCTGDNEKVKAHILL .::.:: ::::: ::::::.:: . ..: .: :..:::::::. . .:. . . CCDS13 IYQCQIYRSLLALPQDLQAARALMVISCLLSGIACACAVIGMKCTRCA-KGTPAKTTFAI 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 TAGIIFIITGMVVLIPVSWVANAIIRDFYNSIVNVAQKRELGEALYLGWTTALVLIVGGA .: .::..:.. .. :::..: ....::: .. ..: :.:.:::::. .. . ..::. CCDS13 LGGTLFILAGLLCMVAVSWTTNDVVQNFYNPLLPSGMKFEIGQALYLGFISSSLSLIGGT 120 130 140 150 160 170 190 200 210 220 pF1KE2 LFCCVFCCNEKSSSYRYSIPSHRTTQKSYHTGK--KSPSVYSRSQYV :.: . :.... :. : :.: . .:. . :..: CCDS13 LLC--LSCQDEAPYRPYQAPP-RATTTTANTAPAYQPPAAYKDNRAPSVTSATHSGYRLN 180 190 200 210 220 230 CCDS13 DYV 225 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 00:42:14 2016 done: Mon Nov 7 00:42:14 2016 Total Scan time: 2.000 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]