FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5757, 814 aa 1>>>pF1KB5757 814 - 814 aa - 814 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3933+/-0.000825; mu= 11.3372+/- 0.050 mean_var=116.3001+/-23.372, 0's: 0 Z-trim(111.7): 191 B-trim: 411 in 1/50 Lambda= 0.118928 statistics sampled from 12424 (12617) to 12424 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.722), E-opt: 0.2 (0.388), width: 16 Scan time: 4.910 The best scores are: opt bits E(32554) CCDS10976.1 CDH15 gene_id:1013|Hs108|chr16 ( 814) 5490 953.0 0 CCDS58784.1 CDH4 gene_id:1002|Hs108|chr20 ( 842) 2082 368.3 3e-101 CCDS13488.1 CDH4 gene_id:1002|Hs108|chr20 ( 916) 2082 368.3 3.2e-101 CCDS77172.1 CDH2 gene_id:1000|Hs108|chr18 ( 875) 2061 364.7 3.7e-100 CCDS11891.1 CDH2 gene_id:1000|Hs108|chr18 ( 906) 2061 364.7 3.9e-100 CCDS10803.1 CDH11 gene_id:1009|Hs108|chr16 ( 796) 1381 248.0 4.6e-65 CCDS11993.1 CDH7 gene_id:1005|Hs108|chr18 ( 785) 1342 241.3 4.6e-63 CCDS10802.1 CDH8 gene_id:1006|Hs108|chr16 ( 799) 1312 236.2 1.7e-61 CCDS3890.1 CDH12 gene_id:1010|Hs108|chr5 ( 794) 1295 233.3 1.3e-60 CCDS11977.1 CDH20 gene_id:28316|Hs108|chr18 ( 801) 1286 231.7 3.7e-60 CCDS3894.1 CDH6 gene_id:1004|Hs108|chr5 ( 790) 1285 231.6 4.1e-60 CCDS10869.1 CDH1 gene_id:999|Hs108|chr16 ( 882) 1283 231.2 5.7e-60 CCDS81992.1 CDH11 gene_id:1009|Hs108|chr16 ( 670) 1273 229.5 1.5e-59 CCDS9586.1 CDH24 gene_id:64403|Hs108|chr14 ( 781) 1273 229.5 1.7e-59 CCDS3889.1 CDH18 gene_id:1016|Hs108|chr5 ( 790) 1261 227.4 7.1e-59 CCDS82004.1 CDH3 gene_id:1001|Hs108|chr16 ( 784) 1249 225.4 3e-58 CCDS10868.1 CDH3 gene_id:1001|Hs108|chr16 ( 829) 1249 225.4 3.1e-58 CCDS3893.1 CDH9 gene_id:1007|Hs108|chr5 ( 789) 1243 224.4 6.1e-58 CCDS11893.1 DSC2 gene_id:1824|Hs108|chr18 ( 847) 1230 222.1 3e-57 CCDS11892.1 DSC2 gene_id:1824|Hs108|chr18 ( 901) 1230 222.1 3.2e-57 CCDS32810.1 DSC3 gene_id:1825|Hs108|chr18 ( 896) 1205 217.9 6.2e-56 CCDS10804.1 CDH5 gene_id:1003|Hs108|chr16 ( 784) 1168 211.5 4.5e-54 CCDS11895.1 DSC1 gene_id:1823|Hs108|chr18 ( 840) 1055 192.1 3.3e-48 CCDS11894.1 DSC1 gene_id:1823|Hs108|chr18 ( 894) 1055 192.1 3.5e-48 CCDS82991.1 CDH12 gene_id:1010|Hs108|chr5 ( 754) 1052 191.6 4.3e-48 CCDS13485.1 CDH26 gene_id:60437|Hs108|chr20 ( 832) 988 180.6 9.4e-45 CCDS11898.1 DSG3 gene_id:1830|Hs108|chr18 ( 999) 983 179.8 2e-44 CCDS82259.1 CDH7 gene_id:1005|Hs108|chr18 ( 630) 922 169.2 1.9e-41 CCDS81993.1 CDH11 gene_id:1009|Hs108|chr16 ( 693) 900 165.5 2.8e-40 CCDS58487.1 CDH13 gene_id:1012|Hs108|chr16 ( 674) 886 163.1 1.4e-39 CCDS58486.1 CDH13 gene_id:1012|Hs108|chr16 ( 713) 886 163.1 1.5e-39 CCDS58485.1 CDH13 gene_id:1012|Hs108|chr16 ( 760) 886 163.1 1.6e-39 CCDS42423.1 DSG2 gene_id:1829|Hs108|chr18 (1118) 790 146.7 2.1e-34 CCDS11897.1 DSG4 gene_id:147409|Hs108|chr18 (1040) 775 144.1 1.1e-33 CCDS45845.1 DSG4 gene_id:147409|Hs108|chr18 (1059) 775 144.1 1.2e-33 CCDS75229.1 CDH18 gene_id:1016|Hs108|chr5 ( 575) 768 142.8 1.6e-33 CCDS54835.1 CDH18 gene_id:1016|Hs108|chr5 ( 574) 767 142.6 1.8e-33 CCDS11896.1 DSG1 gene_id:1828|Hs108|chr18 (1049) 746 139.1 3.6e-32 CCDS58472.1 CDH16 gene_id:1014|Hs108|chr16 ( 732) 713 133.4 1.3e-30 CCDS3892.1 CDH10 gene_id:1008|Hs108|chr5 ( 788) 700 131.2 6.7e-30 CCDS82005.1 CDH1 gene_id:999|Hs108|chr16 ( 821) 690 129.5 2.3e-29 CCDS9585.1 CDH24 gene_id:64403|Hs108|chr14 ( 819) 624 118.2 5.9e-26 CCDS59325.1 CDH19 gene_id:28513|Hs108|chr18 ( 490) 614 116.4 1.2e-25 CCDS11994.1 CDH19 gene_id:28513|Hs108|chr18 ( 772) 525 101.2 7.2e-21 CCDS796.1 CELSR2 gene_id:1952|Hs108|chr1 (2923) 526 101.6 2.1e-20 CCDS2775.1 CELSR3 gene_id:1951|Hs108|chr3 (3312) 522 100.9 3.7e-20 CCDS14076.1 CELSR1 gene_id:9620|Hs108|chr22 (3014) 474 92.6 1e-17 CCDS4251.1 PCDHB16 gene_id:57717|Hs108|chr5 ( 776) 461 90.2 1.5e-17 CCDS4255.1 PCDHB13 gene_id:56123|Hs108|chr5 ( 798) 444 87.3 1.1e-16 CCDS4247.1 PCDHB5 gene_id:26167|Hs108|chr5 ( 795) 439 86.4 2.1e-16 >>CCDS10976.1 CDH15 gene_id:1013|Hs108|chr16 (814 aa) initn: 5490 init1: 5490 opt: 5490 Z-score: 5091.7 bits: 953.0 E(32554): 0 Smith-Waterman score: 5490; 100.0% identity (100.0% similar) in 814 aa overlap (1-814:1-814) 10 20 30 40 50 60 pF1KB5 MDAAFLLVLGLLAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSENHKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MDAAFLLVLGLLAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSENHKR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 LPYPLVQIKSDKQQLGSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKTDRFRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LPYPLVQIKSDKQQLGSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKTDRFRL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 RAFALDLGGSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRAEATDAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RAFALDLGGSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRAEATDAD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 DPETDNAALRFSILQQGSPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVADMSGDGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DPETDNAALRFSILQQGSPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVADMSGDGL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 TATASAIITLDDINDNAPEFTRDEFFMEAIEAVSGVDVGRLEVEDRDLPGSPNWVARFTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TATASAIITLDDINDNAPEFTRDEFFMEAIEAVSGVDVGRLEVEDRDLPGSPNWVARFTI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 LEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQNEAPLQAAALRAERGQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQNEAPLQAAALRAERGQA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 KVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPDTEQLQRLSYSKDYDPED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 KVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPDTEQLQRLSYSKDYDPED 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 WLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATGTLSIEILEVNDHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 WLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATGTLSIEILEVNDHA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 PVLAPPPPGSLCSEPHQGPGLLLGATDEDLPPHGAPFHFQLSPRLPELGRNWSLSQVNVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PVLAPPPPGSLCSEPHQGPGLLLGATDEDLPPHGAPFHFQLSPRLPELGRNWSLSQVNVS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 HARLRPRHQVPEGLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKDGVCLPGAAALLAGGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 HARLRPRHQVPEGLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKDGVCLPGAAALLAGGT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 GLSLGALVIVLASALLLLVLVLLVALRARFWKQSRGKGLLHGPQDDLRDNVLNYDEQGGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GLSLGALVIVLASALLLLVLVLLVALRARFWKQSRGKGLLHGPQDDLRDNVLNYDEQGGG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 EEDQDAYDISQLRHPTALSLPLGPPPLRRDAPQGRLHPQPPRVLPTSPLDIADFINDGLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 EEDQDAYDISQLRHPTALSLPLGPPPLRRDAPQGRLHPQPPRVLPTSPLDIADFINDGLE 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 AADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDEDQDYDYLRDWGPRFARLADMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 AADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDEDQDYDYLRDWGPRFARLADMY 730 740 750 760 770 780 790 800 810 pF1KB5 GHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA :::::::::::::::::::::::::::::::::: CCDS10 GHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA 790 800 810 >>CCDS58784.1 CDH4 gene_id:1002|Hs108|chr20 (842 aa) initn: 1668 init1: 712 opt: 2082 Z-score: 1931.3 bits: 368.3 E(32554): 3e-101 Smith-Waterman score: 2105; 45.2% identity (71.0% similar) in 772 aa overlap (30-781:77-837) 10 20 30 40 50 pF1KB5 MDAAFLLVLGLLAQSLCLSLGVPGWRRPTTLYPW---RRAPALSRVRRAWVIPPISVSE :: :: . : .: : .: ::::::.: : CCDS58 VAQTSSPHSGHKPQKGKKVVALDPSPPPKDTLLPWPQHQNANGLRRRKRDWVIPPINVPE 50 60 70 80 90 100 60 70 80 90 100 110 pF1KB5 NHKRLPYP--LVQIKSDKQQLGSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREK : .: :.: ::.:.:::.. . ::: : :.:. : :::::...:..... .:::. CCDS58 N-SRGPFPQQLVRIRSDKDNDIPIRYSITGVGADQPPMEVFSIDSMSGRMYVTRPMDREE 110 120 130 140 150 160 120 130 140 150 160 170 pF1KB5 TDRFRLRAFALDLGGSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRA ..::: :.:..:. .:.: :: : :.:.::::: :......: : ::. ::::: . CCDS58 HASYHLRAHAVDMNGNKVENPIDLYIYVIDMNDNRPEFINQVYNGSVDEGSKPGTYVMTV 170 180 190 200 210 220 180 190 200 210 220 230 pF1KB5 EATDADDPETDNAALRFSILQQG--SP--ELFSIDELTGEIRTVQVGLDREVVAVYNLTL :.:::: : :. .:. :. : :: ..:.:. ::.: :: .::::: : :.. . CCDS58 TANDADDSTTANGMVRYRIVTQTPQSPSQNMFTINSETGDIVTVAAGLDREKVQQYTVIV 230 240 250 260 270 280 240 250 260 270 280 pF1KB5 QVADMSGD---GLTATASAIITLDDINDNAPEFTRDEFFMEAIEAVSGVDVGRLEVEDRD :..:: :. ::. ::.::::. :.::: :::: . : :. : . :. : : ::: CCDS58 QATDMEGNLNYGLSNTATAIITVTDVNDNPPEFTASTFAGEVPENRVETVVANLTVMDRD 290 300 310 320 330 340 290 300 310 320 330 340 pF1KB5 LPGSPNWVARFTILEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQNEAP : :::: : . :. :::.:.:..:::: ::::....:::.::: . . : : :.:.:: CCDS58 QPHSPNWNAVYRIISGDPSGHFSVRTDPVTNEGMVTVVKAVDYELNRAFMLTVMVSNQAP 350 360 370 380 390 400 350 360 370 380 390 400 pF1KB5 LQAAALRAERGQAKVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPDTEQL : .. . .. : : . ..: :: : : : : ::.::::...:::: ::: . CCDS58 LASGIQMSFQSTAGVTISIMDINEAPYFPSNHKLIRLEEGVPPGTVLTTFSAVDPDRFMQ 410 420 430 440 450 460 410 420 430 440 450 460 pF1KB5 QRLSYSKDYDPEDWLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATG : . ::: :: .::...:..:.: : ::. : . :.. :.: :: :.. : ..:: CCDS58 QAVRYSKLSDPASWLHINATNGQITTAAVLDRESLYTKNNVYEATFLAADNGIPPASGTG 470 480 490 500 510 520 470 480 490 500 510 520 pF1KB5 TLSIEILEVNDHAPVLAPPPPGSLCSEPHQGPGLLLGATDEDLPPHGAPFHFQLSPRLPE ::.: ....::.:: : : ...: .:. . .. . :.: :. :. .:. :.: : .: CCDS58 TLQIYLIDINDNAPELLPKE-AQICEKPNLN-AINITAADADVDPNIGPYVFEL-PFVPA 530 540 550 560 570 580 530 540 550 560 570 580 pF1KB5 LGR-NWSLSQVNVSHARLRPRHQVPE-GLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKD : ::.....: ..:.: : : :.. . ... :::.:: . . ..: :: : . CCDS58 AVRKNWTITRLNGDYAQLSLRILYLEAGMYDVPIIVTDSGNPPLSNTSIIKVKVCPCDDN 590 600 610 620 630 640 590 600 610 620 630 640 pF1KB5 GVCLP-GAAALLAGGTGLSLGALVIVLASALLLLVLVLLVAL-RARFWKQSRGKGLLHGP : : ::.: ..::. ::.: .: :.::..::: .. : :. . : :: : CCDS58 GDCTTIGAVA----AAGLGTGAIVAILICILILLTMVLLFVMWMKRREKERHTKQLLIDP 650 660 670 680 690 650 660 670 680 690 700 pF1KB5 QDDLRDNVLNYDEQGGGEEDQDAYDISQLRHPTALS-LPLGPPPLRR--DAPQGRLHPQP .::.:::.:.:::.:::::::: ::.:::..: :.. .: : .:: . : : .:: CCDS58 EDDVRDNILKYDEEGGGEEDQD-YDLSQLQQPEAMGHVPSKAPGVRRVDERPVGA-EPQY 700 710 720 730 740 750 710 720 730 740 750 pF1KB5 P-RVLPTSPLDIADFINDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDE : : . : ::.::::.::.:::.::..::::. :..::::.::.::..:: :.:... CCDS58 PIRPMVPHPGDIGDFINEGLRAADNDPTAPPYDSLLVFDYEGSGSTAGSVSS-LNSSSSG 760 770 780 790 800 810 760 770 780 790 800 810 pF1KB5 DQDYDYLRDWGPRFARLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA ::::::: :::::: .:::::: CCDS58 DQDYDYLNDWGPRFKKLADMYGGGEED 820 830 840 >>CCDS13488.1 CDH4 gene_id:1002|Hs108|chr20 (916 aa) initn: 1668 init1: 712 opt: 2082 Z-score: 1930.7 bits: 368.3 E(32554): 3.2e-101 Smith-Waterman score: 2105; 45.2% identity (71.0% similar) in 772 aa overlap (30-781:151-911) 10 20 30 40 50 pF1KB5 MDAAFLLVLGLLAQSLCLSLGVPGWRRPTTLYPW---RRAPALSRVRRAWVIPPISVSE :: :: . : .: : .: ::::::.: : CCDS13 VAQTSSPHSGHKPQKGKKVVALDPSPPPKDTLLPWPQHQNANGLRRRKRDWVIPPINVPE 130 140 150 160 170 180 60 70 80 90 100 110 pF1KB5 NHKRLPYP--LVQIKSDKQQLGSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREK : .: :.: ::.:.:::.. . ::: : :.:. : :::::...:..... .:::. CCDS13 N-SRGPFPQQLVRIRSDKDNDIPIRYSITGVGADQPPMEVFSIDSMSGRMYVTRPMDREE 190 200 210 220 230 120 130 140 150 160 170 pF1KB5 TDRFRLRAFALDLGGSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRA ..::: :.:..:. .:.: :: : :.:.::::: :......: : ::. ::::: . CCDS13 HASYHLRAHAVDMNGNKVENPIDLYIYVIDMNDNRPEFINQVYNGSVDEGSKPGTYVMTV 240 250 260 270 280 290 180 190 200 210 220 230 pF1KB5 EATDADDPETDNAALRFSILQQG--SP--ELFSIDELTGEIRTVQVGLDREVVAVYNLTL :.:::: : :. .:. :. : :: ..:.:. ::.: :: .::::: : :.. . CCDS13 TANDADDSTTANGMVRYRIVTQTPQSPSQNMFTINSETGDIVTVAAGLDREKVQQYTVIV 300 310 320 330 340 350 240 250 260 270 280 pF1KB5 QVADMSGD---GLTATASAIITLDDINDNAPEFTRDEFFMEAIEAVSGVDVGRLEVEDRD :..:: :. ::. ::.::::. :.::: :::: . : :. : . :. : : ::: CCDS13 QATDMEGNLNYGLSNTATAIITVTDVNDNPPEFTASTFAGEVPENRVETVVANLTVMDRD 360 370 380 390 400 410 290 300 310 320 330 340 pF1KB5 LPGSPNWVARFTILEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQNEAP : :::: : . :. :::.:.:..:::: ::::....:::.::: . . : : :.:.:: CCDS13 QPHSPNWNAVYRIISGDPSGHFSVRTDPVTNEGMVTVVKAVDYELNRAFMLTVMVSNQAP 420 430 440 450 460 470 350 360 370 380 390 400 pF1KB5 LQAAALRAERGQAKVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPDTEQL : .. . .. : : . ..: :: : : : : ::.::::...:::: ::: . CCDS13 LASGIQMSFQSTAGVTISIMDINEAPYFPSNHKLIRLEEGVPPGTVLTTFSAVDPDRFMQ 480 490 500 510 520 530 410 420 430 440 450 460 pF1KB5 QRLSYSKDYDPEDWLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATG : . ::: :: .::...:..:.: : ::. : . :.. :.: :: :.. : ..:: CCDS13 QAVRYSKLSDPASWLHINATNGQITTAAVLDRESLYTKNNVYEATFLAADNGIPPASGTG 540 550 560 570 580 590 470 480 490 500 510 520 pF1KB5 TLSIEILEVNDHAPVLAPPPPGSLCSEPHQGPGLLLGATDEDLPPHGAPFHFQLSPRLPE ::.: ....::.:: : : ...: .:. . .. . :.: :. :. .:. :.: : .: CCDS13 TLQIYLIDINDNAPELLPKE-AQICEKPNLN-AINITAADADVDPNIGPYVFEL-PFVPA 600 610 620 630 640 650 530 540 550 560 570 580 pF1KB5 LGR-NWSLSQVNVSHARLRPRHQVPE-GLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKD : ::.....: ..:.: : : :.. . ... :::.:: . . ..: :: : . CCDS13 AVRKNWTITRLNGDYAQLSLRILYLEAGMYDVPIIVTDSGNPPLSNTSIIKVKVCPCDDN 660 670 680 690 700 710 590 600 610 620 630 640 pF1KB5 GVCLP-GAAALLAGGTGLSLGALVIVLASALLLLVLVLLVAL-RARFWKQSRGKGLLHGP : : ::.: ..::. ::.: .: :.::..::: .. : :. . : :: : CCDS13 GDCTTIGAVA----AAGLGTGAIVAILICILILLTMVLLFVMWMKRREKERHTKQLLIDP 720 730 740 750 760 770 650 660 670 680 690 700 pF1KB5 QDDLRDNVLNYDEQGGGEEDQDAYDISQLRHPTALS-LPLGPPPLRR--DAPQGRLHPQP .::.:::.:.:::.:::::::: ::.:::..: :.. .: : .:: . : : .:: CCDS13 EDDVRDNILKYDEEGGGEEDQD-YDLSQLQQPEAMGHVPSKAPGVRRVDERPVGA-EPQY 780 790 800 810 820 830 710 720 730 740 750 pF1KB5 P-RVLPTSPLDIADFINDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDE : : . : ::.::::.::.:::.::..::::. :..::::.::.::..:: :.:... CCDS13 PIRPMVPHPGDIGDFINEGLRAADNDPTAPPYDSLLVFDYEGSGSTAGSVSS-LNSSSSG 840 850 860 870 880 760 770 780 790 800 810 pF1KB5 DQDYDYLRDWGPRFARLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA ::::::: :::::: .:::::: CCDS13 DQDYDYLNDWGPRFKKLADMYGGGEED 890 900 910 >>CCDS77172.1 CDH2 gene_id:1000|Hs108|chr18 (875 aa) initn: 1680 init1: 668 opt: 2061 Z-score: 1911.6 bits: 364.7 E(32554): 3.7e-100 Smith-Waterman score: 2066; 43.7% identity (70.7% similar) in 757 aa overlap (40-781:123-871) 10 20 30 40 50 60 pF1KB5 GLLAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSENHKRLPYP--LVQ :.: .: ::::::.. :: .: :.: ::. CCDS77 KPTLTEESVKESAEVEEIVFPRQFSKHSGHLQRQKRDWVIPPINLPEN-SRGPFPQELVR 100 110 120 130 140 150 70 80 90 100 110 120 pF1KB5 IKSDKQQLGSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKTDRFRLRAFALDL :.::... :. ::. :::.:. : :.: :. ..:.. .. ::::. ::.::: :.:. CCDS77 IRSDRDKNLSLRYSVTGPGADQPPTGIFIINPISGQLSVTKPLDREQIARFHLRAHAVDI 160 170 180 190 200 210 130 140 150 160 170 180 pF1KB5 GGSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRAEATDADDPETDNA .:. .:.: :. : :.:.::::: ::.....: : ::. ::::: . : :::::.. :. CCDS77 NGNQVENPIDIVINVIDMNDNRPEFLHQVWNGTVPEGSKPGTYVMTVTAIDADDPNALNG 220 230 240 250 260 270 190 200 210 220 230 240 pF1KB5 ALRFSILQQG----SPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVADMSGD---GL ::. :..:. ::..:.:.. ::.: :: .::::: : :.: .:..:: :. :: CCDS77 MLRYRIVSQAPSTPSPNMFTINNETGDIITVAAGLDREKVQQYTLIIQATDMEGNPTYGL 280 290 300 310 320 330 250 260 270 280 290 300 pF1KB5 TATASAIITLDDINDNAPEFTRDEFFMEAIEAVSGVDVGRLEVEDRDLPGSPNWVARFTI . ::.:.::. :.::: :::: :. :. : . :. : : :.: : .: : : . : CCDS77 SNTATAVITVTDVNDNPPEFTAMTFYGEVPENRVDIIVANLTVTDKDQPHTPAWNAVYRI 340 350 360 370 380 390 310 320 330 340 350 360 pF1KB5 LEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQNEAPLQAAALRAERGQA ::: :.:.:.:::..:.:....:: .:.:. . . : :...:..:: . . .. : CCDS77 SGGDPTGRFAIQTDPNSNDGLVTVVKPIDFETNRMFVLTVAAENQVPLAKGIQHPPQSTA 400 410 420 430 440 450 370 380 390 400 410 420 pF1KB5 KVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPDTEQLQRLSYSKDYDPED : : : :.:: : : :: :: ::...::.:.::: . : . :.: :: . CCDS77 TVSVTVIDVNENPYFAPNPKIIRQEEGLHAGTMLTTFTAQDPDRYMQQNIRYTKLSDPAN 460 470 480 490 500 510 430 440 450 460 470 480 pF1KB5 WLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATGTLSIEILEVNDHA ::..: ..:.: : ::. :: .:.. : : ::.:.. : ..::::.: .:..::.: CCDS77 WLKIDPVNGQITTIAVLDRESPNVKNNIYNATFLASDNGIPPMSGTGTLQIYLLDINDNA 520 530 540 550 560 570 490 500 510 520 530 pF1KB5 PVLAPPPPGSLCSEPHQGPGLLLGATDEDLPPHGAPFHFQLSPRLP-ELGRNWSLSQVNV : . : . : : . .. . : : :. :...:: :.: : : . :::.....: CCDS77 PQVLPQEAET-CETPDPN-SINITALDYDIDPNAGPFAFDL-PLSPVTIKRNWTITRLNG 580 590 600 610 620 540 550 560 570 580 590 pF1KB5 SHARLRPRHQVPE-GLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKDGVCLPGAAALLAG . :.: . . : :.... ... :::.::.. . : : ::.: ..: : . CCDS77 DFAQLNLKIKFLEAGIYEVPIIITDSGNPPKSNISILRVKVCQCDSNGDCTDVDRIV--- 630 640 650 660 670 680 600 610 620 630 640 650 pF1KB5 GTGLSLGALVIVLASALLLLVLVLL-VALRARFWKQSRGKGLLHGPQDDLRDNVLNYDEQ :.::. ::.. .: ..::.:::. :. : :. ..: :: :.::.:::.:.:::. CCDS77 GAGLGTGAIIAILLCIIILLILVLMFVVWMKRRDKERQAKQLLIDPEDDVRDNILKYDEE 690 700 710 720 730 740 660 670 680 690 700 710 pF1KB5 GGGEEDQDAYDISQLRHP-TALSLPLGPPPLRR-DAPQGRLHPQPP-RVLPTSPLDIADF :::::::: ::.:::..: :. . : .:: : . .:: : : : ::.:: CCDS77 GGGEEDQD-YDLSQLQQPDTVEPDAIKPVGIRRMDERPIHAEPQYPVRSAAPHPGDIGDF 750 760 770 780 790 800 720 730 740 750 760 770 pF1KB5 INDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDEDQDYDYLRDWGPRFA ::.::.:::.::..::::. :..::::.::.::.:::. ::.. .:::::: :::::: CCDS77 INEGLKAADNDPTAPPYDSLLVFDYEGSGSTAGSLSSLNSSSSGGEQDYDYLNDWGPRFK 810 820 830 840 850 860 780 790 800 810 pF1KB5 RLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA .:::::: CCDS77 KLADMYGGGDD 870 >>CCDS11891.1 CDH2 gene_id:1000|Hs108|chr18 (906 aa) initn: 1680 init1: 668 opt: 2061 Z-score: 1911.3 bits: 364.7 E(32554): 3.9e-100 Smith-Waterman score: 2066; 43.7% identity (70.7% similar) in 757 aa overlap (40-781:154-902) 10 20 30 40 50 60 pF1KB5 GLLAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSENHKRLPYP--LVQ :.: .: ::::::.. :: .: :.: ::. CCDS11 KPTLTEESVKESAEVEEIVFPRQFSKHSGHLQRQKRDWVIPPINLPEN-SRGPFPQELVR 130 140 150 160 170 180 70 80 90 100 110 120 pF1KB5 IKSDKQQLGSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKTDRFRLRAFALDL :.::... :. ::. :::.:. : :.: :. ..:.. .. ::::. ::.::: :.:. CCDS11 IRSDRDKNLSLRYSVTGPGADQPPTGIFIINPISGQLSVTKPLDREQIARFHLRAHAVDI 190 200 210 220 230 240 130 140 150 160 170 180 pF1KB5 GGSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRAEATDADDPETDNA .:. .:.: :. : :.:.::::: ::.....: : ::. ::::: . : :::::.. :. CCDS11 NGNQVENPIDIVINVIDMNDNRPEFLHQVWNGTVPEGSKPGTYVMTVTAIDADDPNALNG 250 260 270 280 290 300 190 200 210 220 230 240 pF1KB5 ALRFSILQQG----SPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVADMSGD---GL ::. :..:. ::..:.:.. ::.: :: .::::: : :.: .:..:: :. :: CCDS11 MLRYRIVSQAPSTPSPNMFTINNETGDIITVAAGLDREKVQQYTLIIQATDMEGNPTYGL 310 320 330 340 350 360 250 260 270 280 290 300 pF1KB5 TATASAIITLDDINDNAPEFTRDEFFMEAIEAVSGVDVGRLEVEDRDLPGSPNWVARFTI . ::.:.::. :.::: :::: :. :. : . :. : : :.: : .: : : . : CCDS11 SNTATAVITVTDVNDNPPEFTAMTFYGEVPENRVDIIVANLTVTDKDQPHTPAWNAVYRI 370 380 390 400 410 420 310 320 330 340 350 360 pF1KB5 LEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQNEAPLQAAALRAERGQA ::: :.:.:.:::..:.:....:: .:.:. . . : :...:..:: . . .. : CCDS11 SGGDPTGRFAIQTDPNSNDGLVTVVKPIDFETNRMFVLTVAAENQVPLAKGIQHPPQSTA 430 440 450 460 470 480 370 380 390 400 410 420 pF1KB5 KVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPDTEQLQRLSYSKDYDPED : : : :.:: : : :: :: ::...::.:.::: . : . :.: :: . CCDS11 TVSVTVIDVNENPYFAPNPKIIRQEEGLHAGTMLTTFTAQDPDRYMQQNIRYTKLSDPAN 490 500 510 520 530 540 430 440 450 460 470 480 pF1KB5 WLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATGTLSIEILEVNDHA ::..: ..:.: : ::. :: .:.. : : ::.:.. : ..::::.: .:..::.: CCDS11 WLKIDPVNGQITTIAVLDRESPNVKNNIYNATFLASDNGIPPMSGTGTLQIYLLDINDNA 550 560 570 580 590 600 490 500 510 520 530 pF1KB5 PVLAPPPPGSLCSEPHQGPGLLLGATDEDLPPHGAPFHFQLSPRLP-ELGRNWSLSQVNV : . : . : : . .. . : : :. :...:: :.: : : . :::.....: CCDS11 PQVLPQEAET-CETPDPN-SINITALDYDIDPNAGPFAFDL-PLSPVTIKRNWTITRLNG 610 620 630 640 650 540 550 560 570 580 590 pF1KB5 SHARLRPRHQVPE-GLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKDGVCLPGAAALLAG . :.: . . : :.... ... :::.::.. . : : ::.: ..: : . CCDS11 DFAQLNLKIKFLEAGIYEVPIIITDSGNPPKSNISILRVKVCQCDSNGDCTDVDRIV--- 660 670 680 690 700 710 600 610 620 630 640 650 pF1KB5 GTGLSLGALVIVLASALLLLVLVLL-VALRARFWKQSRGKGLLHGPQDDLRDNVLNYDEQ :.::. ::.. .: ..::.:::. :. : :. ..: :: :.::.:::.:.:::. CCDS11 GAGLGTGAIIAILLCIIILLILVLMFVVWMKRRDKERQAKQLLIDPEDDVRDNILKYDEE 720 730 740 750 760 770 660 670 680 690 700 710 pF1KB5 GGGEEDQDAYDISQLRHP-TALSLPLGPPPLRR-DAPQGRLHPQPP-RVLPTSPLDIADF :::::::: ::.:::..: :. . : .:: : . .:: : : : ::.:: CCDS11 GGGEEDQD-YDLSQLQQPDTVEPDAIKPVGIRRMDERPIHAEPQYPVRSAAPHPGDIGDF 780 790 800 810 820 830 720 730 740 750 760 770 pF1KB5 INDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDEDQDYDYLRDWGPRFA ::.::.:::.::..::::. :..::::.::.::.:::. ::.. .:::::: :::::: CCDS11 INEGLKAADNDPTAPPYDSLLVFDYEGSGSTAGSLSSLNSSSSGGEQDYDYLNDWGPRFK 840 850 860 870 880 890 780 790 800 810 pF1KB5 RLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA .:::::: CCDS11 KLADMYGGGDD 900 >>CCDS10803.1 CDH11 gene_id:1009|Hs108|chr16 (796 aa) initn: 835 init1: 329 opt: 1381 Z-score: 1281.7 bits: 248.0 E(32554): 4.6e-65 Smith-Waterman score: 1381; 34.4% identity (62.8% similar) in 802 aa overlap (4-781:9-787) 10 20 30 40 50 pF1KB5 MDAAFLLVLGLLAQSLCLSLGVPGWRRPTTL---YPWRRAPALSRVRRAWVIPPI : :. ::.: .: .. : ::. ... .:.: .:.:: . CCDS10 MKENYCLQAALVCLGMLCHSHAFAPERRGHLRPSFHGHHEKGKEGQVLQRSKRGWVWNQF 10 20 30 40 50 60 60 70 80 90 100 pF1KB5 SVSENHKRLPYPLV--QIKSDKQQL-GSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAM : :.. : :.. ...:: .. :.. : ..: :. .: :: .:.. . CCDS10 FVIEEYTG-PDPVLVGRLHSDIDSGDGNIKYILSGEGAGT----IFVIDDKSGNIHATKT 70 80 90 100 110 110 120 130 140 150 160 pF1KB5 LDREKTDRFRLRAFALDLGGST-LEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPG ::::. .. : : :.: . :: :... . : : ::: : ::.:.. . : : . : CCDS10 LDREERAQYTLMAQAVDRDTNRPLEPPSEFIVKVQDINDNPPEFLHETYHANVPERSNVG 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB5 TYVTRAEATDADDPETDNAA-LRFSILQQGSPELFSIDELTGEIRTVQVGLDREVVAVYN : : .. :.::::: :.: : .:::. :.: ::.. :: :::. ..:::. :. CCDS10 TSVIQVTASDADDPTYGNSAKLVYSILE-GQP-YFSVEAQTGIIRTALPNMDREAKEEYH 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB5 LTLQVADMSGD--GLTATASAIITLDDINDNAPEFTRDEFFMEAIEA-VSGVDVGRLEVE ...:. ::.: ::..:... ::: :.::: :.: .. . : . :: : : .:::.... CCDS10 VVIQAKDMGGHMGGLSGTTKVTITLTDVNDNPPKFPQSVYQMSVSEAAVPGEEVGRVKAK 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 DRDLPGSPNWVARFTILEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQN : :. . : .. ..:..:: .: : :: .:.:::... : .:.:. . : ::: . : CCDS10 DPDI--GENGLVTYNIVDGDGMESFEITTDYETQEGVIKLKKPVDFETKRAYSLKVEAAN 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB5 -EAPLQAAALRAERGQAKVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPD . . . . . :.. :.:..:::.: . :.: ::.:. :.::: CCDS10 VHIDPKFISNGPFKDTVTVKISVEDADEPPMFLAPSYIHEVQENAAAGTVVGRVHAKDPD 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB5 TEQLQ-RLSYSKDYDPEDWLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQP . . : : .. : . .. .. : :.: . :. . .: :.: . .. CCDS10 AANSPIRYSIDRHTDLDRFFTINPEDGFIKTTKPLDRE----ETAWLNITVFAAEIHNRH 420 430 440 450 460 470 480 490 500 510 pF1KB5 RTATGTLSIEILEVNDHAPVLAPPPPGSLC----SEPHQG-PGLLLGATDEDLPPHGAPF . : ..:..:.:::.:: .: : : .: ..: .. : . ..: :.: .: : CCDS10 QEAKVPVAIRVLDVNDNAPKFAAPYEGFICESDQTKPLSNQPIVTISADDKDDTANGPRF 470 480 490 500 510 520 520 530 540 550 560 570 pF1KB5 HFQLSPRL---PELGRNWSLSQVNVSHARLRPRHQVPEGLHRLSLLLRDSGQPPQQREQP :.: :.. :.. . ... .:: . . :. : ... :.: ::.. . CCDS10 IFSLPPEIIHNPNFTVRDNRDNTAGVYARRGGFSRQKQDLYLLPIVISDGGIPPMSSTNT 530 540 550 560 570 580 580 590 600 610 620 630 pF1KB5 LNVTVCRCGKDGVCLPGAAALLAGGTGLSLGALVIVLASALLLLVLVLL-VALRARFWKQ :.. :: : .:. : : ..::: :::. .:: ..:::.:.: :.:: .: CCDS10 LTIKVCGCDVNGALLSCNAEAYILNAGLSTGALIAILACIVILLVIVVLFVTLR----RQ 590 600 610 620 630 640 640 650 660 670 680 690 pF1KB5 SRGKGLLHGPQDDLRDNVLNYDEQGGGEEDQDAYDISQLRHPTALSLPLGPPPLRRDA-P .. . :. ..:.:.:...::..:::::: .:.::. :..: ... : : :.: : CCDS10 KK-EPLIVFEEEDVRENIITYDDEGGGEEDTEAFDIATLQNPDGIN---GFIP-RKDIKP 650 660 670 680 690 700 710 720 730 740 750 pF1KB5 QGRLHPQPP-RVLPTSPLDIADFINDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSS . . :.: : :.: .:. :::: .. ::.::..::::. :: ::: :::::.::: CCDS10 EYQYMPRPGLRPAPNS-VDVDDFINTRIQEADNDPTAPPYDSIQIYGYEGRGSVAGSLSS 700 710 720 730 740 750 760 770 780 790 800 810 pF1KB5 ILSSQGDEDQDYDYLRDWGPRFARLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRG . :. : : :::::..::::: .:::.:: CCDS10 LESATTDSDLDYDYLQNWGPRFKKLADLYGSKDTFDDDS 760 770 780 790 >>CCDS11993.1 CDH7 gene_id:1005|Hs108|chr18 (785 aa) initn: 894 init1: 289 opt: 1342 Z-score: 1245.6 bits: 241.3 E(32554): 4.6e-63 Smith-Waterman score: 1342; 34.3% identity (63.5% similar) in 795 aa overlap (5-781:8-777) 10 20 30 40 50 pF1KB5 MDAAFLLVLGLLAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSEN : : :.: ::.: . . :. .. . ::..:.:: . : :. CCDS11 MKLGKVEFCHFLQLIALFLCFSGMSQAELSRSRSKPYFQS-GRSRTKRSWVWNQFFVLEE 10 20 30 40 50 60 70 80 90 100 110 pF1KB5 HK-RLPYPLVQIKSDKQQL-GSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKT . : . ...:: .. ::. : ..: :.. ..: ::. :: . . ::::. CCDS11 YMGSDPLYVGKLHSDVDKGDGSIKYILSGEGAS----SIFIIDENTGDIHATKRLDREEQ 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 DRFRLRAFALD-LGGSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRA . ::: ::: : .. .: ... : . : :::.: ::. .:. : : . :: :... CCDS11 AYYTLRAQALDRLTNKPVEPESEFVIKIQDINDNEPKFLDGPYTAGVPEMSPVGTSVVQV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 EATDADDPETDNAA-LRFSILQQGSPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVA ::::::: :.: . .:::: :.: ::.. :: :.:. ..:::. : :..:. CCDS11 TATDADDPTYGNSARVVYSILQ-GQP-YFSVEPKTGVIKTALPNMDREAKDQYLLVIQAK 180 190 200 210 220 230 240 250 260 270 280 pF1KB5 DMSGD--GLTATASAIITLDDINDNAPEFTRDEFFMEAIEA--VSGVDVGRLEVEDRDLP :: :. ::..:.:. .:: :.::: :.: : . ... :. :..: :.:... : :. CCDS11 DMVGQNGGLSGTTSVTVTLTDVNDNPPRFPRRSYQYNVPESLPVASV-VARIKAADADI- 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB5 GSPNWVARFTILEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQN-EAPL :. : .. :..:: : : : .: .:.::...: : ::.:. : :.. . : .: CCDS11 GA-NAEMEYKIVDGDGLGIFKISVDKETQEGIITIQKELDFEAKTSYTLRIEAANKDADP 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB5 QAAALRAERGQAKVRVHVQDTNEPPVFQENPLRT-SLAEGAPPGTLVATFSARDPDTEQL . .: . :.. :.:..:::::. .:: ..:.. :....: .:.:::. . CCDS11 RFLSLGPFSDTTTVKIIVEDVDEPPVFS-SPLYPMEVSEATQVGNIIGTVAAHDPDSSNS 360 370 380 390 400 410 420 430 440 450 460 pF1KB5 Q-RLSYSKDYDPEDWLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTAT : : ... : : ....:: .: : : . :. . .. . :::... . ... CCDS11 PVRYSIDRNTDLERYFNIDANSGVITTAKSLDRET----NAIHNITVLAMESQNPSQVGR 410 420 430 440 450 460 470 480 490 500 510 520 pF1KB5 GTLSIEILEVNDHAPVLAPPPPGSLCSEPHQGPGLL-LGATDEDLPPHGAPFHFQLSPRL : ..: ::..::.:: .: ..: . . : . ..:.:.: : .: :.:.:. CCDS11 GYVAITILDINDNAPEFAMDYETTVCENAQPGQVIQKISAVDKDEPSNGHQFYFSLTTDA 470 480 490 500 510 520 530 540 550 560 570 580 pF1KB5 PELGRNWSLSQVNVSHARLRPRH----QVPEGLHRLSLLLRDSGQPPQQREQPLNVTVCR . ..:.::.. . . : . :. . .... : ... :::.: . . :.. :: CCDS11 TN-NHNFSLKDNKDNTASILTRRNGFRRQEQSVYYLPIFIVDSGSPSLSSTNTLTIRVCD 530 540 550 560 570 580 590 600 610 620 630 640 pF1KB5 CGKDGVCLPGAAALLAGGTGLSLGALVIVLASALLLLVLVLLVALRARFWKQSRGKGLLH : ::: : . .::: :::. .:: .: ::::.::.. : :. :. CCDS11 CDADGVAQTCNAEAYVLPAGLSTGALIAILACVLTLLVLILLIVTMRRRKKEP----LIF 590 600 610 620 630 640 650 660 670 680 690 700 pF1KB5 GPQDDLRDNVLNYDEQGGGEEDQDAYDISQLRHPTALSLPLGPPPLRRDA-PQGRLHPQP . :.:.:.. ::..:::::: .:.:.. ::. ... :::. :. .. .: CCDS11 DEERDIRENIVRYDDEGGGEEDTEAFDMAALRNLNVIR----DTKTRRDVTPEIQFLSRP 650 660 670 680 690 710 720 730 740 750 pF1KB5 P-RVLPTSPLDIADFINDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDE . .: . . . .:: . :. :: ::..::::. : .::.:::: .:::. : ... CCDS11 AFKSIPDNVI-FREFIWERLKEADVDPGAPPYDSLQTYAFEGNGSVAESLSSLDSISSNS 700 710 720 730 740 750 760 770 780 790 800 810 pF1KB5 DQDYDYLRDWGPRFARLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA ::.:::: :::::: ::::::: CCDS11 DQNYDYLSDWGPRFKRLADMYGTGQESLYS 760 770 780 >>CCDS10802.1 CDH8 gene_id:1006|Hs108|chr16 (799 aa) initn: 923 init1: 299 opt: 1312 Z-score: 1217.6 bits: 236.2 E(32554): 1.7e-61 Smith-Waterman score: 1312; 33.5% identity (63.2% similar) in 761 aa overlap (40-780:56-790) 10 20 30 40 50 60 pF1KB5 GLLAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSENHKRLPYPLV--Q :.: .:.:: . : :. . : :.. . CCDS10 CIYMAPMNQSQVLMSGSPLELNSLGEEQRILNRSKRGWVWNQMFVLEEFSG-PEPILVGR 30 40 50 60 70 80 70 80 90 100 110 120 pF1KB5 IKSDKQQLGS--VIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKTDRFRLRAFAL ...: . :: . : ..: :. .:.:. :: . ::::. .. : : :. CCDS10 LHTDLDP-GSKKIKYILSGDGAGT----IFQINDVTGDIHAIKRLDREEKAEYTLTAQAV 90 100 110 120 130 130 140 150 160 170 180 pF1KB5 DLGGST-LEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRAEATDADDPET : : :: :... : : : ::: : ::. . . : : .. :: :: . ::::::: CCDS10 DWETSKPLEPPSEFIIKVQDINDNAPEFLNGPYHATVPEMSILGTSVTNVTATDADDPVY 140 150 160 170 180 190 190 200 210 220 230 240 pF1KB5 DNAA-LRFSILQQGSPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVADMSGD--GLT :.: : .:::. :.: :::. :. :.:. ..:::. : ...:. ::.: ::. CCDS10 GNSAKLVYSILE-GQP-YFSIEPETAIIKTALPNMDREAKEEYLVVIQAKDMGGHSGGLS 200 210 220 230 240 250 250 260 270 280 290 300 pF1KB5 ATASAIITLDDINDNAPEFTRDEFFMEAIE-AVSGVDVGRLEVEDRDLPGSPNWVARFTI .:.. .:: :.::: :.:... . . . : .: :. .::....:.:. . : . . : CCDS10 GTTTLTVTLTDVNDNPPKFAQSLYHFSVPEDVVLGTAIGRVKANDQDI--GENAQSSYDI 260 270 280 290 300 310 310 320 330 340 350 pF1KB5 LEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQNEAPLQAAALRAE-RGQ ..:: . : : .: ....:.. . : ::.:. . : ::: . : . :. . CCDS10 IDGDGTALFEITSDAQAQDGIIRLRKPLDFETKKSYTLKVEAANVHIDPRFSGRGPFKDT 320 330 340 350 360 370 360 370 380 390 400 410 pF1KB5 AKVRVHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPD-TEQLQRLSYSKDYDP : :.. :.:..:::::. . :.: ..... .::::: : . :.: .. : CCDS10 ATVKIVVEDADEPPVFSSPTYLLEVHENAALNSVIGQVTARDPDITSSPIRFSIDRHTDL 380 390 400 410 420 430 420 430 440 450 460 470 pF1KB5 EDWLQVDAATGRIQTQHVLSPASPFLK--GGWYRAIVLAQDDASQPRTATGTLSIEILEV : ....: :.: :.:. . . :. ..: . .. . . ..:..:.: CCDS10 ERQFNINADDGKITL------ATPLDRELSVWHNITIIATEIRNHSQISRVPVAIKVLDV 440 450 460 470 480 480 490 500 510 520 530 pF1KB5 NDHAPVLAPPPPGSLCSEPHQGPGL-LLGATDEDLPPHGAPFHFQLSPRLPELGRNWSLS ::.:: .: . :: . . : . ..: :.: : .: : ..: :.. . . :.... CCDS10 NDNAPEFASEYEAFLCENGKPGQVIQTVSAMDKDDPKNGHYFLYSLLPEMVN-NPNFTIK 490 500 510 520 530 540 540 550 560 570 580 590 pF1KB5 QVNVSHARLRPRH----QVPEGLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKDGVCLPG . . . . .: . . .. : ... :::.:: . . :.. :: :..::: CCDS10 KNEDNSLSILAKHNGFNRQKQEVYLLPIIISDSGNPPLSSTSTLTIRVCGCSNDGVVQSC 550 560 570 580 590 600 600 610 620 630 640 650 pF1KB5 AAALLAGGTGLSLGALVIVLASALLLLVLVLL-VALRARFWKQSRGKGLLHGPQDDLRDN . . :::.:::. .:: .::::.:.: :.:: . ... :. ..:.:.: CCDS10 NVEAYVLPIGLSMGALIAILACIILLLVIVVLFVTLR-----RHKNEPLIIKDDEDVREN 610 620 630 640 650 660 660 670 680 690 700 pF1KB5 VLNYDEQGGGEEDQDAYDISQLRHPTALSLPLGPPPLRRDA-PQGRLHPQPPRVLPTSPL .. ::..:::::: .:.::. :..: ... : : :.: :. .. :. . . . CCDS10 IIRYDDEGGGEEDTEAFDIATLQNPDGIN---GFLP-RKDIKPDLQFMPRQGLAPVPNGV 670 680 690 700 710 710 720 730 740 750 760 pF1KB5 DIADFINDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDEDQDYDYLRDW :. .::: :. ::.::..::::. :: ::: :::::.:::. :. .: ::..::: :: CCDS10 DVDEFINVRLHEADNDPTAPPYDSIQIYGYEGRGSVAGSLSSLESTTSDSDQNFDYLSDW 720 730 740 750 760 770 770 780 790 800 810 pF1KB5 GPRFARLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA :::: ::...: CCDS10 GPRFKRLGELYSVGESDKET 780 790 >>CCDS3890.1 CDH12 gene_id:1010|Hs108|chr5 (794 aa) initn: 834 init1: 303 opt: 1295 Z-score: 1201.9 bits: 233.3 E(32554): 1.3e-60 Smith-Waterman score: 1341; 35.8% identity (63.3% similar) in 771 aa overlap (33-781:43-783) 10 20 30 40 50 60 pF1KB5 AAFLLVLGLLAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSENH-KRL : .:. ..::.:.:: . : :.. CCDS38 VLFDGGLLTPLQPQPQQTLATEPRENVIHLPGQRSH-FQRVKRGWVWNQFFVLEEYVGSE 20 30 40 50 60 70 70 80 90 100 110 120 pF1KB5 PYPLVQIKSDKQQ-LGSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKTDRFRL : . ...:: .. :.: :...: :. ::.::. :: . ::::. . : CCDS38 PQYVGKLHSDLDKGEGTVKYTLSGDGAGT----VFTIDETTGDIHAIRSLDREEKPFYTL 80 90 100 110 120 130 140 150 160 170 pF1KB5 RAFALDLGG-STLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRAEATDA :: :.:. . :: ... : : : :::.: ::. ... : : . :.:: ...:::: CCDS38 RAQAVDIETRKPLEPESEFIIKVQDINDNEPKFLDGPYVATVPEMSPVGAYVLQVKATDA 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 DDPETDNAA-LRFSILQQGSPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVADMSGD ::: :.: . .:::: :.: :::: :: :::. ..:::: :.. .:. ::.:. CCDS38 DDPTYGNSARVVYSILQ-GQP-YFSIDPKTGVIRTALPNMDREVKEQYQVLIQAKDMGGQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 --GLTATASAIITLDDINDNAPEFTRDEFFMEAIEAVS-GVDVGRLEVEDRDLPGSPNWV ::..:. . ::: :.::: :.: .. : ... :. : .::... : :. . : CCDS38 LGGLAGTTIVNITLTDVNDNPPRFPKSIFHLKVPESSPIGSAIGRIRAVDPDF--GQNAE 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 ARFTILEGDPDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQN---EAPLQAAA ...:. :: . : : :: :.:::... : ::.:. . : .:: ..: . ...:. CCDS38 IEYNIVPGDGGNLFDIVTDEDTQEGVIKLKKPLDFETKKAYTFKVEASNLHLDHRFHSAG 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 LRAERGQAKVRVHVQDTNEPPVFQENPLRT-SLAEGAPPGTLVATFSARDPDTEQLQRLS . : :.. : :..:::::.. :: : . : .: ::.... .:.: :. . . . CCDS38 --PFKDTATVKISVLDVDEPPVFSK-PLYTMEVYEDTPVGTIIGAVTAQDLDVGS-SAVR 370 380 390 400 410 420 430 440 450 460 pF1KB5 YSKDY--DPEDWLQVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATGTL : :. : .... .:. : : :...:. : . : ..:. .. :. .. CCDS38 YFIDWKSDGDSYFTIDGNEGTIATNELLDREST----AQYNFSIIASKVSNPLLTSKVNI 420 430 440 450 460 470 470 480 490 500 510 520 pF1KB5 SIEILEVNDHAPVLAPPPPGSLCSEPHQGPGL-LLGATDEDLPPHGAPFHFQLSPRLPEL :..:.::. : .. : ..: . . : . ...:.:.:: : : : :.:::. . CCDS38 LINVLDVNEFPPEISVPYETAVCENAKPGQIIQIVSAADRDLSPAGQQFSFRLSPE-AAI 480 490 500 510 520 530 530 540 550 560 570 580 pF1KB5 GRNWSLSQVNVSHARLRPRH----QVPEGLHRLSLLLRDSGQPPQQREQPLNVTVCRCGK :... . . : .. :. . . :. : ....::. : :. . ... :::: . CCDS38 KPNFTVRDFRNNTAGIETRRNGYSRRQQELYFLPVVIEDSSYPVQSSTNTMTIRVCRCDS 540 550 560 570 580 590 590 600 610 620 630 640 pF1KB5 DGVCLPGAAALLAGGTGLSLGALVIVLASALLLL-VLVLLVALRARFWKQSRGKGLLHGP ::. : . . .::: :::. .: ..:: ..:: :::: .:.. : : CCDS38 DGTILSCNVEAIFLPVGLSTGALIAILLCIVILLAIVVLYVALR----RQKK-KDTLMTS 600 610 620 630 640 650 660 670 680 690 700 pF1KB5 QDDLRDNVLNYDEQGGGEEDQDAYDISQLRHPTALSLPLGPPPLRRDA-PQGRLHPQ--P ..:.::::..::..:::::: .:.::. ::.: .. .::: :.. :. : CCDS38 KEDIRDNVIHYDDEGGGEEDTQAFDIGALRNPKVIE----ENKIRRDIKPDSLCLPRQRP 650 660 670 680 690 700 710 720 730 740 750 760 pF1KB5 PRVLPTSPLDIADFINDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDED : : :: :::.. :. : ::..::::. : :::.:::: .:::: : . : CCDS38 PMEDNT---DIRDFIHQRLQENDVDPTAPPYDSLATYAYEGSGSVAESLSSIDSLTTEAD 710 720 730 740 750 760 770 780 790 800 810 pF1KB5 QDYDYLRDWGPRFARLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA :::::: :::::: ::::.: CCDS38 QDYDYLTDWGPRFKVLADMFGEEESYNPDKVT 770 780 790 >>CCDS11977.1 CDH20 gene_id:28316|Hs108|chr18 (801 aa) initn: 865 init1: 335 opt: 1286 Z-score: 1193.5 bits: 231.7 E(32554): 3.7e-60 Smith-Waterman score: 1286; 34.2% identity (61.4% similar) in 766 aa overlap (42-785:56-796) 20 30 40 50 60 70 pF1KB5 LAQSLCLSLGVPGWRRPTTLYPWRRAPALSRVRRAWVIPPISVSENHKRL-PYPLVQIKS :..:.:: . : :.. : . ...: CCDS11 MDLTTTVLSDTPTPQGELEALLSDKPQSHQRTKRSWVWNQFFVLEEYTGTDPLYVGKLHS 30 40 50 60 70 80 80 90 100 110 120 pF1KB5 DKQQL-GSVIYSIQGPGVDEEPRGVFSIDKFTGKVFLNAMLDREKTDRFRLRAFALDL-G : .. ::. : ..: :. ::.:: :: . ::::. .. ::: ::: CCDS11 DMDRGDGSIKYILSGEGAG----IVFTIDDTTGDIHAIQRLDREERAQYTLRAQALDRRT 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB5 GSTLEDPTDLEIVVVDQNDNRPAFLQEAFTGRVLEGAVPGTYVTRAEATDADDPETDNAA : .: ... : . : :::.: ::. ... : : . :: : .. ::::::: :.: CCDS11 GRPMEPESEFIIKIQDINDNEPKFLDGPYVATVPEMSPVGTSVIQVTATDADDPTYGNSA 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB5 -LRFSILQQGSPELFSIDELTGEIRTVQVGLDREVVAVYNLTLQVADMSGD--GLTATAS . .:::: :.: ::.: :: :::. ...:::. :.. .:. ::.:. ::..:.. CCDS11 RVVYSILQ-GQP-YFSVDSKTGVIRTALMNMDREAKEYYEVIIQAKDMGGQLGGLAGTTT 210 220 230 240 250 250 260 270 280 290 300 pF1KB5 AIITLDDINDNAPEFTRDEFFMEAIEAVS-GVDVGRLEVEDRDLPGSPNWVARFTILEGD . :::.:.::: :.: . .. : ..:.. . ::: : .:: . : ..::..:: CCDS11 VNITLSDVNDNPPRFPQKHYQMSVLESAPISSTVGR--VFAKDLDEGINAEMKYTIVDGD 260 270 280 290 300 310 310 320 330 340 350 360 pF1KB5 PDGQFTIRTDPKTNEGVLSIVKALDYESCEHYELKVSVQN-EAPLQAAALRAERGQAKVR : : :::. . :.... : :..:: . : ::: : . .. : . . :. CCDS11 GADAFDISTDPNFQVGIITVKKPLSFESKKSYTLKVEGANPHLEMRFLNLGPFQDTTTVH 320 330 340 350 360 370 370 380 390 400 410 420 pF1KB5 VHVQDTNEPPVFQENPLRTSLAEGAPPGTLVATFSARDPD-TEQLQRLSYSKDYDPEDWL . :.:..:::::. . . . : . :: . .::.::: :.. : : ... :: .. CCDS11 ISVEDVDEPPVFEPGFYFVEVPEDVAIGTTIQIISAKDPDVTNNSIRYSIDRSSDPGRFF 380 390 400 410 420 430 430 440 450 460 470 480 pF1KB5 QVDAATGRIQTQHVLSPASPFLKGGWYRAIVLAQDDASQPRTATGTLSIEILEVNDHAPV :: .:: ..: . :. : .:. :::.. . .... ..:..:.:::.:: CCDS11 YVDITTGALMTARPLD-REEF---SWHNITVLAMEMNNPSQVGSVPVTIKVLDVNDNAPE 440 450 460 470 480 490 490 500 510 520 530 540 pF1KB5 LAPPPPGSLCSEPHQGPGL-LLGATDEDLPPHGAPFHFQLSPRLPELGRNWSLSQVNVSH . . .: . . : . ..:.:.: : .: :...:.:. . . :... . . . CCDS11 FPRFYEAFVCENAKAGQLIQTVSAVDQDDPRNGQHFYYSLAPEAAN-NPNFTIRDNQDNT 500 510 520 530 540 550 550 560 570 580 590 pF1KB5 ARLRPRH----QVPEGLHRLSLLLRDSGQPPQQREQPLNVTVCRCGKDG---VCLPGAAA ::. :. : ... .: .:. ::::: . :.. :: : :: : : : CCDS11 ARILTRRSGFRQQEQSVFHLPILIADSGQPVLSSTGTLTIQVCSCDDDGHVMSCSPEAYM 560 570 580 590 600 610 600 610 620 630 640 650 pF1KB5 LLAGGTGLSLGALVIVLASALLLLVLVLLVALRARFWKQSRGKGLLHGPQDDLRDNVLNY : ..:: :::. .:: ..:::::::. : :: . ......:.. : CCDS11 L---PVSLSRGALIAILACIFVLLVLVLLILSMRRHRKQPY----IIDDEENIHENIVRY 620 630 640 650 660 660 670 680 690 700 pF1KB5 DEQGGGEEDQDAYDISQLRHPTALSLPLGPPPLRRDA-PQ----GRLHPQPPRVLPTSPL :..:::::: .:.::. . .: . . : :.: :. .: :: : : CCDS11 DDEGGGEEDTEAFDIAAMWNPRE-AQAGAAPKTRQDMLPEIESLSRYVPQTCAVNST--- 670 680 690 700 710 720 710 720 730 740 750 760 pF1KB5 DIADFINDGLEAADSDPSVPPYDTALIYDYEGDGSVAGTLSSILSSQGDEDQDYDYLRDW . ... : :: : .::.:. : .::::::::.:::. :. .: .:..:.: :: CCDS11 -VHSYVLAKLYEADMDLWAPPFDSLQTYMFEGDGSVAGSLSSLQSATSDSEQSFDFLTDW 730 740 750 760 770 780 770 780 790 800 810 pF1KB5 GPRFARLADMYGHPCGLEYGARWDHQAREGLSPGALLPRHRGRTA :::: .::..:: : CCDS11 GPRFRKLAELYGASEGPAPLW 790 800 814 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:54:56 2016 done: Tue Nov 8 05:54:57 2016 Total Scan time: 4.910 Total Display time: 0.320 Function used was FASTA [36.3.4 Apr, 2011]