FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5755, 810 aa 1>>>pF1KB5755 810 - 810 aa - 810 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.1090+/-0.000891; mu= 17.5619+/- 0.054 mean_var=107.3828+/-21.246, 0's: 0 Z-trim(109.6): 190 B-trim: 26 in 1/52 Lambda= 0.123768 statistics sampled from 10780 (10976) to 10780 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.697), E-opt: 0.2 (0.337), width: 16 Scan time: 2.890 The best scores are: opt bits E(32554) CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 5880 1061.2 0 CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040) 2359 432.8 2.7e-120 CCDS33757.2 MST1 gene_id:4485|Hs108|chr3 ( 725) 1109 209.3 1.9e-53 CCDS55074.1 PLG gene_id:5340|Hs108|chr6 ( 136) 907 172.6 3.9e-43 CCDS47627.1 HGF gene_id:3082|Hs108|chr7 ( 290) 811 155.7 1e-37 CCDS47628.1 HGF gene_id:3082|Hs108|chr7 ( 285) 777 149.7 6.7e-36 CCDS47626.1 HGF gene_id:3082|Hs108|chr7 ( 723) 775 149.6 1.7e-35 CCDS5597.1 HGF gene_id:3082|Hs108|chr7 ( 728) 775 149.6 1.7e-35 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 681 132.7 1.4e-30 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 681 132.7 1.4e-30 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 667 130.1 6e-30 CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 656 128.5 5.6e-29 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 646 126.5 1.2e-28 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 645 126.3 1.3e-28 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 645 126.3 1.4e-28 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 636 124.5 2.4e-28 CCDS32490.1 CTRB1 gene_id:1504|Hs108|chr16 ( 263) 624 122.3 1.1e-27 CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 620 121.6 1.8e-27 CCDS32489.1 CTRB2 gene_id:440387|Hs108|chr16 ( 263) 612 120.2 4.7e-27 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 616 121.3 6.6e-27 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 616 121.3 6.6e-27 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 612 120.4 7.5e-27 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 612 120.4 7.9e-27 CCDS33238.1 PLGLB1 gene_id:5343|Hs108|chr2 ( 96) 600 117.7 9.6e-27 CCDS1999.1 PLGLB2 gene_id:5342|Hs108|chr2 ( 96) 600 117.7 9.6e-27 CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 606 119.4 1.8e-26 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 605 119.2 2.2e-26 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 605 119.4 3.2e-26 CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 580 114.5 2.6e-25 CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 580 114.6 3.3e-25 CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 580 114.6 3.6e-25 CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 580 114.6 3.6e-25 CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 580 114.6 3.6e-25 CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 576 113.8 4.7e-25 CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 573 113.2 5.9e-25 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 574 113.7 9.9e-25 CCDS56570.1 PRSS3 gene_id:5646|Hs108|chr9 ( 240) 567 112.1 1.1e-24 CCDS6545.1 PRSS3 gene_id:5646|Hs108|chr9 ( 247) 567 112.1 1.2e-24 CCDS56571.1 PRSS3 gene_id:5646|Hs108|chr9 ( 261) 567 112.1 1.2e-24 CCDS47958.1 PRSS3 gene_id:5646|Hs108|chr9 ( 304) 567 112.2 1.4e-24 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 572 113.4 1.4e-24 CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 568 112.5 1.5e-24 CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 568 112.5 1.5e-24 CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 561 111.1 2.6e-24 CCDS5872.1 PRSS1 gene_id:5644|Hs108|chr7 ( 247) 559 110.7 3.1e-24 CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 557 110.5 5.9e-24 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 561 111.5 6.7e-24 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 561 111.5 7.3e-24 CCDS83236.1 PRSS2 gene_id:5645|Hs108|chr7 ( 247) 549 108.9 1.1e-23 CCDS8812.1 CELA1 gene_id:1990|Hs108|chr12 ( 258) 547 108.6 1.4e-23 >>CCDS5279.1 PLG gene_id:5340|Hs108|chr6 (810 aa) initn: 5880 init1: 5880 opt: 5880 Z-score: 5676.3 bits: 1061.2 E(32554): 0 Smith-Waterman score: 5880; 99.9% identity (99.9% similar) in 810 aa overlap (1-810:1-810) 10 20 30 40 50 60 pF1KB5 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 GITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 GITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 CEEECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 CEEECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDRE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 LRPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 LRPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 AQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDSSPVSTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 AQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDSSPVSTE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 QLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENYPNAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 QLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENYPNAG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 LTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETPSEED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 LTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETPSEED 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB5 CMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPDGDVGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 CMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPDGDVGG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB5 PWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQVSLRT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 PWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQVSLRT 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB5 RFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNLEPHVQEIEVSRLFLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 RFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNLEPHVQEIEVSRLFLE 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB5 PTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGAGLLKEAQ ::::::::::::::: :::::::::::::::::::::::::::::::::::::::::::: CCDS52 PTRKDIALLKLSSPAVITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGAGLLKEAQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB5 LPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYILQGVTSW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS52 LPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYILQGVTSW 730 740 750 760 770 780 790 800 810 pF1KB5 GLGCARPNKPGVYVRVSRFVTWIEGVMRNN :::::::::::::::::::::::::::::: CCDS52 GLGCARPNKPGVYVRVSRFVTWIEGVMRNN 790 800 810 >>CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040 aa) initn: 2309 init1: 2287 opt: 2359 Z-score: 2273.1 bits: 432.8 E(32554): 2.7e-120 Smith-Waterman score: 3626; 63.9% identity (78.0% similar) in 785 aa overlap (95-810:1266-2040) 70 80 90 100 110 120 pF1KB5 QYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGITC :.. ...: :.:..:::..: : .: :: CCDS43 RWEYCNLTQCPVTESSVLATSTAVSEQAPTEQSPTVQDCYHGDGQSYRGSFSTTVTGRTC 1240 1250 1260 1270 1280 1290 130 140 150 160 170 180 pF1KB5 QKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILEC--- :.::: .:: . . .:. :: .::::::: . . ::::: :: :..::.. .: CCDS43 QSWSSMTPHWHQRTTEYYPNGGLTRNYCRNPDAEIR-PWCYTMDPSVRWEYCNLTQCPVM 1300 1310 1320 1330 1340 1350 190 200 210 pF1KB5 --------------------EE----------ECMHCSGENYDGKISKTMSGLECQAWDS :: .:.. .:..: : .: :..: ::.:.: CCDS43 ESTLLTTPTVVPVPSTELPSEEAPTENSTGVQDCYRGDGQSYRGTLSTTITGRTCQSWSS 1360 1370 1380 1390 1400 1410 220 230 240 250 260 pF1KB5 QSPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRC--------T ..:: : :: .:: .: .::::::: :.::::.: ::. ::: :.. :: : CCDS43 MTPHWHRRIPLYYPNAGLTRNYCRNPDAEIRPWCYTMDPSVRWEYCNLTRCPVTESSVLT 1420 1430 1440 1450 1460 1470 270 280 290 300 pF1KB5 TP---------------PPSSGPTYQ-CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTH :: :: ..:. : : .: :..::: ..::.:.::: ::.. :: : CCDS43 TPTVAPVPSTEAPSEQAPPEKSPVVQDCYHGDGRSYRGISSTTVTGRTCQSWSSMIPHWH 1480 1490 1500 1510 1520 1530 310 320 330 340 350 pF1KB5 NRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDSS-----------P .:::::.: .: ::::::::. . :::.::. ::::::.. .:. . : CCDS43 QRTPENYPNAGLTENYCRNPDSGKQPWCYTTDPCVRWEYCNLTQCSETESGVLETPTVVP 1540 1550 1560 1570 1580 1590 360 370 380 390 400 410 pF1KB5 V-STEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPEN : : : . .:: : ::::..::::.::::::: :::.::. :::::::::::::.:::: CCDS43 VPSMEAHSEAAPTEQTPVVRQCYHGNGQSYRGTFSTTVTGRTCQSWSSMTPHRHQRTPEN 1600 1610 1620 1630 1640 1650 420 430 440 450 460 470 pF1KB5 YPNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVET ::: ::::::::::::: :::::: :::.::::::: .:: ::..::::: :. .:.. CCDS43 YPNDGLTMNYCRNPDADTGPWCFTMDPSIRWEYCNLTRCSDTEGTVVAPPTVIQVPSLGP 1660 1670 1680 1690 1700 1710 480 490 500 510 520 530 pF1KB5 PSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPD :::.:::::::::::::.::::::::::.:::::::::: : : :: :::::::::::: CCDS43 PSEQDCMFGNGKGYRGKKATTVTGTPCQEWAAQEPHRHSTFIPGTNKWAGLEKNYCRNPD 1720 1730 1740 1750 1760 1770 540 550 560 570 580 590 pF1KB5 GDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQ ::..:::::: :::::.::::.: ::. :::::::::::::::: .:::::::::::::: CCDS43 GDINGPWCYTMNPRKLFDYCDIPLCASSSFDCGKPQVEPKKCPGSIVGGCVAHPHSWPWQ 1780 1790 1800 1810 1820 1830 600 610 620 630 640 650 pF1KB5 VSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNLEPHVQEIEVS :::::::: ::::::::::::::::::::.:: :::::::::::::::::: :::::::: CCDS43 VSLRTRFGKHFCGGTLISPEWVLTAAHCLKKSSRPSSYKVILGAHQEVNLESHVQEIEVS 1840 1850 1860 1870 1880 1890 660 670 680 690 700 710 pF1KB5 RLFLEPTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGAGL :::::::. :::::::: :: :::::.:::::::.:.:. ::::.::::::::::::.:: CCDS43 RLFLEPTQADIALLKLSRPAVITDKVMPACLPSPDYMVTARTECYITGWGETQGTFGTGL 1900 1910 1920 1930 1940 1950 720 730 740 750 760 770 pF1KB5 LKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYILQ :::::: ::::.:::.:... :: ::: :::::::::::::::::::::::: CCDS43 LKEAQLLVIENEVCNHYKYI---------CAEHLARGTDSCQGDSGGPLVCFEKDKYILQ 1960 1970 1980 1990 2000 780 790 800 810 pF1KB5 GVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN ::::::::::::::::::.:::::::::::.:::: CCDS43 GVTSWGLGCARPNKPGVYARVSRFVTWIEGMMRNN 2010 2020 2030 2040 >-- initn: 600 init1: 600 opt: 898 Z-score: 863.2 bits: 172.0 E(32554): 9.3e-42 Smith-Waterman score: 1493; 48.3% identity (69.2% similar) in 439 aa overlap (183-574:26-462) 160 170 180 190 200 210 pF1KB5 RNPDNDPQGPWCYTTDPEKRYDYCDILECEEECMHCSGENYDGKISKTMSGLECQAWDSQ ..:.: .:..: : : :..: ::::.:. CCDS43 MEHKEVVLLLLLFLKSAAPEQSHVVQDCYHGDGQSYRGTYSTTVTGRTCQAWSSM 10 20 30 40 50 220 230 240 250 260 pF1KB5 SPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCT--------- .:: :. ..:: .: ::::::: :.:.: ::. ::: :.. .:. CCDS43 TPHQHNRTTENYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAP 60 70 80 90 100 110 270 280 290 300 pF1KB5 ---TPPPS------SGPTYQ------CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHN :: :: ..:: : : .:.:..:::. ..::.:.::: ::..:::.:. CCDS43 PTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS 120 130 140 150 160 170 310 320 330 340 350 pF1KB5 RTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDS-----------SPV :::: .: .: :::::::. ::.:.: . ::::::.. .:.. .:: CCDS43 RTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPV 180 190 200 210 220 230 360 370 380 390 400 410 pF1KB5 -STEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY : : . :: : : ::.::::.::::::: :::.::. ::.::::::: :..::: : CCDS43 PSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYY 240 250 260 270 280 290 420 430 440 450 460 470 pF1KB5 PNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETP ::::: ::::::::: .:.:.: ::.:::::::: .:: .:...:::: :. .:..:.: CCDS43 PNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAP 300 310 320 330 340 350 480 490 500 510 520 pF1KB5 SEE----------DCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGL ::. .:. :::..::: .::::: :: :... :: :: ::: : ::: CCDS43 SEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS-RTPEYYPNAGL 360 370 380 390 400 410 530 540 550 560 570 580 pF1KB5 EKNYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCA-APSFDCGKPQVEPKKCPGRVVGGC :::::::. :..:.::: .: ..::.. ::. : . . : : : CCDS43 IMNYCRNPDA-VAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQA 420 430 440 450 460 470 590 600 610 620 630 640 pF1KB5 VAHPHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNL CCDS43 PTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYC 480 490 500 510 520 530 >-- initn: 586 init1: 586 opt: 888 Z-score: 853.5 bits: 170.2 E(32554): 3.2e-41 Smith-Waterman score: 1509; 48.5% identity (69.2% similar) in 439 aa overlap (183-574:482-918) 160 170 180 190 200 210 pF1KB5 RNPDNDPQGPWCYTTDPEKRYDYCDILECEEECMHCSGENYDGKISKTMSGLECQAWDSQ .::.: .:..: : : :..: ::::.:. CCDS43 GTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSM 460 470 480 490 500 510 220 230 240 250 260 pF1KB5 SPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCT--------- .::.:. : .:: .: ::::::: :.:.: ::. ::: :.. .:. CCDS43 TPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAP 520 530 540 550 560 570 270 280 290 300 pF1KB5 ---TPPPS------SGPTYQ------CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHN :: :: ..:: : : .:.:..:::. ..::.:.::: ::..:::.:. CCDS43 PTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS 580 590 600 610 620 630 310 320 330 340 350 pF1KB5 RTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDS-----------SPV :::: .: .: :::::::. ::.:.: . ::::::.. .:.. .:: CCDS43 RTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPV 640 650 660 670 680 690 360 370 380 390 400 410 pF1KB5 -STEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY : : . :: : : ::.::::.::::::: :::.::. ::.::::::: :..::: : CCDS43 PSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYY 700 710 720 730 740 750 420 430 440 450 460 470 pF1KB5 PNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETP ::::: ::::::::: .:.:.: ::.:::::::: .:: .:...:::: :. .:..:.: CCDS43 PNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAP 760 770 780 790 800 810 480 490 500 510 520 pF1KB5 SEE----------DCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGL ::. .:. :::..::: .::::: :: :... :: :: ::: : ::: CCDS43 SEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS-RTPEYYPNAGL 820 830 840 850 860 870 530 540 550 560 570 580 pF1KB5 EKNYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCA-APSFDCGKPQVEPKKCPGRVVGGC ::::::: :..:.::: .: ..::.. ::. : . . : . : CCDS43 IMNYCRNPD-PVAAPYCYTRDPSVRWEYCNLTQCSDAEGTAVAPPTITPIPSLEAPSEQA 880 890 900 910 920 590 600 610 620 630 640 pF1KB5 VAHPHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNL CCDS43 PTEQRPGVQECYHGNGQSYQGTYFITVTGRTCQAWSSMTPHSHSRTPAYYPNAGLIKNYC 930 940 950 960 970 980 >-- initn: 558 init1: 558 opt: 884 Z-score: 849.7 bits: 169.5 E(32554): 5.2e-41 Smith-Waterman score: 1196; 51.2% identity (70.5% similar) in 322 aa overlap (183-468:938-1259) 160 170 180 190 200 210 pF1KB5 RNPDNDPQGPWCYTTDPEKRYDYCDILECEEECMHCSGENYDGKISKTMSGLECQAWDSQ .::.: .:..:.: :..: ::::.:. CCDS43 GTAVAPPTITPIPSLEAPSEQAPTEQRPGVQECYHGNGQSYQGTYFITVTGRTCQAWSSM 910 920 930 940 950 960 220 230 240 250 260 pF1KB5 SPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCT-------TP .::.:. :. .:: .: :::::::: :::.::::. ::: :.. ::. .: CCDS43 TPHSHSRTPAYYPNAGLIKNYCRNPDPVAAPWCYTTDPSVRWEYCNLTRCSDAEWTAFVP 970 980 990 1000 1010 1020 270 280 290 300 pF1KB5 P-----PS-----------SGPTYQ-CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHN : :: : : : :..:::. ..::.:.::: ::..::: :. CCDS43 PNVILAPSLEAFFEQALTEETPGVQDCYYHYGQSYRGTYSTTVTGRTCQAWSSMTPHQHS 1030 1040 1050 1060 1070 1080 310 320 330 340 350 360 pF1KB5 RTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSC---DSSPVSTEQLAPT :::::.: .: .:::::::.. :::.: . .::::::.. .: .:: ..: ..: CCDS43 RTPENYPNAGLTRNYCRNPDAEIRPWCYTMDPSVRWEYCNLTQCLVTESSVLATLTVVPD 1090 1100 1110 1120 1130 1140 370 380 390 400 410 pF1KB5 ---------APPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY :: : .: ::::::::::::::. :::.::. :::::::::: ::.: : : CCDS43 PSTEASSEEAPTEQSPGVQDCYHGDGQSYRGSFSTTVTGRTCQSWSSMTPHWHQRTTEYY 1150 1160 1170 1180 1190 1200 420 430 440 450 460 470 pF1KB5 PNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETP ::.::: ::::::::. .:::.: ::.:::::::: .: ::.::.: .: CCDS43 PNGGLTRNYCRNPDAEISPWCYTMDPNVRWEYCNLTQCPVTESSVLATSTAVSEQAPTEQ 1210 1220 1230 1240 1250 1260 480 490 500 510 520 530 pF1KB5 SEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPDG CCDS43 SPTVQDCYHGDGQSYRGSFSTTVTGRTCQSWSSMTPHWHQRTTEYYPNGGLTRNYCRNPD 1270 1280 1290 1300 1310 1320 >>CCDS33757.2 MST1 gene_id:4485|Hs108|chr3 (725 aa) initn: 1330 init1: 364 opt: 1109 Z-score: 1072.9 bits: 209.3 E(32554): 1.9e-53 Smith-Waterman score: 1885; 38.2% identity (59.4% similar) in 820 aa overlap (9-808:20-723) 10 20 30 pF1KB5 MEHKEVVLLLLLFLKS----GQGEPLDDYVNTQGASLFSVTKK------ ::::. . :: ::.:. .:. : . . CCDS33 MGLWWVTVQPPARRMGWLPLLLLLTQCLGVPGQRSPLNDFQVLRGTELQHLLHAVVPGPW 10 20 30 40 50 60 40 50 60 70 80 90 pF1KB5 QLGAGSIEECAAKCEEDEEFTCRAFQYHSKEQQCVIMAENRKS--SIIIRMRDVVLFEKK : ... ::::..: . ::::.:. . . : .. ...: . . : ::.:: CCDS33 QEDVADAEECAGRC--GPLMDCRAFHYNVSSHGCQLLPWTQHSPHTRLRRSGRCDLFQKK 70 80 90 100 110 100 110 120 130 140 150 pF1KB5 VYLSECKTGNGKNYRGTMSKTKNGITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDN :. : .:: .:::::. : .:. :: :: :. ...:. . .:::::.:::::. CCDS33 DYVRTCIMNNGVGYRGTMATTVGGLPCQAWSHKFPNDHKYTPTLR--NGLEENFCRNPDG 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB5 DPQGPWCYTTDPEKRYDYCDILECEEE-CMHCSGENYDGKISKTMSGLECQAWDSQSPHA :: ::::::::: :.. : : :.: :. :.::.: : ...: :: ::: :: : :: CCDS33 DPGGPWCYTTDPAVRFQSCGIKSCREAACVWCNGEEYRGAVDRTESGRECQRWDLQHPHQ 180 190 200 210 220 230 220 230 240 250 260 270 pF1KB5 HGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCTTP--PPSSGPTYQ : . :.:: ...: ::::::: ::::.::::. . :.::.::: . : . . : . CCDS33 HPFEPGKFLDQGLDDNYCRNPDGSERPWCYTTDPQIEREFCDLPRCGSEAQPRQEATTVS 240 250 260 270 280 290 280 290 300 310 320 330 pF1KB5 CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPW :..: ::.:::.. .:..: ::.:.:: :: : :::.. ::.: ::.::::::..::: CCDS33 CFRGKGEGYRGTANTTTAGVPCQRWDAQIPHQHRFTPEKYACKDLRENFCRNPDGSEAPW 300 310 320 330 340 350 340 350 360 370 380 390 pF1KB5 CHTTNSQVRWEYC-KIPSCDSSPVSTEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTT : : .: .: .: : :... : :::::: :..:::: : : CCDS33 CFTLRPGMRAAFCYQIRRC------TDDVRP----------QDCYHGAGEQYRGTVSKTR 360 370 380 390 400 400 410 420 430 440 450 pF1KB5 TGKKCQSWSSMTPHRHQKTPENYPNAGLTMNYCRNPDADK-GPWCFTTDPSVRWEYCNLK : .:: ::. :::. : : . :.: : :.:::::.:. ::::.: :: . ..:: :. CCDS33 KGVQCQRWSAETPHKPQFTFTSEPHAQLEENFCRNPDGDSHGPWCYTMDPRTPFDYCALR 410 420 430 440 450 460 460 470 480 490 500 510 pF1KB5 KCSGTEASVVAPPPVVLLPDVETPSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHR .:. . :: .: : .. :. : :::. . .: CCDS33 RCADDQ------PPSILDPPDQVQFEK-C---------GKRVDRLD------------QR 470 480 490 520 530 540 550 560 570 pF1KB5 HSIFTPETNPRAGLEKNYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQV .: :: CCDS33 RS-----------------------------------KL--------------------- 580 590 600 610 620 630 pF1KB5 EPKKCPGRVVGGCVAHPHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRP-S ::::: :: . :: ::::.: :.:::::.:.. .:.::: .:. . : . CCDS33 -------RVVGG---HPGNSPWTVSLRNRQGQHFCGGSLVKEQWILTARQCFSSCHMPLT 500 510 520 530 540 640 650 660 670 680 pF1KB5 SYKVILGA--HQEVNLEPHVQEIEVSRLFLEPTRKDIALLKLSSPADITDKVIPACLPSP .:.: ::. .. . :: .:.. :... :. ....:::: . ....: ::: CCDS33 GYEVWLGTLFQNPQHGEPSLQRVPVAKMVCGPSGSQLVLLKLERSVTLNQRVALICLPPE 550 560 570 580 590 600 690 700 710 720 730 740 pF1KB5 NYVVADRTECFITGWGETQGTFGAGLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHL ::: :.: :.:::::.:: . .:. : : :: :. :: . :::. .:.:. : CCDS33 WYVVPPGTKCEIAGWGETKGTGNDTVLNVALLNVISNQECNIKH--RGRVRESEMCTEGL 610 620 630 640 650 660 750 760 770 780 790 800 pF1KB5 AGGTDSCQGDSGGPLVCFEKDKYILQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRN . . .:.:: ::::.:: .. ..:.:. . ::: :.:..::: :: ::. ::: CCDS33 LAPVGACEGDYGGPLACFTHNCWVLEGIIIPNRVCARSRWPAVFTRVSVFVDWIHKVMRL 670 680 690 700 710 720 810 pF1KB5 N CCDS33 G >>CCDS55074.1 PLG gene_id:5340|Hs108|chr6 (136 aa) initn: 907 init1: 907 opt: 907 Z-score: 887.8 bits: 172.6 E(32554): 3.9e-43 Smith-Waterman score: 907; 100.0% identity (100.0% similar) in 136 aa overlap (1-136:1-136) 10 20 30 40 50 60 pF1KB5 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 GITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILE :::::::::::::::: CCDS55 GITCQKWSSTSPHRPR 130 >>CCDS47627.1 HGF gene_id:3082|Hs108|chr7 (290 aa) initn: 855 init1: 373 opt: 811 Z-score: 790.7 bits: 155.7 E(32554): 1e-37 Smith-Waterman score: 811; 45.1% identity (70.8% similar) in 233 aa overlap (37-264:61-290) 10 20 30 40 50 60 pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF ::: ... ..:: .: ... :::.:: CCDS47 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF 40 50 60 70 80 70 80 90 100 110 120 pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI . . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.:: CCDS47 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE :: ::: ::. : :... .. :.::::::: .. ::::.:..:: ::. ::: .: CCDS47 KCQPWSSMIPHEHSFLPSSYRGKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL : ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: . CCDS47 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP 210 220 230 240 250 260 250 260 270 280 290 300 pF1KB5 RPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWSA ::::.: ::. ::: : : : : CCDS47 RPWCYTLDPHTRWEYCAIKTCET 270 280 290 >>CCDS47628.1 HGF gene_id:3082|Hs108|chr7 (285 aa) initn: 1190 init1: 373 opt: 777 Z-score: 758.0 bits: 149.7 E(32554): 6.7e-36 Smith-Waterman score: 777; 44.2% identity (69.1% similar) in 233 aa overlap (37-264:61-285) 10 20 30 40 50 60 pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF ::: ... ..:: .: ... :::.:: CCDS47 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF 40 50 60 70 80 70 80 90 100 110 120 pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI . . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.:: CCDS47 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE :: ::: ::. . .. :.::::::: .. ::::.:..:: ::. ::: .: CCDS47 KCQPWSSMIPHEHSYR-----GKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL : ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: . CCDS47 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP 210 220 230 240 250 260 250 260 270 280 290 300 pF1KB5 RPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWSA ::::.: ::. ::: : : : : CCDS47 RPWCYTLDPHTRWEYCAIKTCET 270 280 >>CCDS47626.1 HGF gene_id:3082|Hs108|chr7 (723 aa) initn: 1234 init1: 380 opt: 775 Z-score: 750.6 bits: 149.6 E(32554): 1.7e-35 Smith-Waterman score: 1669; 35.3% identity (57.1% similar) in 784 aa overlap (37-807:61-715) 10 20 30 40 50 60 pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF ::: ... ..:: .: ... :::.:: CCDS47 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF 40 50 60 70 80 70 80 90 100 110 120 pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI . . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.:: CCDS47 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE :: ::: ::. . .. :.::::::: .. ::::.:..:: ::. ::: .: CCDS47 KCQPWSSMIPHEHSYR-----GKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL : ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: . CCDS47 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP 210 220 230 240 250 260 250 260 270 280 290 pF1KB5 RPWCFTTDPNKRWELCDIPRCT--TPPPSSGP--TYQCLKGTGENYRGNVAVTVSGHTCQ ::::.: ::. ::: : : :. : .. : : .:..: ::.:::.: . .: :: CCDS47 RPWCYTLDPHTRWEYCAIKTCADNTMNDTDVPLETTECIQGQGEGYRGTVNTIWNGIPCQ 270 280 290 300 310 320 300 310 320 330 340 350 pF1KB5 HWSAQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYC-KIPSCDSSP .:..: :: :. ::::: ::.: :::::::::...::: ::. ..: :: .::.:: : CCDS47 RWDSQYPHEHDMTPENFKCKDLRENYCRNPDGSESPWCFTTDPNIRVGYCSQIPNCDMSH 330 340 350 360 370 380 360 370 380 390 400 410 pF1KB5 VSTEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY ::::.:.:..: :. : : .: :. :.. :.. . CCDS47 G-----------------QDCYRGNGKNYMGNLSQTRSGLTCSMWDKNMEDLHRHIFWEP 390 400 410 420 420 430 440 450 460 470 pF1KB5 PNAGLTMNYCRNPDAD-KGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVET . :. ::::::: : .::::.: .: . :.:: ...: : . : .: : CCDS47 DASKLNENYCRNPDDDAHGPWCYTGNPLIPWDYCPISRCEGD-----TTPTIVNL----- 430 440 450 460 470 480 490 500 510 520 530 pF1KB5 PSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPD CCDS47 ------------------------------------------------------------ 540 550 560 570 580 590 pF1KB5 GDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQ :. : ..:.: . :::.: . . :. CCDS47 -----------------DH--------PVISCAKTK------QLRVVNG-IPTRTNIGWM 480 490 500 600 610 620 630 640 650 pF1KB5 VSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAH--QEVNLEPHVQEIE :::: : . :.:::.::. ::::: .:. : ..:.. :: : . . : : .. CCDS47 VSLRYR-NKHICGGSLIKESWVLTARQCFP-SRDLKDYEAWLGIHDVHGRGDEKCKQVLN 510 520 530 540 550 560 660 670 680 690 700 710 pF1KB5 VSRLFLEPTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGA ::.: : .:..:.::. :: . : : ::. . .. ..: : . ::: : CCDS47 VSQLVYGPEGSDLVLMKLARPAVLDDFVSTIDLPNYGCTIPEKTSCSVYGWGYTGLINYD 570 580 590 600 610 620 720 730 740 750 760 770 pF1KB5 GLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYI :::. :.: .. :. :.... . .. .:.::: :. :.:: :::::: .. . CCDS47 GLLRVAHLYIMGNEKCSQHHRGKVTLNESEICAGAEKIGSGPCEGDYGGPLVCEQHKMRM 630 640 650 660 670 680 780 790 800 810 pF1KB5 LQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN . :: : ::: ::.::..:::. .. ::. .. CCDS47 VLGVIVPGRGCAIPNRPGIFVRVAYYAKWIHKIILTYKVPQS 690 700 710 720 >>CCDS5597.1 HGF gene_id:3082|Hs108|chr7 (728 aa) initn: 1329 init1: 380 opt: 775 Z-score: 750.6 bits: 149.6 E(32554): 1.7e-35 Smith-Waterman score: 1703; 35.6% identity (57.7% similar) in 784 aa overlap (37-807:61-720) 10 20 30 40 50 60 pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF ::: ... ..:: .: ... :::.:: CCDS55 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF 40 50 60 70 80 70 80 90 100 110 120 pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI . . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.:: CCDS55 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI 90 100 110 120 130 140 130 140 150 160 170 180 pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE :: ::: ::. : :... .. :.::::::: .. ::::.:..:: ::. ::: .: CCDS55 KCQPWSSMIPHEHSFLPSSYRGKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS 150 160 170 180 190 200 190 200 210 220 230 240 pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL : ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: . CCDS55 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP 210 220 230 240 250 260 250 260 270 280 290 pF1KB5 RPWCFTTDPNKRWELCDIPRCT--TPPPSSGP--TYQCLKGTGENYRGNVAVTVSGHTCQ ::::.: ::. ::: : : :. : .. : : .:..: ::.:::.: . .: :: CCDS55 RPWCYTLDPHTRWEYCAIKTCADNTMNDTDVPLETTECIQGQGEGYRGTVNTIWNGIPCQ 270 280 290 300 310 320 300 310 320 330 340 350 pF1KB5 HWSAQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYC-KIPSCDSSP .:..: :: :. ::::: ::.: :::::::::...::: ::. ..: :: .::.:: : CCDS55 RWDSQYPHEHDMTPENFKCKDLRENYCRNPDGSESPWCFTTDPNIRVGYCSQIPNCDMSH 330 340 350 360 370 380 360 370 380 390 400 410 pF1KB5 VSTEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY ::::.:.:..: :. : : .: :. :.. :.. . CCDS55 G-----------------QDCYRGNGKNYMGNLSQTRSGLTCSMWDKNMEDLHRHIFWEP 390 400 410 420 430 420 430 440 450 460 470 pF1KB5 PNAGLTMNYCRNPDAD-KGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVET . :. ::::::: : .::::.: .: . :.:: ...: : . : .: : CCDS55 DASKLNENYCRNPDDDAHGPWCYTGNPLIPWDYCPISRCEGD-----TTPTIVNL----- 440 450 460 470 480 480 490 500 510 520 530 pF1KB5 PSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPD CCDS55 ------------------------------------------------------------ 540 550 560 570 580 590 pF1KB5 GDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQ :. : ..:.: . :::.: . . :. CCDS55 -----------------DH--------PVISCAKTK------QLRVVNG-IPTRTNIGWM 490 500 600 610 620 630 640 650 pF1KB5 VSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAH--QEVNLEPHVQEIE :::: : . :.:::.::. ::::: .:. : ..:.. :: : . . : : .. CCDS55 VSLRYR-NKHICGGSLIKESWVLTARQCFP-SRDLKDYEAWLGIHDVHGRGDEKCKQVLN 510 520 530 540 550 560 660 670 680 690 700 710 pF1KB5 VSRLFLEPTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGA ::.: : .:..:.::. :: . : : ::. . .. ..: : . ::: : CCDS55 VSQLVYGPEGSDLVLMKLARPAVLDDFVSTIDLPNYGCTIPEKTSCSVYGWGYTGLINYD 570 580 590 600 610 620 720 730 740 750 760 770 pF1KB5 GLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYI :::. :.: .. :. :.... . .. .:.::: :. :.:: :::::: .. . CCDS55 GLLRVAHLYIMGNEKCSQHHRGKVTLNESEICAGAEKIGSGPCEGDYGGPLVCEQHKMRM 630 640 650 660 670 680 780 790 800 810 pF1KB5 LQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN . :: : ::: ::.::..:::. .. ::. .. CCDS55 VLGVIVPGRGCAIPNRPGIFVRVAYYAKWIHKIILTYKVPQS 690 700 710 720 >>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa) initn: 629 init1: 364 opt: 681 Z-score: 662.6 bits: 132.7 E(32554): 1.4e-30 Smith-Waterman score: 681; 41.2% identity (68.9% similar) in 257 aa overlap (559-810:203-450) 530 540 550 560 570 580 pF1KB5 NYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAH ::.: ::. . .:.::: .. CCDS58 DHLLPDDKVTALHHSVYVREGCASGHVVTLQCTA----CGH----RRGYSSRIVGGNMSL 180 190 200 210 220 590 600 610 620 630 640 pF1KB5 PHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEV-NLEP .::::.::. . :.:.:::..:.: :..:::::. :.:. . .: . . : : CCDS58 LSQWPWQASLQFQ-GYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAP 230 240 250 260 270 280 650 660 670 680 690 700 pF1KB5 -HVQEIEVSRLFLEPTR--KDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGW :. : : . .: : .::::.::..: ... . :.:::. . : :. .:: CCDS58 SHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGW 290 300 310 320 330 340 710 720 730 740 750 760 pF1KB5 GETQ-GTFGAGLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGP : :. : .. .:..: .:.: ::.::. . .: .. . ::::.:.::.:::::::::: CCDS58 GATEDGGDASPVLNHAAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGP 350 360 370 380 390 400 770 780 790 800 810 pF1KB5 LVCFEKDKYILQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN ::: :. . : :.::.:.:::. ::::::.::. :. ::. :. . CCDS58 LVCQERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT 410 420 430 440 450 >>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa) initn: 629 init1: 364 opt: 681 Z-score: 662.6 bits: 132.7 E(32554): 1.4e-30 Smith-Waterman score: 681; 41.5% identity (68.1% similar) in 260 aa overlap (559-810:203-451) 530 540 550 560 570 580 pF1KB5 NYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAH ::.: ::. . .:.::: .. CCDS13 DHLLPDDKVTALHHSVYVREGCASGHVVTLQCTA----CGH----RRGYSSRIVGGNMSL 180 190 200 210 220 590 600 610 620 630 640 pF1KB5 PHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEV-NLEP .::::.::. . :.:.:::..:.: :..:::::. :.:. . .: . . : : CCDS13 LSQWPWQASLQFQ-GYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAP 230 240 250 260 270 280 650 660 670 680 690 700 pF1KB5 -HVQEIEVSRLFLEPTR--KDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGW :. : : . .: : .::::.::..: ... . :.:::. . : :. .:: CCDS13 SHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGW 290 300 310 320 330 340 710 720 730 740 750 760 pF1KB5 GETQGTFGAG----LLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDS : :. ::: .:..: .:.: ::.::. . .: .. . ::::.:.::.::::::: CCDS13 GATED--GAGDASPVLNHAAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDS 350 360 370 380 390 400 770 780 790 800 810 pF1KB5 GGPLVCFEKDKYILQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN :::::: :. . : :.::.:.:::. ::::::.::. :. ::. :. . CCDS13 GGPLVCQERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT 410 420 430 440 450 810 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:14:39 2016 done: Tue Nov 8 17:14:40 2016 Total Scan time: 2.890 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]