FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5755, 810 aa
1>>>pF1KB5755 810 - 810 aa - 810 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.1090+/-0.000891; mu= 17.5619+/- 0.054
mean_var=107.3828+/-21.246, 0's: 0 Z-trim(109.6): 190 B-trim: 26 in 1/52
Lambda= 0.123768
statistics sampled from 10780 (10976) to 10780 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.697), E-opt: 0.2 (0.337), width: 16
Scan time: 2.890
The best scores are: opt bits E(32554)
CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 5880 1061.2 0
CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040) 2359 432.8 2.7e-120
CCDS33757.2 MST1 gene_id:4485|Hs108|chr3 ( 725) 1109 209.3 1.9e-53
CCDS55074.1 PLG gene_id:5340|Hs108|chr6 ( 136) 907 172.6 3.9e-43
CCDS47627.1 HGF gene_id:3082|Hs108|chr7 ( 290) 811 155.7 1e-37
CCDS47628.1 HGF gene_id:3082|Hs108|chr7 ( 285) 777 149.7 6.7e-36
CCDS47626.1 HGF gene_id:3082|Hs108|chr7 ( 723) 775 149.6 1.7e-35
CCDS5597.1 HGF gene_id:3082|Hs108|chr7 ( 728) 775 149.6 1.7e-35
CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 681 132.7 1.4e-30
CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 681 132.7 1.4e-30
CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 667 130.1 6e-30
CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 656 128.5 5.6e-29
CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 646 126.5 1.2e-28
CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 645 126.3 1.3e-28
CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 645 126.3 1.4e-28
CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 636 124.5 2.4e-28
CCDS32490.1 CTRB1 gene_id:1504|Hs108|chr16 ( 263) 624 122.3 1.1e-27
CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 620 121.6 1.8e-27
CCDS32489.1 CTRB2 gene_id:440387|Hs108|chr16 ( 263) 612 120.2 4.7e-27
CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 616 121.3 6.6e-27
CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 616 121.3 6.6e-27
CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 612 120.4 7.5e-27
CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 612 120.4 7.9e-27
CCDS33238.1 PLGLB1 gene_id:5343|Hs108|chr2 ( 96) 600 117.7 9.6e-27
CCDS1999.1 PLGLB2 gene_id:5342|Hs108|chr2 ( 96) 600 117.7 9.6e-27
CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 606 119.4 1.8e-26
CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 605 119.2 2.2e-26
CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 605 119.4 3.2e-26
CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 580 114.5 2.6e-25
CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 580 114.6 3.3e-25
CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 580 114.6 3.6e-25
CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 580 114.6 3.6e-25
CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 580 114.6 3.6e-25
CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 576 113.8 4.7e-25
CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 573 113.2 5.9e-25
CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 574 113.7 9.9e-25
CCDS56570.1 PRSS3 gene_id:5646|Hs108|chr9 ( 240) 567 112.1 1.1e-24
CCDS6545.1 PRSS3 gene_id:5646|Hs108|chr9 ( 247) 567 112.1 1.2e-24
CCDS56571.1 PRSS3 gene_id:5646|Hs108|chr9 ( 261) 567 112.1 1.2e-24
CCDS47958.1 PRSS3 gene_id:5646|Hs108|chr9 ( 304) 567 112.2 1.4e-24
CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 572 113.4 1.4e-24
CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 568 112.5 1.5e-24
CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 568 112.5 1.5e-24
CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 561 111.1 2.6e-24
CCDS5872.1 PRSS1 gene_id:5644|Hs108|chr7 ( 247) 559 110.7 3.1e-24
CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 557 110.5 5.9e-24
CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 561 111.5 6.7e-24
CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 561 111.5 7.3e-24
CCDS83236.1 PRSS2 gene_id:5645|Hs108|chr7 ( 247) 549 108.9 1.1e-23
CCDS8812.1 CELA1 gene_id:1990|Hs108|chr12 ( 258) 547 108.6 1.4e-23
>>CCDS5279.1 PLG gene_id:5340|Hs108|chr6 (810 aa)
initn: 5880 init1: 5880 opt: 5880 Z-score: 5676.3 bits: 1061.2 E(32554): 0
Smith-Waterman score: 5880; 99.9% identity (99.9% similar) in 810 aa overlap (1-810:1-810)
10 20 30 40 50 60
pF1KB5 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 GITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 GITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 CEEECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDRE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 CEEECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDRE
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 LRPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 LRPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWS
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 AQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDSSPVSTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 AQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDSSPVSTE
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 QLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENYPNAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 QLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENYPNAG
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 LTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETPSEED
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 LTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETPSEED
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 CMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPDGDVGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 CMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPDGDVGG
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 PWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQVSLRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 PWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQVSLRT
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB5 RFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNLEPHVQEIEVSRLFLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 RFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNLEPHVQEIEVSRLFLE
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB5 PTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGAGLLKEAQ
::::::::::::::: ::::::::::::::::::::::::::::::::::::::::::::
CCDS52 PTRKDIALLKLSSPAVITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGAGLLKEAQ
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB5 LPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYILQGVTSW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS52 LPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYILQGVTSW
730 740 750 760 770 780
790 800 810
pF1KB5 GLGCARPNKPGVYVRVSRFVTWIEGVMRNN
::::::::::::::::::::::::::::::
CCDS52 GLGCARPNKPGVYVRVSRFVTWIEGVMRNN
790 800 810
>>CCDS43523.1 LPA gene_id:4018|Hs108|chr6 (2040 aa)
initn: 2309 init1: 2287 opt: 2359 Z-score: 2273.1 bits: 432.8 E(32554): 2.7e-120
Smith-Waterman score: 3626; 63.9% identity (78.0% similar) in 785 aa overlap (95-810:1266-2040)
70 80 90 100 110 120
pF1KB5 QYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGITC
:.. ...: :.:..:::..: : .: ::
CCDS43 RWEYCNLTQCPVTESSVLATSTAVSEQAPTEQSPTVQDCYHGDGQSYRGSFSTTVTGRTC
1240 1250 1260 1270 1280 1290
130 140 150 160 170 180
pF1KB5 QKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILEC---
:.::: .:: . . .:. :: .::::::: . . ::::: :: :..::.. .:
CCDS43 QSWSSMTPHWHQRTTEYYPNGGLTRNYCRNPDAEIR-PWCYTMDPSVRWEYCNLTQCPVM
1300 1310 1320 1330 1340 1350
190 200 210
pF1KB5 --------------------EE----------ECMHCSGENYDGKISKTMSGLECQAWDS
:: .:.. .:..: : .: :..: ::.:.:
CCDS43 ESTLLTTPTVVPVPSTELPSEEAPTENSTGVQDCYRGDGQSYRGTLSTTITGRTCQSWSS
1360 1370 1380 1390 1400 1410
220 230 240 250 260
pF1KB5 QSPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRC--------T
..:: : :: .:: .: .::::::: :.::::.: ::. ::: :.. :: :
CCDS43 MTPHWHRRIPLYYPNAGLTRNYCRNPDAEIRPWCYTMDPSVRWEYCNLTRCPVTESSVLT
1420 1430 1440 1450 1460 1470
270 280 290 300
pF1KB5 TP---------------PPSSGPTYQ-CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTH
:: :: ..:. : : .: :..::: ..::.:.::: ::.. :: :
CCDS43 TPTVAPVPSTEAPSEQAPPEKSPVVQDCYHGDGRSYRGISSTTVTGRTCQSWSSMIPHWH
1480 1490 1500 1510 1520 1530
310 320 330 340 350
pF1KB5 NRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDSS-----------P
.:::::.: .: ::::::::. . :::.::. ::::::.. .:. . :
CCDS43 QRTPENYPNAGLTENYCRNPDSGKQPWCYTTDPCVRWEYCNLTQCSETESGVLETPTVVP
1540 1550 1560 1570 1580 1590
360 370 380 390 400 410
pF1KB5 V-STEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPEN
: : : . .:: : ::::..::::.::::::: :::.::. :::::::::::::.::::
CCDS43 VPSMEAHSEAAPTEQTPVVRQCYHGNGQSYRGTFSTTVTGRTCQSWSSMTPHRHQRTPEN
1600 1610 1620 1630 1640 1650
420 430 440 450 460 470
pF1KB5 YPNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVET
::: ::::::::::::: :::::: :::.::::::: .:: ::..::::: :. .:..
CCDS43 YPNDGLTMNYCRNPDADTGPWCFTMDPSIRWEYCNLTRCSDTEGTVVAPPTVIQVPSLGP
1660 1670 1680 1690 1700 1710
480 490 500 510 520 530
pF1KB5 PSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPD
:::.:::::::::::::.::::::::::.:::::::::: : : :: ::::::::::::
CCDS43 PSEQDCMFGNGKGYRGKKATTVTGTPCQEWAAQEPHRHSTFIPGTNKWAGLEKNYCRNPD
1720 1730 1740 1750 1760 1770
540 550 560 570 580 590
pF1KB5 GDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQ
::..:::::: :::::.::::.: ::. :::::::::::::::: .::::::::::::::
CCDS43 GDINGPWCYTMNPRKLFDYCDIPLCASSSFDCGKPQVEPKKCPGSIVGGCVAHPHSWPWQ
1780 1790 1800 1810 1820 1830
600 610 620 630 640 650
pF1KB5 VSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNLEPHVQEIEVS
:::::::: ::::::::::::::::::::.:: :::::::::::::::::: ::::::::
CCDS43 VSLRTRFGKHFCGGTLISPEWVLTAAHCLKKSSRPSSYKVILGAHQEVNLESHVQEIEVS
1840 1850 1860 1870 1880 1890
660 670 680 690 700 710
pF1KB5 RLFLEPTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGAGL
:::::::. :::::::: :: :::::.:::::::.:.:. ::::.::::::::::::.::
CCDS43 RLFLEPTQADIALLKLSRPAVITDKVMPACLPSPDYMVTARTECYITGWGETQGTFGTGL
1900 1910 1920 1930 1940 1950
720 730 740 750 760 770
pF1KB5 LKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYILQ
:::::: ::::.:::.:... :: ::: ::::::::::::::::::::::::
CCDS43 LKEAQLLVIENEVCNHYKYI---------CAEHLARGTDSCQGDSGGPLVCFEKDKYILQ
1960 1970 1980 1990 2000
780 790 800 810
pF1KB5 GVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN
::::::::::::::::::.:::::::::::.::::
CCDS43 GVTSWGLGCARPNKPGVYARVSRFVTWIEGMMRNN
2010 2020 2030 2040
>--
initn: 600 init1: 600 opt: 898 Z-score: 863.2 bits: 172.0 E(32554): 9.3e-42
Smith-Waterman score: 1493; 48.3% identity (69.2% similar) in 439 aa overlap (183-574:26-462)
160 170 180 190 200 210
pF1KB5 RNPDNDPQGPWCYTTDPEKRYDYCDILECEEECMHCSGENYDGKISKTMSGLECQAWDSQ
..:.: .:..: : : :..: ::::.:.
CCDS43 MEHKEVVLLLLLFLKSAAPEQSHVVQDCYHGDGQSYRGTYSTTVTGRTCQAWSSM
10 20 30 40 50
220 230 240 250 260
pF1KB5 SPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCT---------
.:: :. ..:: .: ::::::: :.:.: ::. ::: :.. .:.
CCDS43 TPHQHNRTTENYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAP
60 70 80 90 100 110
270 280 290 300
pF1KB5 ---TPPPS------SGPTYQ------CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHN
:: :: ..:: : : .:.:..:::. ..::.:.::: ::..:::.:.
CCDS43 PTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS
120 130 140 150 160 170
310 320 330 340 350
pF1KB5 RTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDS-----------SPV
:::: .: .: :::::::. ::.:.: . ::::::.. .:.. .::
CCDS43 RTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPV
180 190 200 210 220 230
360 370 380 390 400 410
pF1KB5 -STEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY
: : . :: : : ::.::::.::::::: :::.::. ::.::::::: :..::: :
CCDS43 PSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYY
240 250 260 270 280 290
420 430 440 450 460 470
pF1KB5 PNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETP
::::: ::::::::: .:.:.: ::.:::::::: .:: .:...:::: :. .:..:.:
CCDS43 PNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAP
300 310 320 330 340 350
480 490 500 510 520
pF1KB5 SEE----------DCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGL
::. .:. :::..::: .::::: :: :... :: :: ::: : :::
CCDS43 SEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS-RTPEYYPNAGL
360 370 380 390 400 410
530 540 550 560 570 580
pF1KB5 EKNYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCA-APSFDCGKPQVEPKKCPGRVVGGC
:::::::. :..:.::: .: ..::.. ::. : . . : : :
CCDS43 IMNYCRNPDA-VAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAPSEQA
420 430 440 450 460 470
590 600 610 620 630 640
pF1KB5 VAHPHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNL
CCDS43 PTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYYPNAGLIMNYC
480 490 500 510 520 530
>--
initn: 586 init1: 586 opt: 888 Z-score: 853.5 bits: 170.2 E(32554): 3.2e-41
Smith-Waterman score: 1509; 48.5% identity (69.2% similar) in 439 aa overlap (183-574:482-918)
160 170 180 190 200 210
pF1KB5 RNPDNDPQGPWCYTTDPEKRYDYCDILECEEECMHCSGENYDGKISKTMSGLECQAWDSQ
.::.: .:..: : : :..: ::::.:.
CCDS43 GTAVAPPTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSM
460 470 480 490 500 510
220 230 240 250 260
pF1KB5 SPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCT---------
.::.:. : .:: .: ::::::: :.:.: ::. ::: :.. .:.
CCDS43 TPHSHSRTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAP
520 530 540 550 560 570
270 280 290 300
pF1KB5 ---TPPPS------SGPTYQ------CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHN
:: :: ..:: : : .:.:..:::. ..::.:.::: ::..:::.:.
CCDS43 PTVTPVPSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS
580 590 600 610 620 630
310 320 330 340 350
pF1KB5 RTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSCDS-----------SPV
:::: .: .: :::::::. ::.:.: . ::::::.. .:.. .::
CCDS43 RTPEYYPNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPV
640 650 660 670 680 690
360 370 380 390 400 410
pF1KB5 -STEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY
: : . :: : : ::.::::.::::::: :::.::. ::.::::::: :..::: :
CCDS43 PSLEAPSEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHSRTPEYY
700 710 720 730 740 750
420 430 440 450 460 470
pF1KB5 PNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETP
::::: ::::::::: .:.:.: ::.:::::::: .:: .:...:::: :. .:..:.:
CCDS43 PNAGLIMNYCRNPDAVAAPYCYTRDPGVRWEYCNLTQCSDAEGTAVAPPTVTPVPSLEAP
760 770 780 790 800 810
480 490 500 510 520
pF1KB5 SEE----------DCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGL
::. .:. :::..::: .::::: :: :... :: :: ::: : :::
CCDS43 SEQAPTEQRPGVQECYHGNGQSYRGTYSTTVTGRTCQAWSSMTPHSHS-RTPEYYPNAGL
820 830 840 850 860 870
530 540 550 560 570 580
pF1KB5 EKNYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCA-APSFDCGKPQVEPKKCPGRVVGGC
::::::: :..:.::: .: ..::.. ::. : . . : . :
CCDS43 IMNYCRNPD-PVAAPYCYTRDPSVRWEYCNLTQCSDAEGTAVAPPTITPIPSLEAPSEQA
880 890 900 910 920
590 600 610 620 630 640
pF1KB5 VAHPHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEVNL
CCDS43 PTEQRPGVQECYHGNGQSYQGTYFITVTGRTCQAWSSMTPHSHSRTPAYYPNAGLIKNYC
930 940 950 960 970 980
>--
initn: 558 init1: 558 opt: 884 Z-score: 849.7 bits: 169.5 E(32554): 5.2e-41
Smith-Waterman score: 1196; 51.2% identity (70.5% similar) in 322 aa overlap (183-468:938-1259)
160 170 180 190 200 210
pF1KB5 RNPDNDPQGPWCYTTDPEKRYDYCDILECEEECMHCSGENYDGKISKTMSGLECQAWDSQ
.::.: .:..:.: :..: ::::.:.
CCDS43 GTAVAPPTITPIPSLEAPSEQAPTEQRPGVQECYHGNGQSYQGTYFITVTGRTCQAWSSM
910 920 930 940 950 960
220 230 240 250 260
pF1KB5 SPHAHGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCT-------TP
.::.:. :. .:: .: :::::::: :::.::::. ::: :.. ::. .:
CCDS43 TPHSHSRTPAYYPNAGLIKNYCRNPDPVAAPWCYTTDPSVRWEYCNLTRCSDAEWTAFVP
970 980 990 1000 1010 1020
270 280 290 300
pF1KB5 P-----PS-----------SGPTYQ-CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHN
: :: : : : :..:::. ..::.:.::: ::..::: :.
CCDS43 PNVILAPSLEAFFEQALTEETPGVQDCYYHYGQSYRGTYSTTVTGRTCQAWSSMTPHQHS
1030 1040 1050 1060 1070 1080
310 320 330 340 350 360
pF1KB5 RTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYCKIPSC---DSSPVSTEQLAPT
:::::.: .: .:::::::.. :::.: . .::::::.. .: .:: ..: ..:
CCDS43 RTPENYPNAGLTRNYCRNPDAEIRPWCYTMDPSVRWEYCNLTQCLVTESSVLATLTVVPD
1090 1100 1110 1120 1130 1140
370 380 390 400 410
pF1KB5 ---------APPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY
:: : .: ::::::::::::::. :::.::. :::::::::: ::.: : :
CCDS43 PSTEASSEEAPTEQSPGVQDCYHGDGQSYRGSFSTTVTGRTCQSWSSMTPHWHQRTTEYY
1150 1160 1170 1180 1190 1200
420 430 440 450 460 470
pF1KB5 PNAGLTMNYCRNPDADKGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVETP
::.::: ::::::::. .:::.: ::.:::::::: .: ::.::.: .:
CCDS43 PNGGLTRNYCRNPDAEISPWCYTMDPNVRWEYCNLTQCPVTESSVLATSTAVSEQAPTEQ
1210 1220 1230 1240 1250 1260
480 490 500 510 520 530
pF1KB5 SEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPDG
CCDS43 SPTVQDCYHGDGQSYRGSFSTTVTGRTCQSWSSMTPHWHQRTTEYYPNGGLTRNYCRNPD
1270 1280 1290 1300 1310 1320
>>CCDS33757.2 MST1 gene_id:4485|Hs108|chr3 (725 aa)
initn: 1330 init1: 364 opt: 1109 Z-score: 1072.9 bits: 209.3 E(32554): 1.9e-53
Smith-Waterman score: 1885; 38.2% identity (59.4% similar) in 820 aa overlap (9-808:20-723)
10 20 30
pF1KB5 MEHKEVVLLLLLFLKS----GQGEPLDDYVNTQGASLFSVTKK------
::::. . :: ::.:. .:. : . .
CCDS33 MGLWWVTVQPPARRMGWLPLLLLLTQCLGVPGQRSPLNDFQVLRGTELQHLLHAVVPGPW
10 20 30 40 50 60
40 50 60 70 80 90
pF1KB5 QLGAGSIEECAAKCEEDEEFTCRAFQYHSKEQQCVIMAENRKS--SIIIRMRDVVLFEKK
: ... ::::..: . ::::.:. . . : .. ...: . . : ::.::
CCDS33 QEDVADAEECAGRC--GPLMDCRAFHYNVSSHGCQLLPWTQHSPHTRLRRSGRCDLFQKK
70 80 90 100 110
100 110 120 130 140 150
pF1KB5 VYLSECKTGNGKNYRGTMSKTKNGITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDN
:. : .:: .:::::. : .:. :: :: :. ...:. . .:::::.:::::.
CCDS33 DYVRTCIMNNGVGYRGTMATTVGGLPCQAWSHKFPNDHKYTPTLR--NGLEENFCRNPDG
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB5 DPQGPWCYTTDPEKRYDYCDILECEEE-CMHCSGENYDGKISKTMSGLECQAWDSQSPHA
:: ::::::::: :.. : : :.: :. :.::.: : ...: :: ::: :: : ::
CCDS33 DPGGPWCYTTDPAVRFQSCGIKSCREAACVWCNGEEYRGAVDRTESGRECQRWDLQHPHQ
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB5 HGYIPSKFPNKNLKKNYCRNPDRELRPWCFTTDPNKRWELCDIPRCTTP--PPSSGPTYQ
: . :.:: ...: ::::::: ::::.::::. . :.::.::: . : . . : .
CCDS33 HPFEPGKFLDQGLDDNYCRNPDGSERPWCYTTDPQIEREFCDLPRCGSEAQPRQEATTVS
240 250 260 270 280 290
280 290 300 310 320 330
pF1KB5 CLKGTGENYRGNVAVTVSGHTCQHWSAQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPW
:..: ::.:::.. .:..: ::.:.:: :: : :::.. ::.: ::.::::::..:::
CCDS33 CFRGKGEGYRGTANTTTAGVPCQRWDAQIPHQHRFTPEKYACKDLRENFCRNPDGSEAPW
300 310 320 330 340 350
340 350 360 370 380 390
pF1KB5 CHTTNSQVRWEYC-KIPSCDSSPVSTEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTT
: : .: .: .: : :... : :::::: :..:::: : :
CCDS33 CFTLRPGMRAAFCYQIRRC------TDDVRP----------QDCYHGAGEQYRGTVSKTR
360 370 380 390 400
400 410 420 430 440 450
pF1KB5 TGKKCQSWSSMTPHRHQKTPENYPNAGLTMNYCRNPDADK-GPWCFTTDPSVRWEYCNLK
: .:: ::. :::. : : . :.: : :.:::::.:. ::::.: :: . ..:: :.
CCDS33 KGVQCQRWSAETPHKPQFTFTSEPHAQLEENFCRNPDGDSHGPWCYTMDPRTPFDYCALR
410 420 430 440 450 460
460 470 480 490 500 510
pF1KB5 KCSGTEASVVAPPPVVLLPDVETPSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHR
.:. . :: .: : .. :. : :::. . .:
CCDS33 RCADDQ------PPSILDPPDQVQFEK-C---------GKRVDRLD------------QR
470 480 490
520 530 540 550 560 570
pF1KB5 HSIFTPETNPRAGLEKNYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQV
.: ::
CCDS33 RS-----------------------------------KL---------------------
580 590 600 610 620 630
pF1KB5 EPKKCPGRVVGGCVAHPHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRP-S
::::: :: . :: ::::.: :.:::::.:.. .:.::: .:. . : .
CCDS33 -------RVVGG---HPGNSPWTVSLRNRQGQHFCGGSLVKEQWILTARQCFSSCHMPLT
500 510 520 530 540
640 650 660 670 680
pF1KB5 SYKVILGA--HQEVNLEPHVQEIEVSRLFLEPTRKDIALLKLSSPADITDKVIPACLPSP
.:.: ::. .. . :: .:.. :... :. ....:::: . ....: :::
CCDS33 GYEVWLGTLFQNPQHGEPSLQRVPVAKMVCGPSGSQLVLLKLERSVTLNQRVALICLPPE
550 560 570 580 590 600
690 700 710 720 730 740
pF1KB5 NYVVADRTECFITGWGETQGTFGAGLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHL
::: :.: :.:::::.:: . .:. : : :: :. :: . :::. .:.:. :
CCDS33 WYVVPPGTKCEIAGWGETKGTGNDTVLNVALLNVISNQECNIKH--RGRVRESEMCTEGL
610 620 630 640 650 660
750 760 770 780 790 800
pF1KB5 AGGTDSCQGDSGGPLVCFEKDKYILQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRN
. . .:.:: ::::.:: .. ..:.:. . ::: :.:..::: :: ::. :::
CCDS33 LAPVGACEGDYGGPLACFTHNCWVLEGIIIPNRVCARSRWPAVFTRVSVFVDWIHKVMRL
670 680 690 700 710 720
810
pF1KB5 N
CCDS33 G
>>CCDS55074.1 PLG gene_id:5340|Hs108|chr6 (136 aa)
initn: 907 init1: 907 opt: 907 Z-score: 887.8 bits: 172.6 E(32554): 3.9e-43
Smith-Waterman score: 907; 100.0% identity (100.0% similar) in 136 aa overlap (1-136:1-136)
10 20 30 40 50 60
pF1KB5 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MEHKEVVLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDEEFT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 CRAFQYHSKEQQCVIMAENRKSSIIIRMRDVVLFEKKVYLSECKTGNGKNYRGTMSKTKN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 GITCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILE
::::::::::::::::
CCDS55 GITCQKWSSTSPHRPR
130
>>CCDS47627.1 HGF gene_id:3082|Hs108|chr7 (290 aa)
initn: 855 init1: 373 opt: 811 Z-score: 790.7 bits: 155.7 E(32554): 1e-37
Smith-Waterman score: 811; 45.1% identity (70.8% similar) in 233 aa overlap (37-264:61-290)
10 20 30 40 50 60
pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF
::: ... ..:: .: ... :::.::
CCDS47 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF
40 50 60 70 80
70 80 90 100 110 120
pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI
. . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.::
CCDS47 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI
90 100 110 120 130 140
130 140 150 160 170 180
pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE
:: ::: ::. : :... .. :.::::::: .. ::::.:..:: ::. ::: .:
CCDS47 KCQPWSSMIPHEHSFLPSSYRGKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS
150 160 170 180 190 200
190 200 210 220 230 240
pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL
: ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: .
CCDS47 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP
210 220 230 240 250 260
250 260 270 280 290 300
pF1KB5 RPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWSA
::::.: ::. ::: : : : :
CCDS47 RPWCYTLDPHTRWEYCAIKTCET
270 280 290
>>CCDS47628.1 HGF gene_id:3082|Hs108|chr7 (285 aa)
initn: 1190 init1: 373 opt: 777 Z-score: 758.0 bits: 149.7 E(32554): 6.7e-36
Smith-Waterman score: 777; 44.2% identity (69.1% similar) in 233 aa overlap (37-264:61-285)
10 20 30 40 50 60
pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF
::: ... ..:: .: ... :::.::
CCDS47 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF
40 50 60 70 80
70 80 90 100 110 120
pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI
. . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.::
CCDS47 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI
90 100 110 120 130 140
130 140 150 160 170 180
pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE
:: ::: ::. . .. :.::::::: .. ::::.:..:: ::. ::: .:
CCDS47 KCQPWSSMIPHEHSYR-----GKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS
150 160 170 180 190 200
190 200 210 220 230 240
pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL
: ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: .
CCDS47 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP
210 220 230 240 250 260
250 260 270 280 290 300
pF1KB5 RPWCFTTDPNKRWELCDIPRCTTPPPSSGPTYQCLKGTGENYRGNVAVTVSGHTCQHWSA
::::.: ::. ::: : : : :
CCDS47 RPWCYTLDPHTRWEYCAIKTCET
270 280
>>CCDS47626.1 HGF gene_id:3082|Hs108|chr7 (723 aa)
initn: 1234 init1: 380 opt: 775 Z-score: 750.6 bits: 149.6 E(32554): 1.7e-35
Smith-Waterman score: 1669; 35.3% identity (57.1% similar) in 784 aa overlap (37-807:61-715)
10 20 30 40 50 60
pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF
::: ... ..:: .: ... :::.::
CCDS47 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF
40 50 60 70 80
70 80 90 100 110 120
pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI
. . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.::
CCDS47 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI
90 100 110 120 130 140
130 140 150 160 170 180
pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE
:: ::: ::. . .. :.::::::: .. ::::.:..:: ::. ::: .:
CCDS47 KCQPWSSMIPHEHSYR-----GKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS
150 160 170 180 190 200
190 200 210 220 230 240
pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL
: ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: .
CCDS47 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP
210 220 230 240 250 260
250 260 270 280 290
pF1KB5 RPWCFTTDPNKRWELCDIPRCT--TPPPSSGP--TYQCLKGTGENYRGNVAVTVSGHTCQ
::::.: ::. ::: : : :. : .. : : .:..: ::.:::.: . .: ::
CCDS47 RPWCYTLDPHTRWEYCAIKTCADNTMNDTDVPLETTECIQGQGEGYRGTVNTIWNGIPCQ
270 280 290 300 310 320
300 310 320 330 340 350
pF1KB5 HWSAQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYC-KIPSCDSSP
.:..: :: :. ::::: ::.: :::::::::...::: ::. ..: :: .::.:: :
CCDS47 RWDSQYPHEHDMTPENFKCKDLRENYCRNPDGSESPWCFTTDPNIRVGYCSQIPNCDMSH
330 340 350 360 370 380
360 370 380 390 400 410
pF1KB5 VSTEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY
::::.:.:..: :. : : .: :. :.. :.. .
CCDS47 G-----------------QDCYRGNGKNYMGNLSQTRSGLTCSMWDKNMEDLHRHIFWEP
390 400 410 420
420 430 440 450 460 470
pF1KB5 PNAGLTMNYCRNPDAD-KGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVET
. :. ::::::: : .::::.: .: . :.:: ...: : . : .: :
CCDS47 DASKLNENYCRNPDDDAHGPWCYTGNPLIPWDYCPISRCEGD-----TTPTIVNL-----
430 440 450 460 470
480 490 500 510 520 530
pF1KB5 PSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPD
CCDS47 ------------------------------------------------------------
540 550 560 570 580 590
pF1KB5 GDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQ
:. : ..:.: . :::.: . . :.
CCDS47 -----------------DH--------PVISCAKTK------QLRVVNG-IPTRTNIGWM
480 490 500
600 610 620 630 640 650
pF1KB5 VSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAH--QEVNLEPHVQEIE
:::: : . :.:::.::. ::::: .:. : ..:.. :: : . . : : ..
CCDS47 VSLRYR-NKHICGGSLIKESWVLTARQCFP-SRDLKDYEAWLGIHDVHGRGDEKCKQVLN
510 520 530 540 550 560
660 670 680 690 700 710
pF1KB5 VSRLFLEPTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGA
::.: : .:..:.::. :: . : : ::. . .. ..: : . ::: :
CCDS47 VSQLVYGPEGSDLVLMKLARPAVLDDFVSTIDLPNYGCTIPEKTSCSVYGWGYTGLINYD
570 580 590 600 610 620
720 730 740 750 760 770
pF1KB5 GLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYI
:::. :.: .. :. :.... . .. .:.::: :. :.:: :::::: .. .
CCDS47 GLLRVAHLYIMGNEKCSQHHRGKVTLNESEICAGAEKIGSGPCEGDYGGPLVCEQHKMRM
630 640 650 660 670 680
780 790 800 810
pF1KB5 LQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN
. :: : ::: ::.::..:::. .. ::. ..
CCDS47 VLGVIVPGRGCAIPNRPGIFVRVAYYAKWIHKIILTYKVPQS
690 700 710 720
>>CCDS5597.1 HGF gene_id:3082|Hs108|chr7 (728 aa)
initn: 1329 init1: 380 opt: 775 Z-score: 750.6 bits: 149.6 E(32554): 1.7e-35
Smith-Waterman score: 1703; 35.6% identity (57.7% similar) in 784 aa overlap (37-807:61-720)
10 20 30 40 50 60
pF1KB5 VLLLLLFLKSGQGEPLDDYVNTQGASLFSVTKKQLGAGSIEECAAKCEEDE--EFTCRAF
::: ... ..:: .: ... :::.::
CCDS55 GQRKRRNTIHEFKKSAKTTLIKIDPALKIKTKK---VNTADQCANRCTRNKGLPFTCKAF
40 50 60 70 80
70 80 90 100 110 120
pF1KB5 QYHSKEQQCVIMAENRKSSIIIRM--RDVVLFEKKVYLSECKTGNGKNYRGTMSKTKNGI
. . ..::. . : :: . . .. :.:.: :. .: :.:..:.::.: ::.::
CCDS55 VFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIRNCIIGKGRSYKGTVSITKSGI
90 100 110 120 130 140
130 140 150 160 170 180
pF1KB5 TCQKWSSTSPHRPRFSPATHPSEGLEENYCRNPDNDPQGPWCYTTDPEKRYDYCDILECE
:: ::: ::. : :... .. :.::::::: .. ::::.:..:: ::. ::: .:
CCDS55 KCQPWSSMIPHEHSFLPSSYRGKDLQENYCRNPRGEEGGPWCFTSNPEVRYEVCDIPQCS
150 160 170 180 190 200
190 200 210 220 230 240
pF1KB5 E-ECMHCSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDREL
: ::: :.::.: : ...: :: :: :: :.:: : ..: ..:.:.. ::::::: .
CCDS55 EVECMTCNGESYRGLMDHTESGKICQRWDHQTPHRHKFLPERYPDKGFDDNYCRNPDGQP
210 220 230 240 250 260
250 260 270 280 290
pF1KB5 RPWCFTTDPNKRWELCDIPRCT--TPPPSSGP--TYQCLKGTGENYRGNVAVTVSGHTCQ
::::.: ::. ::: : : :. : .. : : .:..: ::.:::.: . .: ::
CCDS55 RPWCYTLDPHTRWEYCAIKTCADNTMNDTDVPLETTECIQGQGEGYRGTVNTIWNGIPCQ
270 280 290 300 310 320
300 310 320 330 340 350
pF1KB5 HWSAQTPHTHNRTPENFPCKNLDENYCRNPDGKRAPWCHTTNSQVRWEYC-KIPSCDSSP
.:..: :: :. ::::: ::.: :::::::::...::: ::. ..: :: .::.:: :
CCDS55 RWDSQYPHEHDMTPENFKCKDLRENYCRNPDGSESPWCFTTDPNIRVGYCSQIPNCDMSH
330 340 350 360 370 380
360 370 380 390 400 410
pF1KB5 VSTEQLAPTAPPELTPVVQDCYHGDGQSYRGTSSTTTTGKKCQSWSSMTPHRHQKTPENY
::::.:.:..: :. : : .: :. :.. :.. .
CCDS55 G-----------------QDCYRGNGKNYMGNLSQTRSGLTCSMWDKNMEDLHRHIFWEP
390 400 410 420 430
420 430 440 450 460 470
pF1KB5 PNAGLTMNYCRNPDAD-KGPWCFTTDPSVRWEYCNLKKCSGTEASVVAPPPVVLLPDVET
. :. ::::::: : .::::.: .: . :.:: ...: : . : .: :
CCDS55 DASKLNENYCRNPDDDAHGPWCYTGNPLIPWDYCPISRCEGD-----TTPTIVNL-----
440 450 460 470 480
480 490 500 510 520 530
pF1KB5 PSEEDCMFGNGKGYRGKRATTVTGTPCQDWAAQEPHRHSIFTPETNPRAGLEKNYCRNPD
CCDS55 ------------------------------------------------------------
540 550 560 570 580 590
pF1KB5 GDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAHPHSWPWQ
:. : ..:.: . :::.: . . :.
CCDS55 -----------------DH--------PVISCAKTK------QLRVVNG-IPTRTNIGWM
490 500
600 610 620 630 640 650
pF1KB5 VSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAH--QEVNLEPHVQEIE
:::: : . :.:::.::. ::::: .:. : ..:.. :: : . . : : ..
CCDS55 VSLRYR-NKHICGGSLIKESWVLTARQCFP-SRDLKDYEAWLGIHDVHGRGDEKCKQVLN
510 520 530 540 550 560
660 670 680 690 700 710
pF1KB5 VSRLFLEPTRKDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGWGETQGTFGA
::.: : .:..:.::. :: . : : ::. . .. ..: : . ::: :
CCDS55 VSQLVYGPEGSDLVLMKLARPAVLDDFVSTIDLPNYGCTIPEKTSCSVYGWGYTGLINYD
570 580 590 600 610 620
720 730 740 750 760 770
pF1KB5 GLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGPLVCFEKDKYI
:::. :.: .. :. :.... . .. .:.::: :. :.:: :::::: .. .
CCDS55 GLLRVAHLYIMGNEKCSQHHRGKVTLNESEICAGAEKIGSGPCEGDYGGPLVCEQHKMRM
630 640 650 660 670 680
780 790 800 810
pF1KB5 LQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN
. :: : ::: ::.::..:::. .. ::. ..
CCDS55 VLGVIVPGRGCAIPNRPGIFVRVAYYAKWIHKIILTYKVPQS
690 700 710 720
>>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa)
initn: 629 init1: 364 opt: 681 Z-score: 662.6 bits: 132.7 E(32554): 1.4e-30
Smith-Waterman score: 681; 41.2% identity (68.9% similar) in 257 aa overlap (559-810:203-450)
530 540 550 560 570 580
pF1KB5 NYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAH
::.: ::. . .:.::: ..
CCDS58 DHLLPDDKVTALHHSVYVREGCASGHVVTLQCTA----CGH----RRGYSSRIVGGNMSL
180 190 200 210 220
590 600 610 620 630 640
pF1KB5 PHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEV-NLEP
.::::.::. . :.:.:::..:.: :..:::::. :.:. . .: . . : :
CCDS58 LSQWPWQASLQFQ-GYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAP
230 240 250 260 270 280
650 660 670 680 690 700
pF1KB5 -HVQEIEVSRLFLEPTR--KDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGW
:. : : . .: : .::::.::..: ... . :.:::. . : :. .::
CCDS58 SHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGW
290 300 310 320 330 340
710 720 730 740 750 760
pF1KB5 GETQ-GTFGAGLLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDSGGP
: :. : .. .:..: .:.: ::.::. . .: .. . ::::.:.::.::::::::::
CCDS58 GATEDGGDASPVLNHAAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGP
350 360 370 380 390 400
770 780 790 800 810
pF1KB5 LVCFEKDKYILQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN
::: :. . : :.::.:.:::. ::::::.::. :. ::. :. .
CCDS58 LVCQERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT
410 420 430 440 450
>>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa)
initn: 629 init1: 364 opt: 681 Z-score: 662.6 bits: 132.7 E(32554): 1.4e-30
Smith-Waterman score: 681; 41.5% identity (68.1% similar) in 260 aa overlap (559-810:203-451)
530 540 550 560 570 580
pF1KB5 NYCRNPDGDVGGPWCYTTNPRKLYDYCDVPQCAAPSFDCGKPQVEPKKCPGRVVGGCVAH
::.: ::. . .:.::: ..
CCDS13 DHLLPDDKVTALHHSVYVREGCASGHVVTLQCTA----CGH----RRGYSSRIVGGNMSL
180 190 200 210 220
590 600 610 620 630 640
pF1KB5 PHSWPWQVSLRTRFGMHFCGGTLISPEWVLTAAHCLEKSPRPSSYKVILGAHQEV-NLEP
.::::.::. . :.:.:::..:.: :..:::::. :.:. . .: . . : :
CCDS13 LSQWPWQASLQFQ-GYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAP
230 240 250 260 270 280
650 660 670 680 690 700
pF1KB5 -HVQEIEVSRLFLEPTR--KDIALLKLSSPADITDKVIPACLPSPNYVVADRTECFITGW
:. : : . .: : .::::.::..: ... . :.:::. . : :. .::
CCDS13 SHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGW
290 300 310 320 330 340
710 720 730 740 750 760
pF1KB5 GETQGTFGAG----LLKEAQLPVIENKVCNRYEFLNGRVQSTELCAGHLAGGTDSCQGDS
: :. ::: .:..: .:.: ::.::. . .: .. . ::::.:.::.:::::::
CCDS13 GATED--GAGDASPVLNHAAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDS
350 360 370 380 390 400
770 780 790 800 810
pF1KB5 GGPLVCFEKDKYILQGVTSWGLGCARPNKPGVYVRVSRFVTWIEGVMRNN
:::::: :. . : :.::.:.:::. ::::::.::. :. ::. :. .
CCDS13 GGPLVCQERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT
410 420 430 440 450
810 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 17:14:39 2016 done: Tue Nov 8 17:14:40 2016
Total Scan time: 2.890 Total Display time: 0.110
Function used was FASTA [36.3.4 Apr, 2011]