FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5687, 562 aa
1>>>pF1KE5687 562 - 562 aa - 562 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.4903+/-0.00127; mu= -11.3931+/- 0.077
mean_var=462.8115+/-94.231, 0's: 0 Z-trim(113.6): 168 B-trim: 0 in 0/55
Lambda= 0.059617
statistics sampled from 14096 (14262) to 14096 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.731), E-opt: 0.2 (0.438), width: 16
Scan time: 3.610
The best scores are: opt bits E(32554)
CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 3845 345.2 1.3e-94
CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 3801 341.4 1.8e-93
CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 2962 269.2 8.9e-72
CCDS55789.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 491) 2842 258.9 1.1e-68
CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 995 100.0 7.1e-21
CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 995 100.0 7.5e-21
CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 923 93.8 4.7e-19
CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 919 93.4 6.2e-19
CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 888 90.8 3.8e-18
CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 888 90.8 3.8e-18
CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 876 89.7 7.3e-18
CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 823 85.1 1.8e-16
CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 823 85.2 1.9e-16
CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 823 85.2 1.9e-16
CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 819 84.8 2.4e-16
CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 776 81.0 2.2e-15
CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 757 79.6 1.3e-14
CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 735 77.8 5.5e-14
CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 735 77.8 5.6e-14
CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 727 77.2 1.1e-13
CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 709 75.5 2.2e-13
CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 700 74.5 2.2e-13
CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 703 75.1 3.9e-13
CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 692 73.9 4.4e-13
CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 694 74.3 5.8e-13
CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 687 73.8 1.2e-12
CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 667 71.7 1.7e-12
CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 643 69.5 6e-12
CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 648 70.1 6.1e-12
CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 646 70.2 1.1e-11
CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 634 68.8 1.2e-11
CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 418) 629 68.5 1.9e-11
CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 421) 629 68.5 1.9e-11
CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 623 67.9 2.7e-11
CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 623 68.2 4.9e-11
CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 623 68.3 5.3e-11
CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 608 66.6 5.5e-11
CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 607 66.6 7.2e-11
>>CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 (567 aa)
initn: 3547 init1: 3547 opt: 3845 Z-score: 1812.2 bits: 345.2 E(32554): 1.3e-94
Smith-Waterman score: 3845; 99.1% identity (99.1% similar) in 567 aa overlap (1-562:1-567)
10 20 30 40 50 60
pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
10 20 30 40 50 60
70 80 90 100 110
pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY
:::::::::::::::::::::: :::::::::::::::::::::::::::::::::
CCDS41 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE5 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS41 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK
490 500 510 520 530 540
540 550 560
pF1KE5 PGVYTKVTEVLPWIYSKMESEVRFRKS
:::::::::::::::::::::::::::
CCDS41 PGVYTKVTEVLPWIYSKMESEVRFRKS
550 560
>>CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 (563 aa)
initn: 3503 init1: 3503 opt: 3801 Z-score: 1791.8 bits: 341.4 E(32554): 1.8e-93
Smith-Waterman score: 3801; 99.1% identity (99.1% similar) in 560 aa overlap (1-555:1-560)
10 20 30 40 50 60
pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
10 20 30 40 50 60
70 80 90 100 110
pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY
:::::::::::::::::::::: :::::::::::::::::::::::::::::::::
CCDS58 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE5 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK
490 500 510 520 530 540
540 550 560
pF1KE5 PGVYTKVTEVLPWIYSKMESEVRFRKS
::::::::::::::::::::
CCDS58 PGVYTKVTEVLPWIYSKMESSAG
550 560
>>CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 (532 aa)
initn: 2900 init1: 2900 opt: 2962 Z-score: 1402.1 bits: 269.2 E(32554): 8.9e-72
Smith-Waterman score: 3532; 92.8% identity (92.8% similar) in 567 aa overlap (1-562:1-532)
10 20 30 40 50 60
pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
10 20 30 40 50 60
70 80 90 100 110
pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY
:::::::::::::::::::::: :::::::::::::::::::::::::::::::::
CCDS55 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV
::::::::::::::::::::::::::::::
CCDS55 LVRATPVGAVPIRSSPARSAPATRATRESP------------------------------
130 140 150
180 190 200 210 220 230
pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 -----VQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
160 170 180 190 200
240 250 260 270 280 290
pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
210 220 230 240 250 260
300 310 320 330 340 350
pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
270 280 290 300 310 320
360 370 380 390 400 410
pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
330 340 350 360 370 380
420 430 440 450 460 470
pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC
390 400 410 420 430 440
480 490 500 510 520 530
pF1KE5 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK
450 460 470 480 490 500
540 550 560
pF1KE5 PGVYTKVTEVLPWIYSKMESEVRFRKS
:::::::::::::::::::::::::::
CCDS55 PGVYTKVTEVLPWIYSKMESEVRFRKS
510 520 530
>>CCDS55789.1 TMPRSS13 gene_id:84000|Hs108|chr11 (491 aa)
initn: 2539 init1: 2539 opt: 2842 Z-score: 1346.8 bits: 258.9 E(32554): 1.1e-68
Smith-Waterman score: 2842; 97.2% identity (97.7% similar) in 436 aa overlap (1-431:1-434)
10 20 30 40 50 60
pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS
10 20 30 40 50 60
70 80 90 100 110
pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY
:::::::::::::::::::::: :::::::::::::::::::::::::::::::::
CCDS55 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS55 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC
:::::::.. : :
CCDS55 SKPLTLSGE--GICTPRSPAPQPQHPLQPSHLSASVNSYPGPKASAGQKSKTLKDPYMEH
430 440 450 460 470
>>CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 (492 aa)
initn: 882 init1: 497 opt: 995 Z-score: 488.3 bits: 100.0 E(32554): 7.1e-21
Smith-Waterman score: 1009; 35.4% identity (63.4% similar) in 492 aa overlap (86-556:9-491)
60 70 80 90 100 110
pF1KE5 PAQASPAGTPPGRASPGRASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY
::.. .. . . . :. :. :: ::
CCDS33 MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPT-VY
10 20 30
120 130 140 150 160
pF1KE5 LVRA-----TPVGAVPIRSSPARSAPATRATRESP-GTSLPKFTWREGQKQLPLIGCVLL
:. .:: : : :.. . .:: :: . : . : : : :.
CCDS33 EVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTL-GTFLV
40 50 60 70 80 90
170 180 190 200 210 220
pF1KE5 LIALVVSLIILFQFWQ-GHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDK
::...:. :. . ...::. .. .: . . :::: : :: :::. .
CCDS33 GAALAAGLLWKFMGSKCSNSGIEC-DSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPN
100 110 120 130 140 150
230 240 250 260 270 280
pF1KE5 SLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNS
.:..::.. ..: :.:...::..:.. .:...:... ... : ..: :... :.
CCDS33 FILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDD-SGSTSFMKLNT
160 170 180 190 200 210
290 300 310 320 330
pF1KE5 T-----IQESLHRSE-CPSQRYISLQCSHCGLRAMTGR---IVGGALASDSKWPWQVSLH
. : ..:..:. : :. .::.: ::. ..: :::: : . ::::::::
CCDS33 SAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLH
220 230 240 250 260 270
340 350 360 370 380 390
pF1KE5 FGTTHICGGTLIDAQWVLTAAHCFFVTREKVLEG---WKVYAGTSNLHQLPEAAS--IAE
..:.:::..: .:..::::: :: :.. : ..:: . .:. . .
CCDS33 VQNVHVCGGSIITPEWIVTAAHCV----EKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK
280 290 300 310 320 330
400 410 420 430 440 450
pF1KE5 IIINSNYTDEEDDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRET
.: . :: .. . :::::.:.::::.. ..:.::: :. .. .. :::.:.: :.:
CCDS33 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK
340 350 360 370 380 390
460 470 480 490 500 510
pF1KE5 DDKTSPFLREVQVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQ
::: : ..: ::. ..::. :::. .:: :.::: :.:. :::::::::::: .
CCDS33 G-KTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMICAGFLQGNVDSCQGDSGGPLVTSK
400 410 420 430 440
520 530 540 550 560
pF1KE5 NNRWYLAGVTSWGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS
:: :.: : ::::.::.. .:::: .: ::: .:...
CCDS33 NNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG
450 460 470 480 490
>>CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 (529 aa)
initn: 882 init1: 497 opt: 995 Z-score: 487.8 bits: 100.0 E(32554): 7.5e-21
Smith-Waterman score: 1009; 35.4% identity (63.4% similar) in 492 aa overlap (86-556:46-528)
60 70 80 90 100 110
pF1KE5 PAQASPAGTPPGRASPGRASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY
::.. .. . . . :. :. :: ::
CCDS54 GAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPT-VY
20 30 40 50 60 70
120 130 140 150 160
pF1KE5 LVRA-----TPVGAVPIRSSPARSAPATRATRESP-GTSLPKFTWREGQKQLPLIGCVLL
:. .:: : : :.. . .:: :: . : . : : : :.
CCDS54 EVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTL-GTFLV
80 90 100 110 120 130
170 180 190 200 210 220
pF1KE5 LIALVVSLIILFQFWQ-GHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDK
::...:. :. . ...::. .. .: . . :::: : :: :::. .
CCDS54 GAALAAGLLWKFMGSKCSNSGIEC-DSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPN
140 150 160 170 180 190
230 240 250 260 270 280
pF1KE5 SLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNS
.:..::.. ..: :.:...::..:.. .:...:... ... : ..: :... :.
CCDS54 FILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDD-SGSTSFMKLNT
200 210 220 230 240 250
290 300 310 320 330
pF1KE5 T-----IQESLHRSE-CPSQRYISLQCSHCGLRAMTGR---IVGGALASDSKWPWQVSLH
. : ..:..:. : :. .::.: ::. ..: :::: : . ::::::::
CCDS54 SAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLH
260 270 280 290 300 310
340 350 360 370 380 390
pF1KE5 FGTTHICGGTLIDAQWVLTAAHCFFVTREKVLEG---WKVYAGTSNLHQLPEAAS--IAE
..:.:::..: .:..::::: :: :.. : ..:: . .:. . .
CCDS54 VQNVHVCGGSIITPEWIVTAAHCV----EKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK
320 330 340 350 360
400 410 420 430 440 450
pF1KE5 IIINSNYTDEEDDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRET
.: . :: .. . :::::.:.::::.. ..:.::: :. .. .. :::.:.: :.:
CCDS54 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK
370 380 390 400 410 420
460 470 480 490 500 510
pF1KE5 DDKTSPFLREVQVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQ
::: : ..: ::. ..::. :::. .:: :.::: :.:. :::::::::::: .
CCDS54 G-KTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMICAGFLQGNVDSCQGDSGGPLVTSK
430 440 450 460 470 480
520 530 540 550 560
pF1KE5 NNRWYLAGVTSWGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS
:: :.: : ::::.::.. .:::: .: ::: .:...
CCDS54 NNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG
490 500 510 520
>>CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 (432 aa)
initn: 807 init1: 323 opt: 923 Z-score: 455.5 bits: 93.8 E(32554): 4.7e-19
Smith-Waterman score: 923; 35.0% identity (64.3% similar) in 420 aa overlap (149-557:24-432)
120 130 140 150 160 170
pF1KE5 ATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLI
.: :.: . .:.: .:: .: .. ..
CCDS44 MLQDPDSDQPLNSLDVKPLRKPRIPMETFR--KVGIPII-IALLSLASIIIVV
10 20 30 40 50
180 190 200 210 220
pF1KE5 ILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCV-----------RFDWD
.:.. . . . . :.. . ::: .:: : :: :: :.. :
CCDS44 VLIKVILDKYYFLCGQPLHFIPRKQL-CDGELDCPLGEDEEHCVKSFPEGPAVAVRLSKD
60 70 80 90 100
230 240 250 260 270 280
pF1KE5 KSLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYN
.: :.. .... .:. : .:.... .: .:.:.:. :..:.. . . : . .
CCDS44 RSTLQVLDSATGNWFSACFDNFTEALAETACRQMGYS---RAVEIGPDQDLDVVEITENS
110 120 130 140 150 160
290 300 310 320 330 340
pF1KE5 STIQESLHRSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICG
. .. . : : .::.: :: : :.:: :: ..::::::... :.::
CCDS44 QELRMRNSSGPCLSGSLVSLHCLACGKSLKTPRVVGVEEASVDSWPWQVSIQYDKQHVCG
170 180 190 200 210 220
350 360 370 380 390 400
pF1KE5 GTLIDAQWVLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDD
:...: .::::::::: .. . .::: ::...: ..: : :::. : .:.
CCDS44 GSILDPHWVLTAAHCF--RKHTDVFNWKVRAGSDKLGSFPSLAVAKIIIIEFNPMYPKDN
230 240 250 260 270 280
410 420 430 440 450 460
pF1KE5 YDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQV
:::::.:. :::.:. ..: :::. . .. :: :.: :... : : .: ...:
CCDS44 -DIALMKLQFPLTFSGTVRPICLPFFDEELTPATPLWIIGWGFTKQNGGKMSDILLQASV
290 300 310 320 330 340
470 480 490 500 510 520
pF1KE5 NLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWG
..:: .:: .:.. .: .::::: .:: :.:::::::::. :...:...:..:::
CCDS44 QVIDSTRCNADDAYQGEVTEKMMCAGIPEGGVDTCQGDSGGPLM-YQSDQWHVVGIVSWG
350 360 370 380 390 400
530 540 550 560
pF1KE5 TGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS
::: . :::::::. : :::. ..:.
CCDS44 YGCGGPSTPGVYTKVSAYLNWIYNVWKAEL
410 420 430
>>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa)
initn: 927 init1: 388 opt: 919 Z-score: 453.4 bits: 93.4 E(32554): 6.2e-19
Smith-Waterman score: 1007; 37.9% identity (65.8% similar) in 409 aa overlap (163-558:53-452)
140 150 160 170 180 190
pF1KE5 RSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLIILFQFWQGHTGIRY
.:: . :..::...: : :. .:
CCDS58 DLKISPVAPDADAVAAQILSLLPLKFFPIIVIGIIALILALAIGLGIHFDC----SGKYR
30 40 50 60 70
200 210 220 230 240 250
pF1KE5 KEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYSGSSHQWLPICSSNWNDS
.. .: . .::::: ::: :: ::: ....:......: : .::..:.
CCDS58 CRSSFKCIELIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVFTAAS--WKTMCSDDWKGH
80 90 100 110 120 130
260 270 280 290 300
pF1KE5 YSEKTCQQLGFESAHRTTEVAHRDFANSFS--ILRYNSTIQE----SLH-----RSECPS
:.. .: :::: : . .. .. ..: .. . . . .:: : : :
CCDS58 YANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDHLLPDDKVTALHHSVYVREGCAS
140 150 160 170 180 190
310 320 330 340 350 360
pF1KE5 QRYISLQCSHCGLR-AMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQWVLTAA
. ..:::. :: : ....::::: .. :.::::.::.: :.:::..: :..:::
CCDS58 GHVVTLQCTACGHRRGYSSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSVITPLWIITAA
200 210 220 230 240 250
370 380 390 400 410
pF1KE5 HCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAE-IIINSNYTDEEDDYDIALMRLSKPL
:: . . ..: . .: .: . : . ..: :. .:.: .. :::::.:. ::
CCDS58 HCVYDLY--LPKSWTIQVGLVSLLDNPAPSHLVEKIVYHSKYKPKRLGNDIALMKLAGPL
260 270 280 290 300 310
420 430 440 450 460 470
pF1KE5 TLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKCNDYL
:.. :.:.::: ..: ...:: .:.: :.. : .:: : .. : ::. : ::
CCDS58 TFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGGD-ASPVLNHAAVPLISNKICNHRD
320 330 340 350 360 370
480 490 500 510 520 530
pF1KE5 VYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNKPGVY
:: . ..: :.::: : :: :::::::::::::.. : :.:.::.: ::.. ::::::
CCDS58 VYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQERRLWKLVGATSFGIGCAEVNKPGVY
380 390 400 410 420 430
540 550 560
pF1KE5 TKVTEVLPWIYSKMESEVRFRKS
:.:: : ::. .:: ...
CCDS58 TRVTSFLDWIHEQMERDLKT
440 450
>>CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 (435 aa)
initn: 807 init1: 323 opt: 888 Z-score: 439.2 bits: 90.8 E(32554): 3.8e-18
Smith-Waterman score: 929; 35.1% identity (64.5% similar) in 422 aa overlap (149-557:22-435)
120 130 140 150 160 170
pF1KE5 ATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLI
.: :.: . .:.: .:: .: .. ..
CCDS53 MDPDSDQPLNSLDVKPLRKPRIPMETFR--KVGIPII-IALLSLASIIIVV
10 20 30 40
180 190 200 210 220
pF1KE5 ILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCV-----------RFDWD
.:.. . . . . :.. . ::: .:: : :: :: :.. :
CCDS53 VLIKVILDKYYFLCGQPLHFIPRKQL-CDGELDCPLGEDEEHCVKSFPEGPAVAVRLSKD
50 60 70 80 90 100
230 240 250 260 270 280
pF1KE5 KSLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFES--AHRTTEVAHRDFANSFSILR
.: :.. .... .:. : .:.... .: .:.:.:. : . :..:.. . . : .
CCDS53 RSTLQVLDSATGNWFSACFDNFTEALAETACRQMGYSSKPTFRAVEIGPDQDLDVVEITE
110 120 130 140 150 160
290 300 310 320 330 340
pF1KE5 YNSTIQESLHRSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHI
.. .. . : : .::.: :: : :.:: :: ..::::::... :.
CCDS53 NSQELRMRNSSGPCLSGSLVSLHCLACGKSLKTPRVVGVEEASVDSWPWQVSIQYDKQHV
170 180 190 200 210 220
350 360 370 380 390 400
pF1KE5 CGGTLIDAQWVLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEE
:::...: .::::::::: .. . .::: ::...: ..: : :::. : .
CCDS53 CGGSILDPHWVLTAAHCF--RKHTDVFNWKVRAGSDKLGSFPSLAVAKIIIIEFNPMYPK
230 240 250 260 270 280
410 420 430 440 450 460
pF1KE5 DDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREV
:. :::::.:. :::.:. ..: :::. . .. :: :.: :... : : .: ..
CCDS53 DN-DIALMKLQFPLTFSGTVRPICLPFFDEELTPATPLWIIGWGFTKQNGGKMSDILLQA
290 300 310 320 330 340
470 480 490 500 510 520
pF1KE5 QVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTS
.:..:: .:: .:.. .: .::::: .:: :.:::::::::. :...:...:..:
CCDS53 SVQVIDSTRCNADDAYQGEVTEKMMCAGIPEGGVDTCQGDSGGPLM-YQSDQWHVVGIVS
350 360 370 380 390 400
530 540 550 560
pF1KE5 WGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS
:: ::: . :::::::. : :::. ..:.
CCDS53 WGYGCGGPSTPGVYTKVSAYLNWIYNVWKAEL
410 420 430
>>CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 (437 aa)
initn: 807 init1: 323 opt: 888 Z-score: 439.2 bits: 90.8 E(32554): 3.8e-18
Smith-Waterman score: 929; 35.1% identity (64.5% similar) in 422 aa overlap (149-557:24-437)
120 130 140 150 160 170
pF1KE5 ATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLI
.: :.: . .:.: .:: .: .. ..
CCDS31 MLQDPDSDQPLNSLDVKPLRKPRIPMETFR--KVGIPII-IALLSLASIIIVV
10 20 30 40 50
180 190 200 210 220
pF1KE5 ILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCV-----------RFDWD
.:.. . . . . :.. . ::: .:: : :: :: :.. :
CCDS31 VLIKVILDKYYFLCGQPLHFIPRKQL-CDGELDCPLGEDEEHCVKSFPEGPAVAVRLSKD
60 70 80 90 100
230 240 250 260 270 280
pF1KE5 KSLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFES--AHRTTEVAHRDFANSFSILR
.: :.. .... .:. : .:.... .: .:.:.:. : . :..:.. . . : .
CCDS31 RSTLQVLDSATGNWFSACFDNFTEALAETACRQMGYSSKPTFRAVEIGPDQDLDVVEITE
110 120 130 140 150 160
290 300 310 320 330 340
pF1KE5 YNSTIQESLHRSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHI
.. .. . : : .::.: :: : :.:: :: ..::::::... :.
CCDS31 NSQELRMRNSSGPCLSGSLVSLHCLACGKSLKTPRVVGVEEASVDSWPWQVSIQYDKQHV
170 180 190 200 210 220
350 360 370 380 390 400
pF1KE5 CGGTLIDAQWVLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEE
:::...: .::::::::: .. . .::: ::...: ..: : :::. : .
CCDS31 CGGSILDPHWVLTAAHCF--RKHTDVFNWKVRAGSDKLGSFPSLAVAKIIIIEFNPMYPK
230 240 250 260 270 280
410 420 430 440 450 460
pF1KE5 DDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREV
:. :::::.:. :::.:. ..: :::. . .. :: :.: :... : : .: ..
CCDS31 DN-DIALMKLQFPLTFSGTVRPICLPFFDEELTPATPLWIIGWGFTKQNGGKMSDILLQA
290 300 310 320 330 340
470 480 490 500 510 520
pF1KE5 QVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTS
.:..:: .:: .:.. .: .::::: .:: :.:::::::::. :...:...:..:
CCDS31 SVQVIDSTRCNADDAYQGEVTEKMMCAGIPEGGVDTCQGDSGGPLM-YQSDQWHVVGIVS
350 360 370 380 390 400
530 540 550 560
pF1KE5 WGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS
:: ::: . :::::::. : :::. ..:.
CCDS31 WGYGCGGPSTPGVYTKVSAYLNWIYNVWKAEL
410 420 430
562 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 05:51:56 2016 done: Tue Nov 8 05:51:57 2016
Total Scan time: 3.610 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]