FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4401, 417 aa
1>>>pF1KE4401 417 - 417 aa - 417 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6078+/-0.000797; mu= 15.4255+/- 0.048
mean_var=70.4789+/-14.411, 0's: 0 Z-trim(108.3): 171 B-trim: 64 in 1/47
Lambda= 0.152772
statistics sampled from 9924 (10104) to 9924 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.679), E-opt: 0.2 (0.31), width: 16
Scan time: 3.070
The best scores are: opt bits E(32554)
CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 2903 648.9 2.6e-186
CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 909 209.4 5.5e-54
CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 898 207.0 3e-53
CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 792 183.6 3e-46
CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 792 183.6 3.2e-46
CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 792 183.7 3.2e-46
CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 747 173.7 3.3e-43
CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 747 173.8 3.5e-43
CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 743 173.0 1.1e-42
CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 730 169.9 2.8e-42
CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 710 165.6 1.2e-40
CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 708 165.3 2e-40
CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 708 165.3 2e-40
CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 ( 290) 698 162.8 3.8e-40
CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 672 157.1 2.3e-38
CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 674 157.8 3.7e-38
CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 671 157.0 4.5e-38
CCDS58452.1 PRSS36 gene_id:146547|Hs108|chr16 ( 752) 667 156.2 9.7e-38
CCDS58453.1 PRSS36 gene_id:146547|Hs108|chr16 ( 850) 667 156.2 1.1e-37
CCDS32436.1 PRSS36 gene_id:146547|Hs108|chr16 ( 855) 667 156.2 1.1e-37
CCDS14101.1 ACR gene_id:49|Hs108|chr22 ( 421) 659 154.3 2e-37
CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 645 151.3 2.7e-36
CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 640 150.2 5e-36
CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 ( 314) 636 149.2 5.2e-36
CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 635 148.9 5.3e-36
CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 ( 317) 621 145.9 5.2e-35
CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 623 146.4 6e-35
CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 623 146.4 6.3e-35
CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 623 146.4 6.3e-35
CCDS44881.1 TMPRSS12 gene_id:283471|Hs108|chr12 ( 348) 619 145.5 7.7e-35
CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 593 139.7 3.2e-33
CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 597 140.8 5.2e-33
CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 597 140.8 5.7e-33
CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 592 139.6 7.2e-33
CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 586 138.2 1.4e-32
CCDS34302.1 F12 gene_id:2161|Hs108|chr5 ( 615) 586 138.3 1.9e-32
CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 576 135.9 4.4e-32
CCDS3709.1 PRSS12 gene_id:8492|Hs108|chr4 ( 875) 578 136.6 8.9e-32
CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 556 131.6 1.1e-30
CCDS3369.1 HGFAC gene_id:3083|Hs108|chr4 ( 655) 559 132.4 1.3e-30
CCDS75098.1 HGFAC gene_id:3083|Hs108|chr4 ( 662) 559 132.4 1.3e-30
CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 560 132.7 1.6e-30
CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 546 129.3 4.3e-30
CCDS219.1 CELA3B gene_id:23436|Hs108|chr1 ( 270) 538 127.6 1.5e-29
CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 537 127.3 1.7e-29
CCDS34049.1 CFI gene_id:3426|Hs108|chr4 ( 583) 541 128.4 1.8e-29
CCDS82946.1 CFI gene_id:3426|Hs108|chr4 ( 591) 540 128.2 2.1e-29
CCDS8812.1 CELA1 gene_id:1990|Hs108|chr12 ( 258) 535 126.9 2.2e-29
CCDS44442.1 PLAU gene_id:5328|Hs108|chr10 ( 414) 534 126.8 3.9e-29
CCDS7339.1 PLAU gene_id:5328|Hs108|chr10 ( 431) 534 126.8 4e-29
>>CCDS32993.1 HPN gene_id:3249|Hs108|chr19 (417 aa)
initn: 2903 init1: 2903 opt: 2903 Z-score: 3458.4 bits: 648.9 E(32554): 2.6e-186
Smith-Waterman score: 2903; 100.0% identity (100.0% similar) in 417 aa overlap (1-417:1-417)
10 20 30 40 50 60
pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYPVQVSSAD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYPVQVSSAD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 ARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 ARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 DEGRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DEGRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 RYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQASPHGLQLGVQAVVYH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 RYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQASPHGLQLGVQAVVYH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 GGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 GGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCE
310 320 330 340 350 360
370 380 390 400 410
pF1KE4 DSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS32 DSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL
370 380 390 400 410
>>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa)
initn: 758 init1: 441 opt: 909 Z-score: 1082.7 bits: 209.4 E(32554): 5.5e-54
Smith-Waterman score: 909; 39.8% identity (67.9% similar) in 364 aa overlap (47-405:100-448)
20 30 40 50 60 70
pF1KE4 KVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYP-VQVSSADARLMVFDKTEGTWRL
: : : :.:.. .: :.:: : ..:.
CCDS58 HFDCSGKYRCRSSFKCIELIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVF--TAASWKT
70 80 90 100 110 120
80 90 100 110 120 130
pF1KE4 LCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCVDEGRLPHTQ--RLLE
.::. ... :...: ..:: .. ..: : . .. : .:. :: . : .
CCDS58 MCSDDWKGHYANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDH-LLPDDKVTALHH
130 140 150 160 170 180
140 150 160 170 180 190
pF1KE4 VISVCD-CPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSL
. : . : :. .. : ::.:. .::::: . :..::::.::...: ::::::.
CCDS58 SVYVREGCASGHVVTLQCTACGHRRGYSSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSV
190 200 210 220 230 240
200 210 220 230 240 250
pF1KE4 LSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQA-SPHGLQLGVQAVVYHGGYLPFRDPNS
.. :..::::: . . . : . .: :. .: .: :. .:::. : : :
CCDS58 ITPLWIITAAHCVYDL-YLPKSWTIQVGLVSLLDNPAPSHL-VEKIVYHSKYKPKRL---
250 260 270 280 290 300
260 270 280 290 300 310
pF1KE4 EENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQE
.:::::..:..:: ..:.::::::: . . . :::.: ..::: :. :. . ::..
CCDS58 ---GNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGGDASPVLNH
310 320 330 340 350
320 330 340 350 360 370
pF1KE4 ARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRL
: ::.::: .:: : ::. :.:.:.:::: ::.:.::::::::.::.. : :.:
CCDS58 AAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQER--RL--WKL
360 370 380 390 400 410
380 390 400 410
pF1KE4 CGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL
: .:.: ::: ..::::::.:..: .:: . ..
CCDS58 VGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT
420 430 440 450
>>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa)
initn: 777 init1: 263 opt: 898 Z-score: 1069.5 bits: 207.0 E(32554): 3e-53
Smith-Waterman score: 898; 39.7% identity (67.7% similar) in 365 aa overlap (47-405:100-449)
20 30 40 50 60 70
pF1KE4 KVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYP-VQVSSADARLMVFDKTEGTWRL
: : : :.:.. .: :.:: : ..:.
CCDS13 HFDCSGKYRCRSSFKCIELIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVF--TAASWKT
70 80 90 100 110 120
80 90 100 110 120 130
pF1KE4 LCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCVDEGRLPHTQ--RLLE
.::. ... :...: ..:: .. ..: : . .. : .:. :: . : .
CCDS13 MCSDDWKGHYANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDH-LLPDDKVTALHH
130 140 150 160 170 180
140 150 160 170 180 190
pF1KE4 VISVCD-CPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSL
. : . : :. .. : ::.:. .::::: . :..::::.::...: ::::::.
CCDS13 SVYVREGCASGHVVTLQCTACGHRRGYSSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSV
190 200 210 220 230 240
200 210 220 230 240 250
pF1KE4 LSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQA-SPHGLQLGVQAVVYHGGYLPFRDPNS
.. :..::::: . . . : . .: :. .: .: :. .:::. : : :
CCDS13 ITPLWIITAAHCVYDL-YLPKSWTIQVGLVSLLDNPAPSHL-VEKIVYHSKYKPKRL---
250 260 270 280 290 300
260 270 280 290 300 310
pF1KE4 EENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQY-YGQQAGVLQ
.:::::..:..:: ..:.::::::: . . . :::.: ..::: :. :. . ::.
CCDS13 ---GNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGAGDASPVLN
310 320 330 340 350
320 330 340 350 360 370
pF1KE4 EARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWR
.: ::.::: .:: : ::. :.:.:.:::: ::.:.::::::::.::.. : :.
CCDS13 HAAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQER--RL--WK
360 370 380 390 400 410
380 390 400 410
pF1KE4 LCGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL
: : .:.: ::: ..::::::.:..: .:: . ..
CCDS13 LVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT
420 430 440 450
>>CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 (413 aa)
initn: 697 init1: 221 opt: 792 Z-score: 943.9 bits: 183.6 E(32554): 3e-46
Smith-Waterman score: 800; 34.6% identity (61.9% similar) in 396 aa overlap (11-400:30-404)
10 20 30 40
pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVA
: :.: ..: . : . ..: :..
CCDS73 MRRGCAVLGALGLLAGAGVGSWLLVLYLCPAASQPISGTLQDEEITLSCSEASAEEALLP
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE4 VLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTH
.: .. ...: : : . . . : :.: . .. : .: :: :
CCDS73 ALPKT-----VSFRINSEDFLLEAQVRDQPRWLLVCHEGWSPALGLQICWSLGHLRLTHH
70 80 90 100 110
110 120 130 140 150
pF1KE4 SELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVI--SVCDCPRGRFLAAICQDCGRRKLP
. ... :... : .. :. .:: .: :. .. :..:: : :
CCDS73 KGVNLTDIKLNSSQEFAQLS----PRLGGFLEEAWQPRNNCTSGQVVSLRCSECGARPL-
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE4 VDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPE-RNRVLSRWRVF
..:::::.... ::::::.:. : ::::.:. ::.:::::. : :: :::
CCDS73 ASRIVGGQSVAPGRWPWQASVALGFRHTCGGSVLAPRWVVTAAHCMHSFRLARLSSWRVH
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE4 AGAVAQAS--PHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPV
:: :.... :: : :. .. : : ...... :.::..:.. : ... . :
CCDS73 AGLVSHSAVRPHQGAL-VERIIPHPLY------SAQNHDYDVALLRLQTALNFSDTVGAV
240 250 260 270 280
280 290 300 310 320 330
pF1KE4 CLPAAGQALVDGKICTVTGWGNTQ-YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPK
:::: : . :. : :.:::.:. . .. .::.. ::..:...::.. :.. . :.
CCDS73 CLPAKEQHFPKGSRCWVSGWGHTHPSHTYSSDMLQDTVVPLFSTQLCNSSCVYSGALTPR
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE4 MFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSD
:.:::: .: ::::::::::.:: :. . ::: :.:::: ::: ..::::.::..
CCDS73 MLCAGYLDGRADACQGDSGGPLVCPDGDT----WRLVGVVSWGRGCAEPNHPGVYAKVAE
350 360 370 380 390
400 410
pF1KE4 FREWIFQAIKTHSEASGMVTQL
: .::
CCDS73 FLDWIHDTAQDSLL
400 410
>>CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 (448 aa)
initn: 697 init1: 221 opt: 792 Z-score: 943.4 bits: 183.6 E(32554): 3.2e-46
Smith-Waterman score: 800; 34.6% identity (61.9% similar) in 396 aa overlap (11-400:65-439)
10 20 30 40
pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIV
: :.: ..: . : . ..: :..
CCDS73 SMRRGCAVLGALGLLAGAGVGSWLLVLYLCPAASQPISGTLQDEEITLSCSEASAEEALL
40 50 60 70 80 90
50 60 70 80 90 100
pF1KE4 AVLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALT
.: .. ...: : : . . . : :.: . .. : .: ::
CCDS73 PALPKT-----VSFRINSEDFLLEAQVRDQPRWLLVCHEGWSPALGLQICWSLGHLRLTH
100 110 120 130 140
110 120 130 140 150
pF1KE4 HSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVI--SVCDCPRGRFLAAICQDCGRRKL
:. ... :... : .. :. .:: .: :. .. :..:: : :
CCDS73 HKGVNLTDIKLNSSQEFAQLS----PRLGGFLEEAWQPRNNCTSGQVVSLRCSECGARPL
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPE-RNRVLSRWRV
..:::::.... ::::::.:. : ::::.:. ::.:::::. : :: :::
CCDS73 -ASRIVGGQSVAPGRWPWQASVALGFRHTCGGSVLAPRWVVTAAHCMHSFRLARLSSWRV
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE4 FAGAVAQAS--PHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQP
:: :.... :: : :. .. : : ...... :.::..:.. : ... .
CCDS73 HAGLVSHSAVRPHQGAL-VERIIPHPLY------SAQNHDYDVALLRLQTALNFSDTVGA
270 280 290 300 310
280 290 300 310 320 330
pF1KE4 VCLPAAGQALVDGKICTVTGWGNTQ-YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKP
::::: : . :. : :.:::.:. . .. .::.. ::..:...::.. :.. . :
CCDS73 VCLPAKEQHFPKGSRCWVSGWGHTHPSHTYSSDMLQDTVVPLFSTQLCNSSCVYSGALTP
320 330 340 350 360 370
340 350 360 370 380 390
pF1KE4 KMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVS
.:.:::: .: ::::::::::.:: :. . ::: :.:::: ::: ..::::.::.
CCDS73 RMLCAGYLDGRADACQGDSGGPLVCPDGDT----WRLVGVVSWGRGCAEPNHPGVYAKVA
380 390 400 410 420 430
400 410
pF1KE4 DFREWIFQAIKTHSEASGMVTQL
.: .::
CCDS73 EFLDWIHDTAQDSLL
440
>>CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 (457 aa)
initn: 697 init1: 221 opt: 792 Z-score: 943.2 bits: 183.7 E(32554): 3.2e-46
Smith-Waterman score: 800; 34.6% identity (61.9% similar) in 396 aa overlap (11-400:74-448)
10 20 30 40
pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIV
: :.: ..: . : . ..: :..
CCDS44 SMRRGCAVLGALGLLAGAGVGSWLLVLYLCPAASQPISGTLQDEEITLSCSEASAEEALL
50 60 70 80 90 100
50 60 70 80 90 100
pF1KE4 AVLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALT
.: .. ...: : : . . . : :.: . .. : .: ::
CCDS44 PALPKT-----VSFRINSEDFLLEAQVRDQPRWLLVCHEGWSPALGLQICWSLGHLRLTH
110 120 130 140 150
110 120 130 140 150
pF1KE4 HSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVI--SVCDCPRGRFLAAICQDCGRRKL
:. ... :... : .. :. .:: .: :. .. :..:: : :
CCDS44 HKGVNLTDIKLNSSQEFAQLS----PRLGGFLEEAWQPRNNCTSGQVVSLRCSECGARPL
160 170 180 190 200 210
160 170 180 190 200 210
pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPE-RNRVLSRWRV
..:::::.... ::::::.:. : ::::.:. ::.:::::. : :: :::
CCDS44 -ASRIVGGQSVAPGRWPWQASVALGFRHTCGGSVLAPRWVVTAAHCMHSFRLARLSSWRV
220 230 240 250 260 270
220 230 240 250 260 270
pF1KE4 FAGAVAQAS--PHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQP
:: :.... :: : :. .. : : ...... :.::..:.. : ... .
CCDS44 HAGLVSHSAVRPHQGAL-VERIIPHPLY------SAQNHDYDVALLRLQTALNFSDTVGA
280 290 300 310 320
280 290 300 310 320 330
pF1KE4 VCLPAAGQALVDGKICTVTGWGNTQ-YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKP
::::: : . :. : :.:::.:. . .. .::.. ::..:...::.. :.. . :
CCDS44 VCLPAKEQHFPKGSRCWVSGWGHTHPSHTYSSDMLQDTVVPLFSTQLCNSSCVYSGALTP
330 340 350 360 370 380
340 350 360 370 380 390
pF1KE4 KMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVS
.:.:::: .: ::::::::::.:: :. . ::: :.:::: ::: ..::::.::.
CCDS44 RMLCAGYLDGRADACQGDSGGPLVCPDGDT----WRLVGVVSWGRGCAEPNHPGVYAKVA
390 400 410 420 430 440
400 410
pF1KE4 DFREWIFQAIKTHSEASGMVTQL
.: .::
CCDS44 EFLDWIHDTAQDSLL
450
>>CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 (492 aa)
initn: 674 init1: 353 opt: 747 Z-score: 889.1 bits: 173.7 E(32554): 3.3e-43
Smith-Waterman score: 748; 31.7% identity (60.6% similar) in 398 aa overlap (13-405:113-489)
10 20 30 40
pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAV
:: . ..:: :. ..: .
CCDS33 KALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGT-----CINPSNWCDGVS
90 100 110 120 130
50 60 70 80 90 100
pF1KE4 LLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHS
. .. :.. . . :.:... . .:. .:.. : . .:..::. . :
CCDS33 HCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSS
140 150 160 170 180 190
110 120 130 140 150
pF1KE4 ELDVRTAGANGTSGFFCVDE--GRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRR--KL
. : .: ...:. .. : . ..: . . : .. : :: .
CCDS33 QGIVDDSG---STSFMKLNTSAGNVDIYKKLYHSDA---CSSKAVVSLRCIACGVNLNSS
200 210 220 230 240 250
160 170 180 190 200 210
pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVF
.:::::... : :::::::. ...:.::::... .:..::::: . .: .:
CCDS33 RQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAF
260 270 280 290 300 310
220 230 240 250 260 270
pF1KE4 AGAVAQASP-HGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVC
:: . :. .: :. :. : .: .:. ..:::::..:..:: ... ..:::
CCDS33 AGILRQSFMFYGAGYQVEKVISHPNY------DSKTKNNDIALMKLQKPLTFNDLVKPVC
320 330 340 350 360
280 290 300 310 320 330
pF1KE4 LPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMF
:: :. : ..: ..::: :. :. . ::. :.: .: .. ::. : : : : :.
CCDS33 LPNPGMMLQPEQLCWISGWGATEEKGKTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMI
370 380 390 400 410 420
340 350 360 370 380 390
pF1KE4 CAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFR
:::. .:..:.::::::::.: :.. : : : .:::.::: : .:::: .: :
CCDS33 CAGFLQGNVDSCQGDSGGPLVT----SKNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFT
430 440 450 460 470 480
400 410
pF1KE4 EWIFQAIKTHSEASGMVTQL
.::.. ..
CCDS33 DWIYRQMRADG
490
>>CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 (529 aa)
initn: 697 init1: 353 opt: 747 Z-score: 888.7 bits: 173.8 E(32554): 3.5e-43
Smith-Waterman score: 748; 31.7% identity (60.6% similar) in 398 aa overlap (13-405:150-526)
10 20 30 40
pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAV
:: . ..:: :. ..: .
CCDS54 KALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGT-----CINPSNWCDGVS
120 130 140 150 160 170
50 60 70 80 90 100
pF1KE4 LLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHS
. .. :.. . . :.:... . .:. .:.. : . .:..::. . :
CCDS54 HCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSS
180 190 200 210 220 230
110 120 130 140 150
pF1KE4 ELDVRTAGANGTSGFFCVDE--GRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRR--KL
. : .: ...:. .. : . ..: . . : .. : :: .
CCDS54 QGIVDDSG---STSFMKLNTSAGNVDIYKKLYHSDA---CSSKAVVSLRCIACGVNLNSS
240 250 260 270 280
160 170 180 190 200 210
pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVF
.:::::... : :::::::. ...:.::::... .:..::::: . .: .:
CCDS54 RQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAF
290 300 310 320 330 340
220 230 240 250 260 270
pF1KE4 AGAVAQASP-HGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVC
:: . :. .: :. :. : .: .:. ..:::::..:..:: ... ..:::
CCDS54 AGILRQSFMFYGAGYQVEKVISHPNY------DSKTKNNDIALMKLQKPLTFNDLVKPVC
350 360 370 380 390 400
280 290 300 310 320 330
pF1KE4 LPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMF
:: :. : ..: ..::: :. :. . ::. :.: .: .. ::. : : : : :.
CCDS54 LPNPGMMLQPEQLCWISGWGATEEKGKTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMI
410 420 430 440 450 460
340 350 360 370 380 390
pF1KE4 CAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFR
:::. .:..:.::::::::.: :.. : : : .:::.::: : .:::: .: :
CCDS54 CAGFLQGNVDSCQGDSGGPLVT----SKNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFT
470 480 490 500 510
400 410
pF1KE4 EWIFQAIKTHSEASGMVTQL
.::.. ..
CCDS54 DWIYRQMRADG
520
>>CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019 aa)
initn: 706 init1: 249 opt: 743 Z-score: 879.5 bits: 173.0 E(32554): 1.1e-42
Smith-Waterman score: 743; 36.1% identity (62.8% similar) in 341 aa overlap (68-400:694-1014)
40 50 60 70 80 90
pF1KE4 AIVAVLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLR
. .. :. :. ...... :. .: :
CCDS13 GHLHCEDGSDEADCVRFFNGTTNNNGLVRFRIQSIWHTACAENWTTQISNDVCQLLG-LG
670 680 690 700 710 720
100 110 120 130 140 150
pF1KE4 ALTHSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVISVCDCPRGRFLAAIC--QDCGR
. . :. : : : : : . : . .: .: . .. : ..::.
CCDS13 SGNSSKPIFPTDG-----GPF-VKLNTAPDGHLIL--TPSQQCLQDSLIRLQCNHKSCGK
730 740 750 760 770
160 170 180 190 200 210
pF1KE4 RKLPVD---RIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVL
. : .:::: ... : ::: :.: : : :::.::.:.::...:::: ::
CCDS13 KLAAQDITPKIVGGSNAKEGAWPWVVGLYYGGRLLCGASLVSSDWLVSAAHCVYGRNLEP
780 790 800 810 820 830
220 230 240 250 260
pF1KE4 SRWRVFAGAVAQA---SPHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPL
:.: .. : .. ::. . .. .: . : : ....::::..:: .
CCDS13 SKWTAILGLHMKSNLTSPQTVPRLIDEIVINPHY------NRRRKDNDIAMMHLEFKVNY
840 850 860 870 880
270 280 290 300 310 320
pF1KE4 TEYIQPVCLPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQEARVPIISNDVCNGADFYG
:.::::.::: .:.. :. :...:::.. : : :..:::: ::..::. :. ..
CCDS13 TDYIQPICLPEENQVFPPGRNCSIAGWGTVVYQGTTANILQEADVPLLSNERCQ-QQMPE
890 900 910 920 930 940
330 340 350 360 370 380
pF1KE4 NQIKPKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGV
.: .:.:::: :::::.::::::::..:... :: : :..:.: ::: ..:::
CCDS13 YNITENMICAGYEEGGIDSCQGDSGGPLMCQEN----NRWFLAGVTSFGYKCALPNRPGV
950 960 970 980 990 1000
390 400 410
pF1KE4 YTKVSDFREWIFQAIKTHSEASGMVTQL
:..:: : :::
CCDS13 YARVSRFTEWIQSFLH
1010
>>CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 (280 aa)
initn: 601 init1: 256 opt: 730 Z-score: 872.7 bits: 169.9 E(32554): 2.8e-42
Smith-Waterman score: 730; 42.8% identity (65.0% similar) in 283 aa overlap (129-400:8-274)
100 110 120 130 140 150
pF1KE4 LTHSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKL
: :: .. .:: :: ::. ..
CCDS42 MRGVSCLQVLLLLVLGAAGTQGRKSAA----CGQPRM
10 20 30
160 170 180 190 200 210
pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVF
.::::::: :.::::.:... :::.:::::.. .::::::::::.: . ...::
CCDS42 S-SRIVGGRDGRDGEWPWQASIQHRGAHVCGGSLIAPQWVLTAAHCFPRRA-LPAEYRVR
40 50 60 70 80 90
220 230 240 250 260 270
pF1KE4 AGAV--AQASPHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPV
::. ...::. :.. :. :. :: : . . .:.::..: :.::. .:::
CCDS42 LGALRLGSTSPRTLSVPVRRVL-----LP-PDYSEDGARGDLALLQLRRPVPLSARVQPV
100 110 120 130 140
280 290 300 310 320 330
pF1KE4 CLPAAGQALVDGKICTVTGWGNTQ--YYGQQAGVLQEARVPIISNDVCNGADFYGNQIK-
:::. : : : :::::. . . :: .:::.... .:.: : ..
CCDS42 CLPVPGARPPPGTPCRVTGWGSLRPGVPLPEWRPLQGVRVPLLDSRTCDGLYHVGADVPQ
150 160 170 180 190 200
340 350 360 370 380
pF1KE4 ------PKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKP
: .:::::.: ::::::::::..: .: : : : :.:::: :::: ..:
CCDS42 AERIVLPGSLCAGYPQGHKDACQGDSGGPLTCLQSGS----WVLVGVVSWGKGCALPNRP
210 220 230 240 250 260
390 400 410
pF1KE4 GVYTKVSDFREWIFQAIKTHSEASGMVTQL
::::.:. . ::
CCDS42 GVYTSVATYSPWIQARVSF
270 280
417 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 01:21:45 2016 done: Sun Nov 6 01:21:46 2016
Total Scan time: 3.070 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]