FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5687, 562 aa 1>>>pF1KE5687 562 - 562 aa - 562 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.4903+/-0.00127; mu= -11.3931+/- 0.077 mean_var=462.8115+/-94.231, 0's: 0 Z-trim(113.6): 168 B-trim: 0 in 0/55 Lambda= 0.059617 statistics sampled from 14096 (14262) to 14096 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.731), E-opt: 0.2 (0.438), width: 16 Scan time: 3.610 The best scores are: opt bits E(32554) CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 3845 345.2 1.3e-94 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 3801 341.4 1.8e-93 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 2962 269.2 8.9e-72 CCDS55789.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 491) 2842 258.9 1.1e-68 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 995 100.0 7.1e-21 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 995 100.0 7.5e-21 CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 923 93.8 4.7e-19 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 919 93.4 6.2e-19 CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 888 90.8 3.8e-18 CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 888 90.8 3.8e-18 CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 876 89.7 7.3e-18 CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 823 85.1 1.8e-16 CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 823 85.2 1.9e-16 CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 823 85.2 1.9e-16 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 819 84.8 2.4e-16 CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 776 81.0 2.2e-15 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 757 79.6 1.3e-14 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 735 77.8 5.5e-14 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 735 77.8 5.6e-14 CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 727 77.2 1.1e-13 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 709 75.5 2.2e-13 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 700 74.5 2.2e-13 CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 703 75.1 3.9e-13 CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 692 73.9 4.4e-13 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 694 74.3 5.8e-13 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 687 73.8 1.2e-12 CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 667 71.7 1.7e-12 CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 643 69.5 6e-12 CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 648 70.1 6.1e-12 CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 646 70.2 1.1e-11 CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 634 68.8 1.2e-11 CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 418) 629 68.5 1.9e-11 CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 421) 629 68.5 1.9e-11 CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 623 67.9 2.7e-11 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 623 68.2 4.9e-11 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 623 68.3 5.3e-11 CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 608 66.6 5.5e-11 CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 607 66.6 7.2e-11 >>CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 (567 aa) initn: 3547 init1: 3547 opt: 3845 Z-score: 1812.2 bits: 345.2 E(32554): 1.3e-94 Smith-Waterman score: 3845; 99.1% identity (99.1% similar) in 567 aa overlap (1-562:1-567) 10 20 30 40 50 60 pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY :::::::::::::::::::::: ::::::::::::::::::::::::::::::::: CCDS41 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE5 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK 490 500 510 520 530 540 540 550 560 pF1KE5 PGVYTKVTEVLPWIYSKMESEVRFRKS ::::::::::::::::::::::::::: CCDS41 PGVYTKVTEVLPWIYSKMESEVRFRKS 550 560 >>CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 (563 aa) initn: 3503 init1: 3503 opt: 3801 Z-score: 1791.8 bits: 341.4 E(32554): 1.8e-93 Smith-Waterman score: 3801; 99.1% identity (99.1% similar) in 560 aa overlap (1-555:1-560) 10 20 30 40 50 60 pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY :::::::::::::::::::::: ::::::::::::::::::::::::::::::::: CCDS58 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE5 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK 490 500 510 520 530 540 540 550 560 pF1KE5 PGVYTKVTEVLPWIYSKMESEVRFRKS :::::::::::::::::::: CCDS58 PGVYTKVTEVLPWIYSKMESSAG 550 560 >>CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 (532 aa) initn: 2900 init1: 2900 opt: 2962 Z-score: 1402.1 bits: 269.2 E(32554): 8.9e-72 Smith-Waterman score: 3532; 92.8% identity (92.8% similar) in 567 aa overlap (1-562:1-532) 10 20 30 40 50 60 pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY :::::::::::::::::::::: ::::::::::::::::::::::::::::::::: CCDS55 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV :::::::::::::::::::::::::::::: CCDS55 LVRATPVGAVPIRSSPARSAPATRATRESP------------------------------ 130 140 150 180 190 200 210 220 230 pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 -----VQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS 160 170 180 190 200 240 250 260 270 280 290 pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW 270 280 290 300 310 320 360 370 380 390 400 410 pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC 390 400 410 420 430 440 480 490 500 510 520 530 pF1KE5 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 NDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNK 450 460 470 480 490 500 540 550 560 pF1KE5 PGVYTKVTEVLPWIYSKMESEVRFRKS ::::::::::::::::::::::::::: CCDS55 PGVYTKVTEVLPWIYSKMESEVRFRKS 510 520 530 >>CCDS55789.1 TMPRSS13 gene_id:84000|Hs108|chr11 (491 aa) initn: 2539 init1: 2539 opt: 2842 Z-score: 1346.8 bits: 258.9 E(32554): 1.1e-68 Smith-Waterman score: 2842; 97.2% identity (97.7% similar) in 436 aa overlap (1-431:1-434) 10 20 30 40 50 60 pF1KE5 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 MERDSHGNASPARTPSAGASPAQASPAGTPPGRASPAQASPAQASPAGTPPGRASPAQAS 10 20 30 40 50 60 70 80 90 100 110 pF1KE5 PAGTPPGRASPGRASPAQASPA-----RASPALASLSRSSSGRSSSARSASVTTSPTRVY :::::::::::::::::::::: ::::::::::::::::::::::::::::::::: CCDS55 PAGTPPGRASPGRASPAQASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE5 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 LVRATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE5 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 SLIILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE5 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 GSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLH 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE5 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 RSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQW 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE5 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS55 VLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRL 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE5 SKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKC :::::::.. : : CCDS55 SKPLTLSGE--GICTPRSPAPQPQHPLQPSHLSASVNSYPGPKASAGQKSKTLKDPYMEH 430 440 450 460 470 >>CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 (492 aa) initn: 882 init1: 497 opt: 995 Z-score: 488.3 bits: 100.0 E(32554): 7.1e-21 Smith-Waterman score: 1009; 35.4% identity (63.4% similar) in 492 aa overlap (86-556:9-491) 60 70 80 90 100 110 pF1KE5 PAQASPAGTPPGRASPGRASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY ::.. .. . . . :. :. :: :: CCDS33 MALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPT-VY 10 20 30 120 130 140 150 160 pF1KE5 LVRA-----TPVGAVPIRSSPARSAPATRATRESP-GTSLPKFTWREGQKQLPLIGCVLL :. .:: : : :.. . .:: :: . : . : : : :. CCDS33 EVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTL-GTFLV 40 50 60 70 80 90 170 180 190 200 210 220 pF1KE5 LIALVVSLIILFQFWQ-GHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDK ::...:. :. . ...::. .. .: . . :::: : :: :::. . CCDS33 GAALAAGLLWKFMGSKCSNSGIEC-DSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPN 100 110 120 130 140 150 230 240 250 260 270 280 pF1KE5 SLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNS .:..::.. ..: :.:...::..:.. .:...:... ... : ..: :... :. CCDS33 FILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDD-SGSTSFMKLNT 160 170 180 190 200 210 290 300 310 320 330 pF1KE5 T-----IQESLHRSE-CPSQRYISLQCSHCGLRAMTGR---IVGGALASDSKWPWQVSLH . : ..:..:. : :. .::.: ::. ..: :::: : . :::::::: CCDS33 SAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLH 220 230 240 250 260 270 340 350 360 370 380 390 pF1KE5 FGTTHICGGTLIDAQWVLTAAHCFFVTREKVLEG---WKVYAGTSNLHQLPEAAS--IAE ..:.:::..: .:..::::: :: :.. : ..:: . .:. . . CCDS33 VQNVHVCGGSIITPEWIVTAAHCV----EKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK 280 290 300 310 320 330 400 410 420 430 440 450 pF1KE5 IIINSNYTDEEDDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRET .: . :: .. . :::::.:.::::.. ..:.::: :. .. .. :::.:.: :.: CCDS33 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK 340 350 360 370 380 390 460 470 480 490 500 510 pF1KE5 DDKTSPFLREVQVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQ ::: : ..: ::. ..::. :::. .:: :.::: :.:. :::::::::::: . CCDS33 G-KTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMICAGFLQGNVDSCQGDSGGPLVTSK 400 410 420 430 440 520 530 540 550 560 pF1KE5 NNRWYLAGVTSWGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS :: :.: : ::::.::.. .:::: .: ::: .:... CCDS33 NNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG 450 460 470 480 490 >>CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 (529 aa) initn: 882 init1: 497 opt: 995 Z-score: 487.8 bits: 100.0 E(32554): 7.5e-21 Smith-Waterman score: 1009; 35.4% identity (63.4% similar) in 492 aa overlap (86-556:46-528) 60 70 80 90 100 110 pF1KE5 PAQASPAGTPPGRASPGRASPAQASPARASPALASLSRSSSGRSSSARSASVTTSPTRVY ::.. .. . . . :. :. :: :: CCDS54 GAAGHIEHSRYLSLLDAVDNSKMALNSGSPPAIGPYYENHGYQPENPYPAQPTVVPT-VY 20 30 40 50 60 70 120 130 140 150 160 pF1KE5 LVRA-----TPVGAVPIRSSPARSAPATRATRESP-GTSLPKFTWREGQKQLPLIGCVLL :. .:: : : :.. . .:: :: . : . : : : :. CCDS54 EVHPAQYYPSPVPQYAPRVLTQASNPVVCTQPKSPSGTVCTSKTKKALCITLTL-GTFLV 80 90 100 110 120 130 170 180 190 200 210 220 pF1KE5 LIALVVSLIILFQFWQ-GHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDK ::...:. :. . ...::. .. .: . . :::: : :: :::. . CCDS54 GAALAAGLLWKFMGSKCSNSGIEC-DSSGTCINPSNWCDGVSHCPGGEDENRCVRLYGPN 140 150 160 170 180 190 230 240 250 260 270 280 pF1KE5 SLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNS .:..::.. ..: :.:...::..:.. .:...:... ... : ..: :... :. CCDS54 FILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSSQGIVDD-SGSTSFMKLNT 200 210 220 230 240 250 290 300 310 320 330 pF1KE5 T-----IQESLHRSE-CPSQRYISLQCSHCGLRAMTGR---IVGGALASDSKWPWQVSLH . : ..:..:. : :. .::.: ::. ..: :::: : . :::::::: CCDS54 SAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSRQSRIVGGESALPGAWPWQVSLH 260 270 280 290 300 310 340 350 360 370 380 390 pF1KE5 FGTTHICGGTLIDAQWVLTAAHCFFVTREKVLEG---WKVYAGTSNLHQLPEAAS--IAE ..:.:::..: .:..::::: :: :.. : ..:: . .:. . . CCDS54 VQNVHVCGGSIITPEWIVTAAHCV----EKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK 320 330 340 350 360 400 410 420 430 440 450 pF1KE5 IIINSNYTDEEDDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRET .: . :: .. . :::::.:.::::.. ..:.::: :. .. .. :::.:.: :.: CCDS54 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK 370 380 390 400 410 420 460 470 480 490 500 510 pF1KE5 DDKTSPFLREVQVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQ ::: : ..: ::. ..::. :::. .:: :.::: :.:. :::::::::::: . CCDS54 G-KTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMICAGFLQGNVDSCQGDSGGPLVTSK 430 440 450 460 470 480 520 530 540 550 560 pF1KE5 NNRWYLAGVTSWGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS :: :.: : ::::.::.. .:::: .: ::: .:... CCDS54 NNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG 490 500 510 520 >>CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 (432 aa) initn: 807 init1: 323 opt: 923 Z-score: 455.5 bits: 93.8 E(32554): 4.7e-19 Smith-Waterman score: 923; 35.0% identity (64.3% similar) in 420 aa overlap (149-557:24-432) 120 130 140 150 160 170 pF1KE5 ATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLI .: :.: . .:.: .:: .: .. .. CCDS44 MLQDPDSDQPLNSLDVKPLRKPRIPMETFR--KVGIPII-IALLSLASIIIVV 10 20 30 40 50 180 190 200 210 220 pF1KE5 ILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCV-----------RFDWD .:.. . . . . :.. . ::: .:: : :: :: :.. : CCDS44 VLIKVILDKYYFLCGQPLHFIPRKQL-CDGELDCPLGEDEEHCVKSFPEGPAVAVRLSKD 60 70 80 90 100 230 240 250 260 270 280 pF1KE5 KSLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYN .: :.. .... .:. : .:.... .: .:.:.:. :..:.. . . : . . CCDS44 RSTLQVLDSATGNWFSACFDNFTEALAETACRQMGYS---RAVEIGPDQDLDVVEITENS 110 120 130 140 150 160 290 300 310 320 330 340 pF1KE5 STIQESLHRSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICG . .. . : : .::.: :: : :.:: :: ..::::::... :.:: CCDS44 QELRMRNSSGPCLSGSLVSLHCLACGKSLKTPRVVGVEEASVDSWPWQVSIQYDKQHVCG 170 180 190 200 210 220 350 360 370 380 390 400 pF1KE5 GTLIDAQWVLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDD :...: .::::::::: .. . .::: ::...: ..: : :::. : .:. CCDS44 GSILDPHWVLTAAHCF--RKHTDVFNWKVRAGSDKLGSFPSLAVAKIIIIEFNPMYPKDN 230 240 250 260 270 280 410 420 430 440 450 460 pF1KE5 YDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQV :::::.:. :::.:. ..: :::. . .. :: :.: :... : : .: ...: CCDS44 -DIALMKLQFPLTFSGTVRPICLPFFDEELTPATPLWIIGWGFTKQNGGKMSDILLQASV 290 300 310 320 330 340 470 480 490 500 510 520 pF1KE5 NLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWG ..:: .:: .:.. .: .::::: .:: :.:::::::::. :...:...:..::: CCDS44 QVIDSTRCNADDAYQGEVTEKMMCAGIPEGGVDTCQGDSGGPLM-YQSDQWHVVGIVSWG 350 360 370 380 390 400 530 540 550 560 pF1KE5 TGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS ::: . :::::::. : :::. ..:. CCDS44 YGCGGPSTPGVYTKVSAYLNWIYNVWKAEL 410 420 430 >>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa) initn: 927 init1: 388 opt: 919 Z-score: 453.4 bits: 93.4 E(32554): 6.2e-19 Smith-Waterman score: 1007; 37.9% identity (65.8% similar) in 409 aa overlap (163-558:53-452) 140 150 160 170 180 190 pF1KE5 RSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLIILFQFWQGHTGIRY .:: . :..::...: : :. .: CCDS58 DLKISPVAPDADAVAAQILSLLPLKFFPIIVIGIIALILALAIGLGIHFDC----SGKYR 30 40 50 60 70 200 210 220 230 240 250 pF1KE5 KEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYSGSSHQWLPICSSNWNDS .. .: . .::::: ::: :: ::: ....:......: : .::..:. CCDS58 CRSSFKCIELIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVFTAAS--WKTMCSDDWKGH 80 90 100 110 120 130 260 270 280 290 300 pF1KE5 YSEKTCQQLGFESAHRTTEVAHRDFANSFS--ILRYNSTIQE----SLH-----RSECPS :.. .: :::: : . .. .. ..: .. . . . .:: : : : CCDS58 YANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDHLLPDDKVTALHHSVYVREGCAS 140 150 160 170 180 190 310 320 330 340 350 360 pF1KE5 QRYISLQCSHCGLR-AMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQWVLTAA . ..:::. :: : ....::::: .. :.::::.::.: :.:::..: :..::: CCDS58 GHVVTLQCTACGHRRGYSSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSVITPLWIITAA 200 210 220 230 240 250 370 380 390 400 410 pF1KE5 HCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAE-IIINSNYTDEEDDYDIALMRLSKPL :: . . ..: . .: .: . : . ..: :. .:.: .. :::::.:. :: CCDS58 HCVYDLY--LPKSWTIQVGLVSLLDNPAPSHLVEKIVYHSKYKPKRLGNDIALMKLAGPL 260 270 280 290 300 310 420 430 440 450 460 470 pF1KE5 TLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKCNDYL :.. :.:.::: ..: ...:: .:.: :.. : .:: : .. : ::. : :: CCDS58 TFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGGD-ASPVLNHAAVPLISNKICNHRD 320 330 340 350 360 370 480 490 500 510 520 530 pF1KE5 VYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTSWGTGCGQRNKPGVY :: . ..: :.::: : :: :::::::::::::.. : :.:.::.: ::.. :::::: CCDS58 VYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQERRLWKLVGATSFGIGCAEVNKPGVY 380 390 400 410 420 430 540 550 560 pF1KE5 TKVTEVLPWIYSKMESEVRFRKS :.:: : ::. .:: ... CCDS58 TRVTSFLDWIHEQMERDLKT 440 450 >>CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 (435 aa) initn: 807 init1: 323 opt: 888 Z-score: 439.2 bits: 90.8 E(32554): 3.8e-18 Smith-Waterman score: 929; 35.1% identity (64.5% similar) in 422 aa overlap (149-557:22-435) 120 130 140 150 160 170 pF1KE5 ATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLI .: :.: . .:.: .:: .: .. .. CCDS53 MDPDSDQPLNSLDVKPLRKPRIPMETFR--KVGIPII-IALLSLASIIIVV 10 20 30 40 180 190 200 210 220 pF1KE5 ILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCV-----------RFDWD .:.. . . . . :.. . ::: .:: : :: :: :.. : CCDS53 VLIKVILDKYYFLCGQPLHFIPRKQL-CDGELDCPLGEDEEHCVKSFPEGPAVAVRLSKD 50 60 70 80 90 100 230 240 250 260 270 280 pF1KE5 KSLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFES--AHRTTEVAHRDFANSFSILR .: :.. .... .:. : .:.... .: .:.:.:. : . :..:.. . . : . CCDS53 RSTLQVLDSATGNWFSACFDNFTEALAETACRQMGYSSKPTFRAVEIGPDQDLDVVEITE 110 120 130 140 150 160 290 300 310 320 330 340 pF1KE5 YNSTIQESLHRSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHI .. .. . : : .::.: :: : :.:: :: ..::::::... :. CCDS53 NSQELRMRNSSGPCLSGSLVSLHCLACGKSLKTPRVVGVEEASVDSWPWQVSIQYDKQHV 170 180 190 200 210 220 350 360 370 380 390 400 pF1KE5 CGGTLIDAQWVLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEE :::...: .::::::::: .. . .::: ::...: ..: : :::. : . CCDS53 CGGSILDPHWVLTAAHCF--RKHTDVFNWKVRAGSDKLGSFPSLAVAKIIIIEFNPMYPK 230 240 250 260 270 280 410 420 430 440 450 460 pF1KE5 DDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREV :. :::::.:. :::.:. ..: :::. . .. :: :.: :... : : .: .. CCDS53 DN-DIALMKLQFPLTFSGTVRPICLPFFDEELTPATPLWIIGWGFTKQNGGKMSDILLQA 290 300 310 320 330 340 470 480 490 500 510 520 pF1KE5 QVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTS .:..:: .:: .:.. .: .::::: .:: :.:::::::::. :...:...:..: CCDS53 SVQVIDSTRCNADDAYQGEVTEKMMCAGIPEGGVDTCQGDSGGPLM-YQSDQWHVVGIVS 350 360 370 380 390 400 530 540 550 560 pF1KE5 WGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS :: ::: . :::::::. : :::. ..:. CCDS53 WGYGCGGPSTPGVYTKVSAYLNWIYNVWKAEL 410 420 430 >>CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 (437 aa) initn: 807 init1: 323 opt: 888 Z-score: 439.2 bits: 90.8 E(32554): 3.8e-18 Smith-Waterman score: 929; 35.1% identity (64.5% similar) in 422 aa overlap (149-557:24-437) 120 130 140 150 160 170 pF1KE5 ATPVGAVPIRSSPARSAPATRATRESPGTSLPKFTWREGQKQLPLIGCVLLLIALVVSLI .: :.: . .:.: .:: .: .. .. CCDS31 MLQDPDSDQPLNSLDVKPLRKPRIPMETFR--KVGIPII-IALLSLASIIIVV 10 20 30 40 50 180 190 200 210 220 pF1KE5 ILFQFWQGHTGIRYKEQRESCPKHAVRCDGVVDCKLKSDELGCV-----------RFDWD .:.. . . . . :.. . ::: .:: : :: :: :.. : CCDS31 VLIKVILDKYYFLCGQPLHFIPRKQL-CDGELDCPLGEDEEHCVKSFPEGPAVAVRLSKD 60 70 80 90 100 230 240 250 260 270 280 pF1KE5 KSLLKIYSGSSHQWLPICSSNWNDSYSEKTCQQLGFES--AHRTTEVAHRDFANSFSILR .: :.. .... .:. : .:.... .: .:.:.:. : . :..:.. . . : . CCDS31 RSTLQVLDSATGNWFSACFDNFTEALAETACRQMGYSSKPTFRAVEIGPDQDLDVVEITE 110 120 130 140 150 160 290 300 310 320 330 340 pF1KE5 YNSTIQESLHRSECPSQRYISLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHI .. .. . : : .::.: :: : :.:: :: ..::::::... :. CCDS31 NSQELRMRNSSGPCLSGSLVSLHCLACGKSLKTPRVVGVEEASVDSWPWQVSIQYDKQHV 170 180 190 200 210 220 350 360 370 380 390 400 pF1KE5 CGGTLIDAQWVLTAAHCFFVTREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEE :::...: .::::::::: .. . .::: ::...: ..: : :::. : . CCDS31 CGGSILDPHWVLTAAHCF--RKHTDVFNWKVRAGSDKLGSFPSLAVAKIIIIEFNPMYPK 230 240 250 260 270 280 410 420 430 440 450 460 pF1KE5 DDYDIALMRLSKPLTLSAHIHPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREV :. :::::.:. :::.:. ..: :::. . .. :: :.: :... : : .: .. CCDS31 DN-DIALMKLQFPLTFSGTVRPICLPFFDEELTPATPLWIIGWGFTKQNGGKMSDILLQA 290 300 310 320 330 340 470 480 490 500 510 520 pF1KE5 QVNLIDFKKCNDYLVYDSYLTPRMMCAGDLRGGRDSCQGDSGGPLVCEQNNRWYLAGVTS .:..:: .:: .:.. .: .::::: .:: :.:::::::::. :...:...:..: CCDS31 SVQVIDSTRCNADDAYQGEVTEKMMCAGIPEGGVDTCQGDSGGPLM-YQSDQWHVVGIVS 350 360 370 380 390 400 530 540 550 560 pF1KE5 WGTGCGQRNKPGVYTKVTEVLPWIYSKMESEVRFRKS :: ::: . :::::::. : :::. ..:. CCDS31 WGYGCGGPSTPGVYTKVSAYLNWIYNVWKAEL 410 420 430 562 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 05:51:56 2016 done: Tue Nov 8 05:51:57 2016 Total Scan time: 3.610 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]