FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4401, 417 aa 1>>>pF1KE4401 417 - 417 aa - 417 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6078+/-0.000797; mu= 15.4255+/- 0.048 mean_var=70.4789+/-14.411, 0's: 0 Z-trim(108.3): 171 B-trim: 64 in 1/47 Lambda= 0.152772 statistics sampled from 9924 (10104) to 9924 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.679), E-opt: 0.2 (0.31), width: 16 Scan time: 3.070 The best scores are: opt bits E(32554) CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 2903 648.9 2.6e-186 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 909 209.4 5.5e-54 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 898 207.0 3e-53 CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 792 183.6 3e-46 CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 792 183.6 3.2e-46 CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 792 183.7 3.2e-46 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 747 173.7 3.3e-43 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 747 173.8 3.5e-43 CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 743 173.0 1.1e-42 CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 730 169.9 2.8e-42 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 710 165.6 1.2e-40 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 708 165.3 2e-40 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 708 165.3 2e-40 CCDS10476.1 PRSS27 gene_id:83886|Hs108|chr16 ( 290) 698 162.8 3.8e-40 CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 672 157.1 2.3e-38 CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 674 157.8 3.7e-38 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 671 157.0 4.5e-38 CCDS58452.1 PRSS36 gene_id:146547|Hs108|chr16 ( 752) 667 156.2 9.7e-38 CCDS58453.1 PRSS36 gene_id:146547|Hs108|chr16 ( 850) 667 156.2 1.1e-37 CCDS32436.1 PRSS36 gene_id:146547|Hs108|chr16 ( 855) 667 156.2 1.1e-37 CCDS14101.1 ACR gene_id:49|Hs108|chr22 ( 421) 659 154.3 2e-37 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 645 151.3 2.7e-36 CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 640 150.2 5e-36 CCDS10478.1 PRSS21 gene_id:10942|Hs108|chr16 ( 314) 636 149.2 5.2e-36 CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 635 148.9 5.3e-36 CCDS10481.1 PRSS22 gene_id:64063|Hs108|chr16 ( 317) 621 145.9 5.2e-35 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 623 146.4 6e-35 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 623 146.4 6.3e-35 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 623 146.4 6.3e-35 CCDS44881.1 TMPRSS12 gene_id:283471|Hs108|chr12 ( 348) 619 145.5 7.7e-35 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 593 139.7 3.2e-33 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 597 140.8 5.2e-33 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 597 140.8 5.7e-33 CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 592 139.6 7.2e-33 CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 586 138.2 1.4e-32 CCDS34302.1 F12 gene_id:2161|Hs108|chr5 ( 615) 586 138.3 1.9e-32 CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 576 135.9 4.4e-32 CCDS3709.1 PRSS12 gene_id:8492|Hs108|chr4 ( 875) 578 136.6 8.9e-32 CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 556 131.6 1.1e-30 CCDS3369.1 HGFAC gene_id:3083|Hs108|chr4 ( 655) 559 132.4 1.3e-30 CCDS75098.1 HGFAC gene_id:3083|Hs108|chr4 ( 662) 559 132.4 1.3e-30 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 560 132.7 1.6e-30 CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 546 129.3 4.3e-30 CCDS219.1 CELA3B gene_id:23436|Hs108|chr1 ( 270) 538 127.6 1.5e-29 CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 537 127.3 1.7e-29 CCDS34049.1 CFI gene_id:3426|Hs108|chr4 ( 583) 541 128.4 1.8e-29 CCDS82946.1 CFI gene_id:3426|Hs108|chr4 ( 591) 540 128.2 2.1e-29 CCDS8812.1 CELA1 gene_id:1990|Hs108|chr12 ( 258) 535 126.9 2.2e-29 CCDS44442.1 PLAU gene_id:5328|Hs108|chr10 ( 414) 534 126.8 3.9e-29 CCDS7339.1 PLAU gene_id:5328|Hs108|chr10 ( 431) 534 126.8 4e-29 >>CCDS32993.1 HPN gene_id:3249|Hs108|chr19 (417 aa) initn: 2903 init1: 2903 opt: 2903 Z-score: 3458.4 bits: 648.9 E(32554): 2.6e-186 Smith-Waterman score: 2903; 100.0% identity (100.0% similar) in 417 aa overlap (1-417:1-417) 10 20 30 40 50 60 pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYPVQVSSAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYPVQVSSAD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 ARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 ARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DEGRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DEGRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 RYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQASPHGLQLGVQAVVYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 RYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQASPHGLQLGVQAVVYH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCE 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 DSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 DSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL 370 380 390 400 410 >>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa) initn: 758 init1: 441 opt: 909 Z-score: 1082.7 bits: 209.4 E(32554): 5.5e-54 Smith-Waterman score: 909; 39.8% identity (67.9% similar) in 364 aa overlap (47-405:100-448) 20 30 40 50 60 70 pF1KE4 KVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYP-VQVSSADARLMVFDKTEGTWRL : : : :.:.. .: :.:: : ..:. CCDS58 HFDCSGKYRCRSSFKCIELIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVF--TAASWKT 70 80 90 100 110 120 80 90 100 110 120 130 pF1KE4 LCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCVDEGRLPHTQ--RLLE .::. ... :...: ..:: .. ..: : . .. : .:. :: . : . CCDS58 MCSDDWKGHYANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDH-LLPDDKVTALHH 130 140 150 160 170 180 140 150 160 170 180 190 pF1KE4 VISVCD-CPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSL . : . : :. .. : ::.:. .::::: . :..::::.::...: ::::::. CCDS58 SVYVREGCASGHVVTLQCTACGHRRGYSSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSV 190 200 210 220 230 240 200 210 220 230 240 250 pF1KE4 LSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQA-SPHGLQLGVQAVVYHGGYLPFRDPNS .. :..::::: . . . : . .: :. .: .: :. .:::. : : : CCDS58 ITPLWIITAAHCVYDL-YLPKSWTIQVGLVSLLDNPAPSHL-VEKIVYHSKYKPKRL--- 250 260 270 280 290 300 260 270 280 290 300 310 pF1KE4 EENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQE .:::::..:..:: ..:.::::::: . . . :::.: ..::: :. :. . ::.. CCDS58 ---GNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGGDASPVLNH 310 320 330 340 350 320 330 340 350 360 370 pF1KE4 ARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRL : ::.::: .:: : ::. :.:.:.:::: ::.:.::::::::.::.. : :.: CCDS58 AAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQER--RL--WKL 360 370 380 390 400 410 380 390 400 410 pF1KE4 CGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL : .:.: ::: ..::::::.:..: .:: . .. CCDS58 VGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT 420 430 440 450 >>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa) initn: 777 init1: 263 opt: 898 Z-score: 1069.5 bits: 207.0 E(32554): 3e-53 Smith-Waterman score: 898; 39.7% identity (67.7% similar) in 365 aa overlap (47-405:100-449) 20 30 40 50 60 70 pF1KE4 KVAALTAGTLLLLTAIGAASWAIVAVLLRSDQEPLYP-VQVSSADARLMVFDKTEGTWRL : : : :.:.. .: :.:: : ..:. CCDS13 HFDCSGKYRCRSSFKCIELIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVF--TAASWKT 70 80 90 100 110 120 80 90 100 110 120 130 pF1KE4 LCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGANGTSGFFCVDEGRLPHTQ--RLLE .::. ... :...: ..:: .. ..: : . .. : .:. :: . : . CCDS13 MCSDDWKGHYANVACAQLGFPSYVSSDNLRVSSLEGQFREEFVSIDH-LLPDDKVTALHH 130 140 150 160 170 180 140 150 160 170 180 190 pF1KE4 VISVCD-CPRGRFLAAICQDCGRRKLPVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSL . : . : :. .. : ::.:. .::::: . :..::::.::...: ::::::. CCDS13 SVYVREGCASGHVVTLQCTACGHRRGYSSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSV 190 200 210 220 230 240 200 210 220 230 240 250 pF1KE4 LSGDWVLTAAHCFPERNRVLSRWRVFAGAVAQA-SPHGLQLGVQAVVYHGGYLPFRDPNS .. :..::::: . . . : . .: :. .: .: :. .:::. : : : CCDS13 ITPLWIITAAHCVYDL-YLPKSWTIQVGLVSLLDNPAPSHL-VEKIVYHSKYKPKRL--- 250 260 270 280 290 300 260 270 280 290 300 310 pF1KE4 EENSNDIALVHLSSPLPLTEYIQPVCLPAAGQALVDGKICTVTGWGNTQY-YGQQAGVLQ .:::::..:..:: ..:.::::::: . . . :::.: ..::: :. :. . ::. CCDS13 ---GNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGAGDASPVLN 310 320 330 340 350 320 330 340 350 360 370 pF1KE4 EARVPIISNDVCNGADFYGNQIKPKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWR .: ::.::: .:: : ::. :.:.:.:::: ::.:.::::::::.::.. : :. CCDS13 HAAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQER--RL--WK 360 370 380 390 400 410 380 390 400 410 pF1KE4 LCGIVSWGTGCALAQKPGVYTKVSDFREWIFQAIKTHSEASGMVTQL : : .:.: ::: ..::::::.:..: .:: . .. CCDS13 LVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT 420 430 440 450 >>CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 (413 aa) initn: 697 init1: 221 opt: 792 Z-score: 943.9 bits: 183.6 E(32554): 3e-46 Smith-Waterman score: 800; 34.6% identity (61.9% similar) in 396 aa overlap (11-400:30-404) 10 20 30 40 pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVA : :.: ..: . : . ..: :.. CCDS73 MRRGCAVLGALGLLAGAGVGSWLLVLYLCPAASQPISGTLQDEEITLSCSEASAEEALLP 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE4 VLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTH .: .. ...: : : . . . : :.: . .. : .: :: : CCDS73 ALPKT-----VSFRINSEDFLLEAQVRDQPRWLLVCHEGWSPALGLQICWSLGHLRLTHH 70 80 90 100 110 110 120 130 140 150 pF1KE4 SELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVI--SVCDCPRGRFLAAICQDCGRRKLP . ... :... : .. :. .:: .: :. .. :..:: : : CCDS73 KGVNLTDIKLNSSQEFAQLS----PRLGGFLEEAWQPRNNCTSGQVVSLRCSECGARPL- 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE4 VDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPE-RNRVLSRWRVF ..:::::.... ::::::.:. : ::::.:. ::.:::::. : :: ::: CCDS73 ASRIVGGQSVAPGRWPWQASVALGFRHTCGGSVLAPRWVVTAAHCMHSFRLARLSSWRVH 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE4 AGAVAQAS--PHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPV :: :.... :: : :. .. : : ...... :.::..:.. : ... . : CCDS73 AGLVSHSAVRPHQGAL-VERIIPHPLY------SAQNHDYDVALLRLQTALNFSDTVGAV 240 250 260 270 280 280 290 300 310 320 330 pF1KE4 CLPAAGQALVDGKICTVTGWGNTQ-YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPK :::: : . :. : :.:::.:. . .. .::.. ::..:...::.. :.. . :. CCDS73 CLPAKEQHFPKGSRCWVSGWGHTHPSHTYSSDMLQDTVVPLFSTQLCNSSCVYSGALTPR 290 300 310 320 330 340 340 350 360 370 380 390 pF1KE4 MFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSD :.:::: .: ::::::::::.:: :. . ::: :.:::: ::: ..::::.::.. CCDS73 MLCAGYLDGRADACQGDSGGPLVCPDGDT----WRLVGVVSWGRGCAEPNHPGVYAKVAE 350 360 370 380 390 400 410 pF1KE4 FREWIFQAIKTHSEASGMVTQL : .:: CCDS73 FLDWIHDTAQDSLL 400 410 >>CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 (448 aa) initn: 697 init1: 221 opt: 792 Z-score: 943.4 bits: 183.6 E(32554): 3.2e-46 Smith-Waterman score: 800; 34.6% identity (61.9% similar) in 396 aa overlap (11-400:65-439) 10 20 30 40 pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIV : :.: ..: . : . ..: :.. CCDS73 SMRRGCAVLGALGLLAGAGVGSWLLVLYLCPAASQPISGTLQDEEITLSCSEASAEEALL 40 50 60 70 80 90 50 60 70 80 90 100 pF1KE4 AVLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALT .: .. ...: : : . . . : :.: . .. : .: :: CCDS73 PALPKT-----VSFRINSEDFLLEAQVRDQPRWLLVCHEGWSPALGLQICWSLGHLRLTH 100 110 120 130 140 110 120 130 140 150 pF1KE4 HSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVI--SVCDCPRGRFLAAICQDCGRRKL :. ... :... : .. :. .:: .: :. .. :..:: : : CCDS73 HKGVNLTDIKLNSSQEFAQLS----PRLGGFLEEAWQPRNNCTSGQVVSLRCSECGARPL 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPE-RNRVLSRWRV ..:::::.... ::::::.:. : ::::.:. ::.:::::. : :: ::: CCDS73 -ASRIVGGQSVAPGRWPWQASVALGFRHTCGGSVLAPRWVVTAAHCMHSFRLARLSSWRV 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE4 FAGAVAQAS--PHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQP :: :.... :: : :. .. : : ...... :.::..:.. : ... . CCDS73 HAGLVSHSAVRPHQGAL-VERIIPHPLY------SAQNHDYDVALLRLQTALNFSDTVGA 270 280 290 300 310 280 290 300 310 320 330 pF1KE4 VCLPAAGQALVDGKICTVTGWGNTQ-YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKP ::::: : . :. : :.:::.:. . .. .::.. ::..:...::.. :.. . : CCDS73 VCLPAKEQHFPKGSRCWVSGWGHTHPSHTYSSDMLQDTVVPLFSTQLCNSSCVYSGALTP 320 330 340 350 360 370 340 350 360 370 380 390 pF1KE4 KMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVS .:.:::: .: ::::::::::.:: :. . ::: :.:::: ::: ..::::.::. CCDS73 RMLCAGYLDGRADACQGDSGGPLVCPDGDT----WRLVGVVSWGRGCAEPNHPGVYAKVA 380 390 400 410 420 430 400 410 pF1KE4 DFREWIFQAIKTHSEASGMVTQL .: .:: CCDS73 EFLDWIHDTAQDSLL 440 >>CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 (457 aa) initn: 697 init1: 221 opt: 792 Z-score: 943.2 bits: 183.7 E(32554): 3.2e-46 Smith-Waterman score: 800; 34.6% identity (61.9% similar) in 396 aa overlap (11-400:74-448) 10 20 30 40 pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIV : :.: ..: . : . ..: :.. CCDS44 SMRRGCAVLGALGLLAGAGVGSWLLVLYLCPAASQPISGTLQDEEITLSCSEASAEEALL 50 60 70 80 90 100 50 60 70 80 90 100 pF1KE4 AVLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALT .: .. ...: : : . . . : :.: . .. : .: :: CCDS44 PALPKT-----VSFRINSEDFLLEAQVRDQPRWLLVCHEGWSPALGLQICWSLGHLRLTH 110 120 130 140 150 110 120 130 140 150 pF1KE4 HSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVI--SVCDCPRGRFLAAICQDCGRRKL :. ... :... : .. :. .:: .: :. .. :..:: : : CCDS44 HKGVNLTDIKLNSSQEFAQLS----PRLGGFLEEAWQPRNNCTSGQVVSLRCSECGARPL 160 170 180 190 200 210 160 170 180 190 200 210 pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPE-RNRVLSRWRV ..:::::.... ::::::.:. : ::::.:. ::.:::::. : :: ::: CCDS44 -ASRIVGGQSVAPGRWPWQASVALGFRHTCGGSVLAPRWVVTAAHCMHSFRLARLSSWRV 220 230 240 250 260 270 220 230 240 250 260 270 pF1KE4 FAGAVAQAS--PHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQP :: :.... :: : :. .. : : ...... :.::..:.. : ... . CCDS44 HAGLVSHSAVRPHQGAL-VERIIPHPLY------SAQNHDYDVALLRLQTALNFSDTVGA 280 290 300 310 320 280 290 300 310 320 330 pF1KE4 VCLPAAGQALVDGKICTVTGWGNTQ-YYGQQAGVLQEARVPIISNDVCNGADFYGNQIKP ::::: : . :. : :.:::.:. . .. .::.. ::..:...::.. :.. . : CCDS44 VCLPAKEQHFPKGSRCWVSGWGHTHPSHTYSSDMLQDTVVPLFSTQLCNSSCVYSGALTP 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE4 KMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVS .:.:::: .: ::::::::::.:: :. . ::: :.:::: ::: ..::::.::. CCDS44 RMLCAGYLDGRADACQGDSGGPLVCPDGDT----WRLVGVVSWGRGCAEPNHPGVYAKVA 390 400 410 420 430 440 400 410 pF1KE4 DFREWIFQAIKTHSEASGMVTQL .: .:: CCDS44 EFLDWIHDTAQDSLL 450 >>CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 (492 aa) initn: 674 init1: 353 opt: 747 Z-score: 889.1 bits: 173.7 E(32554): 3.3e-43 Smith-Waterman score: 748; 31.7% identity (60.6% similar) in 398 aa overlap (13-405:113-489) 10 20 30 40 pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAV :: . ..:: :. ..: . CCDS33 KALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGT-----CINPSNWCDGVS 90 100 110 120 130 50 60 70 80 90 100 pF1KE4 LLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHS . .. :.. . . :.:... . .:. .:.. : . .:..::. . : CCDS33 HCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSS 140 150 160 170 180 190 110 120 130 140 150 pF1KE4 ELDVRTAGANGTSGFFCVDE--GRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRR--KL . : .: ...:. .. : . ..: . . : .. : :: . CCDS33 QGIVDDSG---STSFMKLNTSAGNVDIYKKLYHSDA---CSSKAVVSLRCIACGVNLNSS 200 210 220 230 240 250 160 170 180 190 200 210 pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVF .:::::... : :::::::. ...:.::::... .:..::::: . .: .: CCDS33 RQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAF 260 270 280 290 300 310 220 230 240 250 260 270 pF1KE4 AGAVAQASP-HGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVC :: . :. .: :. :. : .: .:. ..:::::..:..:: ... ..::: CCDS33 AGILRQSFMFYGAGYQVEKVISHPNY------DSKTKNNDIALMKLQKPLTFNDLVKPVC 320 330 340 350 360 280 290 300 310 320 330 pF1KE4 LPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMF :: :. : ..: ..::: :. :. . ::. :.: .: .. ::. : : : : :. CCDS33 LPNPGMMLQPEQLCWISGWGATEEKGKTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMI 370 380 390 400 410 420 340 350 360 370 380 390 pF1KE4 CAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFR :::. .:..:.::::::::.: :.. : : : .:::.::: : .:::: .: : CCDS33 CAGFLQGNVDSCQGDSGGPLVT----SKNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFT 430 440 450 460 470 480 400 410 pF1KE4 EWIFQAIKTHSEASGMVTQL .::.. .. CCDS33 DWIYRQMRADG 490 >>CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 (529 aa) initn: 697 init1: 353 opt: 747 Z-score: 888.7 bits: 173.8 E(32554): 3.5e-43 Smith-Waterman score: 748; 31.7% identity (60.6% similar) in 398 aa overlap (13-405:150-526) 10 20 30 40 pF1KE4 MAQKEGGRTVPCCSRPKVAALTAGTLLLLTAIGAASWAIVAV :: . ..:: :. ..: . CCDS54 KALCITLTLGTFLVGAALAAGLLWKFMGSKCSNSGIECDSSGT-----CINPSNWCDGVS 120 130 140 150 160 170 50 60 70 80 90 100 pF1KE4 LLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHS . .. :.. . . :.:... . .:. .:.. : . .:..::. . : CCDS54 HCPGGEDENRCVRLYGPNFILQVYSSQRKSWHPVCQDDWNENYGRAACRDMGYKNNFYSS 180 190 200 210 220 230 110 120 130 140 150 pF1KE4 ELDVRTAGANGTSGFFCVDE--GRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRR--KL . : .: ...:. .. : . ..: . . : .. : :: . CCDS54 QGIVDDSG---STSFMKLNTSAGNVDIYKKLYHSDA---CSSKAVVSLRCIACGVNLNSS 240 250 260 270 280 160 170 180 190 200 210 pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVF .:::::... : :::::::. ...:.::::... .:..::::: . .: .: CCDS54 RQSRIVGGESALPGAWPWQVSLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAF 290 300 310 320 330 340 220 230 240 250 260 270 pF1KE4 AGAVAQASP-HGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPVC :: . :. .: :. :. : .: .:. ..:::::..:..:: ... ..::: CCDS54 AGILRQSFMFYGAGYQVEKVISHPNY------DSKTKNNDIALMKLQKPLTFNDLVKPVC 350 360 370 380 390 400 280 290 300 310 320 330 pF1KE4 LPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQEARVPIISNDVCNGADFYGNQIKPKMF :: :. : ..: ..::: :. :. . ::. :.: .: .. ::. : : : : :. CCDS54 LPNPGMMLQPEQLCWISGWGATEEKGKTSEVLNAAKVLLIETQRCNSRYVYDNLITPAMI 410 420 430 440 450 460 340 350 360 370 380 390 pF1KE4 CAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGVYTKVSDFR :::. .:..:.::::::::.: :.. : : : .:::.::: : .:::: .: : CCDS54 CAGFLQGNVDSCQGDSGGPLVT----SKNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFT 470 480 490 500 510 400 410 pF1KE4 EWIFQAIKTHSEASGMVTQL .::.. .. CCDS54 DWIYRQMRADG 520 >>CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019 aa) initn: 706 init1: 249 opt: 743 Z-score: 879.5 bits: 173.0 E(32554): 1.1e-42 Smith-Waterman score: 743; 36.1% identity (62.8% similar) in 341 aa overlap (68-400:694-1014) 40 50 60 70 80 90 pF1KE4 AIVAVLLRSDQEPLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLR . .. :. :. ...... :. .: : CCDS13 GHLHCEDGSDEADCVRFFNGTTNNNGLVRFRIQSIWHTACAENWTTQISNDVCQLLG-LG 670 680 690 700 710 720 100 110 120 130 140 150 pF1KE4 ALTHSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVISVCDCPRGRFLAAIC--QDCGR . . :. : : : : : . : . .: .: . .. : ..::. CCDS13 SGNSSKPIFPTDG-----GPF-VKLNTAPDGHLIL--TPSQQCLQDSLIRLQCNHKSCGK 730 740 750 760 770 160 170 180 190 200 210 pF1KE4 RKLPVD---RIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVL . : .:::: ... : ::: :.: : : :::.::.:.::...:::: :: CCDS13 KLAAQDITPKIVGGSNAKEGAWPWVVGLYYGGRLLCGASLVSSDWLVSAAHCVYGRNLEP 780 790 800 810 820 830 220 230 240 250 260 pF1KE4 SRWRVFAGAVAQA---SPHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPL :.: .. : .. ::. . .. .: . : : ....::::..:: . CCDS13 SKWTAILGLHMKSNLTSPQTVPRLIDEIVINPHY------NRRRKDNDIAMMHLEFKVNY 840 850 860 870 880 270 280 290 300 310 320 pF1KE4 TEYIQPVCLPAAGQALVDGKICTVTGWGNTQYYGQQAGVLQEARVPIISNDVCNGADFYG :.::::.::: .:.. :. :...:::.. : : :..:::: ::..::. :. .. CCDS13 TDYIQPICLPEENQVFPPGRNCSIAGWGTVVYQGTTANILQEADVPLLSNERCQ-QQMPE 890 900 910 920 930 940 330 340 350 360 370 380 pF1KE4 NQIKPKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKPGV .: .:.:::: :::::.::::::::..:... :: : :..:.: ::: ..::: CCDS13 YNITENMICAGYEEGGIDSCQGDSGGPLMCQEN----NRWFLAGVTSFGYKCALPNRPGV 950 960 970 980 990 1000 390 400 410 pF1KE4 YTKVSDFREWIFQAIKTHSEASGMVTQL :..:: : ::: CCDS13 YARVSRFTEWIQSFLH 1010 >>CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 (280 aa) initn: 601 init1: 256 opt: 730 Z-score: 872.7 bits: 169.9 E(32554): 2.8e-42 Smith-Waterman score: 730; 42.8% identity (65.0% similar) in 283 aa overlap (129-400:8-274) 100 110 120 130 140 150 pF1KE4 LTHSELDVRTAGANGTSGFFCVDEGRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKL : :: .. .:: :: ::. .. CCDS42 MRGVSCLQVLLLLVLGAAGTQGRKSAA----CGQPRM 10 20 30 160 170 180 190 200 210 pF1KE4 PVDRIVGGRDTSLGRWPWQVSLRYDGAHLCGGSLLSGDWVLTAAHCFPERNRVLSRWRVF .::::::: :.::::.:... :::.:::::.. .::::::::::.: . ...:: CCDS42 S-SRIVGGRDGRDGEWPWQASIQHRGAHVCGGSLIAPQWVLTAAHCFPRRA-LPAEYRVR 40 50 60 70 80 90 220 230 240 250 260 270 pF1KE4 AGAV--AQASPHGLQLGVQAVVYHGGYLPFRDPNSEENSNDIALVHLSSPLPLTEYIQPV ::. ...::. :.. :. :. :: : . . .:.::..: :.::. .::: CCDS42 LGALRLGSTSPRTLSVPVRRVL-----LP-PDYSEDGARGDLALLQLRRPVPLSARVQPV 100 110 120 130 140 280 290 300 310 320 330 pF1KE4 CLPAAGQALVDGKICTVTGWGNTQ--YYGQQAGVLQEARVPIISNDVCNGADFYGNQIK- :::. : : : :::::. . . :: .:::.... .:.: : .. CCDS42 CLPVPGARPPPGTPCRVTGWGSLRPGVPLPEWRPLQGVRVPLLDSRTCDGLYHVGADVPQ 150 160 170 180 190 200 340 350 360 370 380 pF1KE4 ------PKMFCAGYPEGGIDACQGDSGGPFVCEDSISRTPRWRLCGIVSWGTGCALAQKP : .:::::.: ::::::::::..: .: : : : :.:::: :::: ..: CCDS42 AERIVLPGSLCAGYPQGHKDACQGDSGGPLTCLQSGS----WVLVGVVSWGKGCALPNRP 210 220 230 240 250 260 390 400 410 pF1KE4 GVYTKVSDFREWIFQAIKTHSEASGMVTQL ::::.:. . :: CCDS42 GVYTSVATYSPWIQARVSF 270 280 417 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:21:45 2016 done: Sun Nov 6 01:21:46 2016 Total Scan time: 3.070 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]