FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6392, 418 aa 1>>>pF1KE6392 418 - 418 aa - 418 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3878+/-0.00107; mu= 16.6261+/- 0.064 mean_var=69.7931+/-14.363, 0's: 0 Z-trim(103.3): 170 B-trim: 3 in 1/50 Lambda= 0.153521 statistics sampled from 7184 (7357) to 7184 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.591), E-opt: 0.2 (0.226), width: 16 Scan time: 1.900 The best scores are: opt bits E(32554) CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 418) 2800 629.7 1.6e-180 CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 421) 2784 626.1 1.9e-179 CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 1283 293.7 2.3e-79 CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 1195 274.2 1.7e-73 CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 1113 256.0 4.8e-68 CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 970 224.4 1.7e-58 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 693 163.0 5.2e-40 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 681 160.4 3.3e-39 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 660 155.9 1.3e-37 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 660 155.9 1.3e-37 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 640 151.3 1.9e-36 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 640 151.3 2e-36 CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 635 150.4 7.5e-36 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 627 148.4 1.5e-35 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 627 148.5 1.6e-35 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 627 148.5 1.6e-35 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 609 144.3 1.6e-34 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 612 145.2 1.7e-34 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 600 142.6 1.7e-33 CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 591 140.3 2.3e-33 CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 591 140.4 3e-33 CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 591 140.4 3.2e-33 CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 591 140.4 3.2e-33 CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 591 140.4 3.2e-33 CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 589 140.0 4.1e-33 CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 589 140.0 4.4e-33 CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 589 140.0 4.5e-33 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 589 140.2 8.2e-33 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 589 140.2 8.9e-33 CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 583 138.7 1.4e-32 CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 579 137.9 3.5e-32 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 561 133.9 4.4e-31 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 541 129.5 1e-29 CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 534 127.7 1.6e-29 CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 528 126.3 3.4e-29 CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 521 125.1 2.5e-28 CCDS82945.1 CFI gene_id:3426|Hs108|chr4 ( 576) 504 121.2 2.5e-27 CCDS34049.1 CFI gene_id:3426|Hs108|chr4 ( 583) 504 121.2 2.6e-27 CCDS82946.1 CFI gene_id:3426|Hs108|chr4 ( 591) 504 121.2 2.6e-27 CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 499 120.0 4.2e-27 CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 495 119.0 5.4e-27 CCDS5976.1 PRSS55 gene_id:203074|Hs108|chr8 ( 352) 489 117.8 1.7e-26 CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 484 116.6 2.9e-26 CCDS44881.1 TMPRSS12 gene_id:283471|Hs108|chr12 ( 348) 479 115.6 7.8e-26 CCDS9530.1 F10 gene_id:2159|Hs108|chr13 ( 488) 473 114.3 2.6e-25 CCDS83495.1 F9 gene_id:2158|Hs108|chrX ( 423) 471 113.8 3.1e-25 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 468 113.0 3.3e-25 CCDS14666.1 F9 gene_id:2158|Hs108|chrX ( 461) 471 113.9 3.3e-25 CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 446 108.4 1.8e-23 CCDS14101.1 ACR gene_id:49|Hs108|chr22 ( 421) 443 107.6 2.3e-23 >>CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 (418 aa) initn: 2800 init1: 2800 opt: 2800 Z-score: 3354.4 bits: 629.7 E(32554): 1.6e-180 Smith-Waterman score: 2800; 99.8% identity (100.0% similar) in 418 aa overlap (1-418:1-418) 10 20 30 40 50 60 pF1KE6 MMYRTVGFGTRSRNLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEYYHGSFKILDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MMYRTVGFGTRSRNLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEYYHGSFKILDP 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 QINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDVIMV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDVIMV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 FQFPSTEQRAVREKKIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQASCGKRVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 FQFPSTEQRAVREKKIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQASCGKRVV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 PLNVNRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKNPHQWTV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PLNVNRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKNPHQWTV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 SFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRRICLPEASASF :::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::: CCDS47 SFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRQICLPEASASF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 QPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCAGYMEGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCAGYMEGI 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 YDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIASKTGI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 YDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIASKTGI 370 380 390 400 410 >>CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 (421 aa) initn: 2257 init1: 2257 opt: 2784 Z-score: 3335.2 bits: 626.1 E(32554): 1.9e-179 Smith-Waterman score: 2784; 99.0% identity (99.3% similar) in 421 aa overlap (1-418:1-421) 10 20 30 40 50 60 pF1KE6 MMYRTVGFGTRSRNLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEYYHGSFKILDP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 MMYRTVGFGTRSRNLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEYYHGSFKILDP 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 QINNNFGQSNTYQLKDLRETTENLV---DEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDV ::::::::::::::::::::::::: :::::::::::::::::::::::::::::::: CCDS35 QINNNFGQSNTYQLKDLRETTENLVSQVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 IMVFQFPSTEQRAVREKKIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQASCGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 IMVFQFPSTEQRAVREKKIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQASCGK 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 RVVPLNVNRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKNPHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 RVVPLNVNRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKNPHQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE6 WTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRRICLPEAS ::::::::::::::::::::::::::::::::::::::::::::::::::::.::::::: CCDS35 WTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRQICLPEAS 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE6 ASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCAGYM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 ASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCAGYM 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE6 EGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIASKTG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS35 EGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIASKTG 370 380 390 400 410 420 pF1KE6 I : CCDS35 I >>CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 (423 aa) initn: 1099 init1: 980 opt: 1283 Z-score: 1538.4 bits: 293.7 E(32554): 2.3e-79 Smith-Waterman score: 1283; 43.0% identity (75.4% similar) in 423 aa overlap (1-418:1-423) 10 20 30 40 50 pF1KE6 MMYRTVGFGTRSR-NLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEY-YHGSFKIL :::: .:.: .::.:...: .:: :.:: ::: ::.. ..::: : :...... CCDS33 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 DPQINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDVI .. .::. . .. .. . :..: . : : .....:.::.... .. :: . .. CCDS33 TDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHML 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 MVFQFPSTEQRAVREKKIQSILNQKIRNLRALP-INASSVQVNAMSSSTGELTVQASCG- .. .: :::. . .: .: .:..:... . : .. ::... .... . .. :: CCDS33 LICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGT 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 KRVVPLNVN-RIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKNP .: :. . ::..:. . .. ::::::::.:. :.::::::. ::::.::::: :::: CCDS33 RRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNP 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE6 HQWTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRRICLPE .::.:::. :.: :::..::.:.::::. ...:::.....:: : ... ..:.:::. CCDS33 ARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPD 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE6 ASASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCAG :: :::. .. .:::::: : ::: ::.:.: .:. .:..::.:.. : : :.::: CCDS33 ASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAG 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE6 YMEGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIASK .:: :::.::::::::. : .: ::: :::::::.:.. .::::::.:: :.::.:: CCDS33 SLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSK 370 380 390 400 410 420 pF1KE6 TGI ::: CCDS33 TGI >>CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 (418 aa) initn: 1195 init1: 869 opt: 1195 Z-score: 1433.2 bits: 274.2 E(32554): 1.7e-73 Smith-Waterman score: 1195; 40.3% identity (75.2% similar) in 419 aa overlap (2-418:1-418) 10 20 30 40 50 60 pF1KE6 MMYRTVGFGTRSRNLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEYYHGSFKILDP ::: . . :: :.:... ..: .....::::.:::.::.::::. .:..::..:. CCDS35 MYRPARVTSTSRFLNPYVVCFIVVAGVVILAVTIALLVYFLAFDQKSYFYRSSFQLLNV 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 QINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDVIMV . :..... : . . : :.:. . : .: ....:. .:..: . .::..::.: CCDS35 EYNSQLNSPATQEYRTLSGRIESLITKTFKESNLRNQFIRAHVAKLRQDGSGVRADVVMK 60 70 80 90 100 110 130 140 150 160 170 pF1KE6 FQFPSTEQRAVREKKIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQASCGK--R ::: ... : ...:.:.: : . : : :: :. .......... . :: CCDS35 FQFTRNNNGASMKSRIESVLRQMLNNSGNLEINPST-EITSLTDQAAANWLINECGAGPD 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 VVPLNVNRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKNPHQW .. :. .:: .:. : ...::::.::. .: :.::..::.: :..::::::.. .::..: CCDS35 LITLSEQRILGGTEAEEGSWPWQVSLRLNNAHHCGGSLINNMWILTAAHCFRSNSNPRDW 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 TVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRRICLPEASA .. : . . : .. :: ..::..:.::..: :::.:.. . :::. ::. .::: :. CCDS35 IATSGISTTFPKLRMRVRNILIHNNYKSATHENDIALVRLENSVTFTKDIHSVCLPAATQ 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 SFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCAGYME .. :. :...::.:: :.:.. .::...:.:::.:::. :. :.. : ::.::: . CCDS35 NIPPGSTAYVTGWGAQEYAGHTVPELRQGQVRIISNDVCNAPHSYNGAILSGMLCAGVPQ 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 GIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIASKTGI : :::.:::::::: .: . :...:::::::.:: :::::::.:: : .:: ..::: CCDS35 GGVDACQGDSGGPLVQEDSRRLWFIVGIVSWGDQCGLPDKPGVYTRVTAYLDWIRQQTGI 360 370 380 390 400 410 >>CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 (416 aa) initn: 916 init1: 833 opt: 1113 Z-score: 1335.1 bits: 256.0 E(32554): 4.8e-68 Smith-Waterman score: 1113; 40.4% identity (72.6% similar) in 423 aa overlap (2-418:1-416) 10 20 30 40 50 pF1KE6 MMYRTVGFGTRSRNLKPWMIAVLIVLSLT-VVAVTIGLLVHFLVFDQKKEYYHGSFKILD ::: : :. : ...: :... ...::::::::::. . : ::.:.:.: CCDS35 MYR---HGISSQRSWPLWTTIFIFLGVAAILGVTIGLLVHFLAVE-KTYYYQGDFHISG 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 PQINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDVIM :.: .. . .: . :. . . : .:. :.:.:..:..: :. .: .:.. . CCDS35 VTYNDNCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQLQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 VFQFPSTEQRAVREK---KIQSILNQKIRNLRALPINASSVQVNAMSSSTGELTVQASCG :.:: .: ..: : :....:.... . :.: .:... .:....:. .. :: CCDS35 KFKFPPAEGVSMRTKIKAKLHQMLKNNMASWNAVP---ASIKLMEISKAASEMLTNNCCG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 KRVVPLNV--NRIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKN ..:. . :.:..: . ..:::::::.:. . : :::.:::. ::..::::: : .: CCDS35 RQVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAKKNN 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 PHQWTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRRICLP ..:::.:: .: : : :.:. .:.::.: : . . :::.::.. .:.:.. ::.:::: CCDS35 SKDWTVNFGIVVNKPYMTRKVQNIIFHENYSSPGLHDDIALVQLAEEVSFTEYIRKICLP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 EASASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCA ::. ... : .: .::.:.::..: :.: .:::.. .:. .:.. . :.:: CCDS35 EAKMKLSENDNVVVTGWGTLYMNGSFPVILQEDFLKIIDNKICNASYAYSGFVTDTMLCA 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 GYMEGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIAS :.: : :::..::::::. : .. :.:.:::::::.::.:.::::::.:: :::::.: CCDS35 GFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNWITS 360 370 380 390 400 410 pF1KE6 KTGI :::. CCDS35 KTGL >>CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 (438 aa) initn: 1223 init1: 689 opt: 970 Z-score: 1163.6 bits: 224.4 E(32554): 1.7e-58 Smith-Waterman score: 1240; 43.5% identity (73.3% similar) in 439 aa overlap (1-418:1-438) 10 20 30 40 50 pF1KE6 MMYRTVGFG----TRS---RNLKPWMIAVLIVLSLTVVAV---TIGLLVHFLVFDQKKEY ::: : :. .:. :. . : . : ...:..::. .::...::.: :.:. : CCDS35 MMYAPVEFSEAEFSRAEYQRKQQFWDSVRLALFTLAIVAIIGIAIGIVTHFVVEDDKSFY 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 YHGSFKILDPQINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEE : .:::. . . ..:.: .. .. . . : ....:: :. .::..:..:.:.: CCDS35 YLASFKVTNIKYKENYGIRSSREFIERSHQIERMMSRIFRHSSVGGRFIKSHVIKLSPDE 70 80 90 100 110 120 120 130 140 150 160 pF1KE6 DGVKVDVIMVFQFPSTEQRAVREKKIQSILNQKIRNLR-ALPINASSVQVNAMSSSTGEL .:: . ....:..:::.. .:::.. : :.... . .: :: : ... ..:. . CCDS35 QGVDILIVLIFRYPSTDSAEQIKKKIEKALYQSLKTKQLSLTINKPSFRLTPIDSKKMRN 130 140 150 160 170 180 170 180 190 200 210 pF1KE6 TVQASCGKRV----VPL----NVNRIASGV-IAPKAAWPWQASLQY-DNIHQCGATLISN ... :: :. .:: ...::..: : .. :::::::: . :::::.:::: CCDS35 LLNSRCGIRMTSSNMPLPASSSTQRIVQGRETAMEGEWPWQASLQLIGSGHQCGASLISN 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE6 TWLVTAAHCFQKYKNPHQWTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVS :::.:::::: : :.: :: ..::. :.:: .:::::..:.::.:. . : :::.::.: CCDS35 TWLLTAAHCFWKNKDPTQWIATFGATITPPAVKRNVRKIILHENYHRETNENDIALVQLS 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE6 SRVTFSDDIRRICLPEASASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQ . : ::. ..:.:::..: .. :. .: .::::.. : :: ::.:::. :: :::.. CCDS35 TGVEFSNIVQRVCLPDSSIKLPPKTSVFVTGFGSIVDDGPIQNTLRQARVETISTDVCNR 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE6 PQVYGNDIKPGMFCAGYMEGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKP .:: . : :::.:::.::: :::.:::::::: : .: ::..::::::..:. :: CCDS35 KDVYDGLITPGMLCAGFMEGKIDACKGDSGGPLV-YDNHDIWYIVGIVSWGQSCALPKKP 370 380 390 400 410 400 410 pF1KE6 GVYTQVTYYRNWIASKTGI ::::.:: ::.:::::::. CCDS35 GVYTRVTKYRDWIASKTGM 420 430 >>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa) initn: 670 init1: 303 opt: 693 Z-score: 831.8 bits: 163.0 E(32554): 5.2e-40 Smith-Waterman score: 693; 32.5% identity (62.0% similar) in 416 aa overlap (15-412:46-443) 10 20 30 40 pF1KE6 MMYRTVGFGTRSRNLKPWMIAVLIVLSLTVVAVTIGLLVHFLVF :: . : :. ...: ..:..::: .:: CCDS58 RSLFGLDDLKISPVAPDADAVAAQILSLLPLKFFPIIVIGIIAL-ILALAIGLGIHF--- 20 30 40 50 60 70 50 60 70 80 90 pF1KE6 DQKKEYY-HGSFKILDPQINNNFGQSNTYQLKD----LRETTENLVDEIFIDSAWK---- : . .: ..::: .. : : :. . .: .: .: : ..: ..:: CCDS58 DCSGKYRCRSSFKCIE-LIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVFTAASWKTMCS 80 90 100 110 120 130 100 110 120 130 140 pF1KE6 ---KNYIKNQVVRLTPEEDGVKVDVIMVFQFPSTEQRAVREK--KIQSIL-NQKIRNLRA :.. : . . :. : . : :. . ::. .:. .: ..:. :. CCDS58 DDWKGHYANVACAQLGFPSYVSSDNLRV----SSLEGQFREEFVSIDHLLPDDKVTALH- 140 150 160 170 180 150 160 170 180 190 200 pF1KE6 LPINASSVQVNAMSSSTGELTVQAS-CGKRVVPLNVNRIASGVIAPKAAWPWQASLQYDN :: : .: .:.: . ::.: .::..: .. . ::::::::... CCDS58 -----HSVYVREGCASGHVVTLQCTACGHRR--GYSSRIVGGNMSLLSQWPWQASLQFQG 190 200 210 220 230 210 220 230 240 250 260 pF1KE6 IHQCGATLISNTWLVTAAHCFQKYKNPHQWTVSFG--TKINPPLMKRNVRRFIIHEKYRS : ::...:. :..::::: :..::.. : . .. : .. :.... : ::. CCDS58 YHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAPSHLVEKIVYHSKYKP 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE6 AAREYDIAVVQVSSRVTFSDDIRRICLPEASASFQPNLTVHITGFGALYYGGESQNDLRE :::...... .::.. :. .:::.. .: . . .:.:: ::... : . CCDS58 KRLGNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGGDASPVLNH 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE6 ARVKIISDDVCKQPQVYGNDIKPGMFCAGYMEGIYDACRGDSGGPLVTRDLKDTWYLIGI : : .::. .:.. .:::. :.:.:.::::. : :.:.:::::::: .. . : :.: CCDS58 AAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQE-RRLWKLVGA 360 370 380 390 400 410 390 400 410 pF1KE6 VSWGDNCGQKDKPGVYTQVTYYRNWIASKTGI .:.: .:.. .::::::.:: . .:: CCDS58 TSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT 420 430 440 450 >>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa) initn: 441 init1: 211 opt: 681 Z-score: 817.4 bits: 160.4 E(32554): 3.3e-39 Smith-Waterman score: 681; 32.4% identity (61.9% similar) in 417 aa overlap (15-412:46-444) 10 20 30 40 pF1KE6 MMYRTVGFGTRSRNLKPWMIAVLIVLSLTVVAVTIGLLVHFLVF :: . : :. ...: ..:..::: .:: CCDS13 RSLFGLDDLKISPVAPDADAVAAQILSLLPLKFFPIIVIGIIAL-ILALAIGLGIHF--- 20 30 40 50 60 70 50 60 70 80 90 pF1KE6 DQKKEYY-HGSFKILDPQINNNFGQSNTYQLKD----LRETTENLVDEIFIDSAWK---- : . .: ..::: .. : : :. . .: .: .: : ..: ..:: CCDS13 DCSGKYRCRSSFKCIE-LIARCDGVSDCKDGEDEYRCVRVGGQNAVLQVFTAASWKTMCS 80 90 100 110 120 130 100 110 120 130 140 pF1KE6 ---KNYIKNQVVRLTPEEDGVKVDVIMVFQFPSTEQRAVREK--KIQSIL-NQKIRNLRA :.. : . . :. : . : :. . ::. .:. .: ..:. :. CCDS13 DDWKGHYANVACAQLGFPSYVSSDNLRV----SSLEGQFREEFVSIDHLLPDDKVTALH- 140 150 160 170 180 150 160 170 180 190 200 pF1KE6 LPINASSVQVNAMSSSTGELTVQAS-CGKRVVPLNVNRIASGVIAPKAAWPWQASLQYDN :: : .: .:.: . ::.: .::..: .. . ::::::::... CCDS13 -----HSVYVREGCASGHVVTLQCTACGHRR--GYSSRIVGGNMSLLSQWPWQASLQFQG 190 200 210 220 230 210 220 230 240 250 260 pF1KE6 IHQCGATLISNTWLVTAAHCFQKYKNPHQWTVSFG--TKINPPLMKRNVRRFIIHEKYRS : ::...:. :..::::: :..::.. : . .. : .. :.... : ::. CCDS13 YHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVGLVSLLDNPAPSHLVEKIVYHSKYKP 240 250 260 270 280 290 270 280 290 300 310 320 pF1KE6 AAREYDIAVVQVSSRVTFSDDIRRICLPEASASFQPNLTVHITGFGALYYG-GESQNDLR :::...... .::.. :. .:::.. .: . . .:.:: : :... : CCDS13 KRLGNDIALMKLAGPLTFNEMIQPVCLPNSEENFPDGKVCWTSGWGATEDGAGDASPVLN 300 310 320 330 340 350 330 340 350 360 370 380 pF1KE6 EARVKIISDDVCKQPQVYGNDIKPGMFCAGYMEGIYDACRGDSGGPLVTRDLKDTWYLIG .: : .::. .:.. .:::. :.:.:.::::. : :.:.:::::::: .. . : :.: CCDS13 HAAVPLISNKICNHRDVYGGIISPSMLCAGYLTGGVDSCQGDSGGPLVCQE-RRLWKLVG 360 370 380 390 400 410 390 400 410 pF1KE6 IVSWGDNCGQKDKPGVYTQVTYYRNWIASKTGI .:.: .:.. .::::::.:: . .:: CCDS13 ATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMERDLKT 420 430 440 450 >>CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 (802 aa) initn: 634 init1: 279 opt: 660 Z-score: 788.6 bits: 155.9 E(32554): 1.3e-37 Smith-Waterman score: 660; 42.1% identity (70.6% similar) in 235 aa overlap (185-412:566-797) 160 170 180 190 200 210 pF1KE6 SSVQVNAMSSSTGELTVQASCGKRVVPLNVNRIASGVIAPKAAWPWQASLQYDNIHQCGA .::..:... .. :::::::: . : ::. CCDS74 KKPNPQCDGRPDCRDGSDEEHCDCGLQGPSSRIVGGAVSSEGEWPWQASLQVRGRHICGG 540 550 560 570 580 590 220 230 240 250 260 pF1KE6 TLISNTWLVTAAHCFQK--YKNPHQWTVSFGTKI--N---PPLMKRNVRRFIIHEKYRSA .::.. :..:::::::. . . ::: .: :. : : .. .: :...: .. CCDS74 ALIADRWVITAAHCFQEDSMASTVLWTVFLG-KVWQNSRWPGEVSFKVSRLLLHPYHEED 600 610 620 630 640 650 270 280 290 300 310 320 pF1KE6 AREYDIAVVQVSSRVTFSDDIRRICLPEASASFQPNLTVHITGFGALYYGGESQNDLREA ...::.:..:.. :. : .: .::: : :.:.: :::.::: :: .: :... CCDS74 SHDYDVALLQLDHPVVRSAAVRPVCLPARSHFFEPGLHCWITGWGALREGGPISNALQKV 660 670 680 690 700 710 330 340 350 360 370 380 pF1KE6 RVKIISDDVCKQPQVYGNDIKPGMFCAGYMEGIYDACRGDSGGPLVTRDLKDTWYLIGIV :..: .:.:. .:: .. : :.:::: .: :::.:::::::: . :. :.: :.: CCDS74 DVQLIPQDLCS--EVYRYQVTPRMLCAGYRKGKKDACQGDSGGPLVCKALSGRWFLAGLV 720 730 740 750 760 770 390 400 410 pF1KE6 SWGDNCGQKDKPGVYTQVTYYRNWIASKTGI ::: .::. . ::::..: .:: CCDS74 SWGLGCGRPNYFGVYTRITGVISWIQQVVT 780 790 800 >>CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 (811 aa) initn: 634 init1: 279 opt: 660 Z-score: 788.5 bits: 155.9 E(32554): 1.3e-37 Smith-Waterman score: 660; 42.1% identity (70.6% similar) in 235 aa overlap (185-412:575-806) 160 170 180 190 200 210 pF1KE6 SSVQVNAMSSSTGELTVQASCGKRVVPLNVNRIASGVIAPKAAWPWQASLQYDNIHQCGA .::..:... .. :::::::: . : ::. CCDS13 KKPNPQCDGRPDCRDGSDEEHCDCGLQGPSSRIVGGAVSSEGEWPWQASLQVRGRHICGG 550 560 570 580 590 600 220 230 240 250 260 pF1KE6 TLISNTWLVTAAHCFQK--YKNPHQWTVSFGTKI--N---PPLMKRNVRRFIIHEKYRSA .::.. :..:::::::. . . ::: .: :. : : .. .: :...: .. CCDS13 ALIADRWVITAAHCFQEDSMASTVLWTVFLG-KVWQNSRWPGEVSFKVSRLLLHPYHEED 610 620 630 640 650 660 270 280 290 300 310 320 pF1KE6 AREYDIAVVQVSSRVTFSDDIRRICLPEASASFQPNLTVHITGFGALYYGGESQNDLREA ...::.:..:.. :. : .: .::: : :.:.: :::.::: :: .: :... CCDS13 SHDYDVALLQLDHPVVRSAAVRPVCLPARSHFFEPGLHCWITGWGALREGGPISNALQKV 670 680 690 700 710 720 330 340 350 360 370 380 pF1KE6 RVKIISDDVCKQPQVYGNDIKPGMFCAGYMEGIYDACRGDSGGPLVTRDLKDTWYLIGIV :..: .:.:. .:: .. : :.:::: .: :::.:::::::: . :. :.: :.: CCDS13 DVQLIPQDLCS--EVYRYQVTPRMLCAGYRKGKKDACQGDSGGPLVCKALSGRWFLAGLV 730 740 750 760 770 780 390 400 410 pF1KE6 SWGDNCGQKDKPGVYTQVTYYRNWIASKTGI ::: .::. . ::::..: .:: CCDS13 SWGLGCGRPNYFGVYTRITGVISWIQQVVT 790 800 810 418 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:51:52 2016 done: Tue Nov 8 12:51:52 2016 Total Scan time: 1.900 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]