FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6371, 423 aa 1>>>pF1KE6371 423 - 423 aa - 423 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7588+/-0.000936; mu= 14.5914+/- 0.055 mean_var=72.2711+/-15.029, 0's: 0 Z-trim(105.4): 171 B-trim: 0 in 0/50 Lambda= 0.150866 statistics sampled from 8248 (8429) to 8248 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.64), E-opt: 0.2 (0.259), width: 16 Scan time: 2.130 The best scores are: opt bits E(32554) CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 2891 638.7 3.1e-183 CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 418) 1277 287.4 1.7e-77 CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 421) 1266 285.0 9.2e-77 CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 1208 272.4 6e-73 CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 1153 260.4 2.3e-69 CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 1087 246.1 4.9e-65 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 749 172.6 1.2e-42 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 749 172.6 1.2e-42 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 693 160.3 3.4e-39 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 692 160.1 4.6e-39 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 692 160.1 4.8e-39 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 692 160.1 4.8e-39 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 681 157.7 2.1e-38 CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 679 157.3 2.6e-38 CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 679 157.3 2.8e-38 CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 679 157.3 2.8e-38 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 677 156.9 4.1e-38 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 677 156.9 4.4e-38 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 674 156.3 8.9e-38 CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 661 153.5 7.4e-37 CCDS13571.1 TMPRSS15 gene_id:5651|Hs108|chr21 (1019) 650 151.1 4.5e-36 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 648 150.7 6.3e-36 CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 633 147.2 2e-35 CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 633 147.2 2.6e-35 CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 633 147.3 2.8e-35 CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 633 147.3 2.8e-35 CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 633 147.3 2.8e-35 CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 618 144.1 3.6e-34 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 607 141.5 1.1e-33 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 602 140.6 4.2e-33 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 594 138.8 1.4e-32 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 579 135.6 1.9e-31 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 579 135.7 2.1e-31 CCDS5279.1 PLG gene_id:5340|Hs108|chr6 ( 810) 566 132.8 1.2e-30 CCDS83495.1 F9 gene_id:2158|Hs108|chrX ( 423) 530 124.8 1.5e-28 CCDS14666.1 F9 gene_id:2158|Hs108|chrX ( 461) 530 124.8 1.7e-28 CCDS82945.1 CFI gene_id:3426|Hs108|chr4 ( 576) 524 123.6 5e-28 CCDS34049.1 CFI gene_id:3426|Hs108|chr4 ( 583) 524 123.6 5e-28 CCDS82946.1 CFI gene_id:3426|Hs108|chr4 ( 591) 524 123.6 5.1e-28 CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 515 121.5 1e-27 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 514 121.3 1.1e-27 CCDS73390.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 344) 509 120.2 3.1e-27 CCDS73393.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 388) 509 120.2 3.4e-27 CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 507 119.8 3.9e-27 CCDS5976.1 PRSS55 gene_id:203074|Hs108|chr8 ( 352) 496 117.4 2.2e-26 CCDS9530.1 F10 gene_id:2159|Hs108|chr13 ( 488) 489 115.9 8.5e-26 CCDS32490.1 CTRB1 gene_id:1504|Hs108|chr16 ( 263) 483 114.5 1.2e-25 CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 480 113.9 2e-25 CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 475 112.9 6.1e-25 CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 468 111.3 1.2e-24 >>CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 (423 aa) initn: 2891 init1: 2891 opt: 2891 Z-score: 3403.1 bits: 638.7 E(32554): 3.1e-183 Smith-Waterman score: 2891; 100.0% identity (100.0% similar) in 423 aa overlap (1-423:1-423) 10 20 30 40 50 60 pF1KE6 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 TDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHML 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 LICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 LICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 RRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 RRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 ARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 ASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 ASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAG 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 SLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSK 370 380 390 400 410 420 pF1KE6 TGI ::: CCDS33 TGI >>CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 (418 aa) initn: 1093 init1: 974 opt: 1277 Z-score: 1504.6 bits: 287.4 E(32554): 1.7e-77 Smith-Waterman score: 1277; 42.8% identity (75.4% similar) in 423 aa overlap (1-423:1-418) 10 20 30 40 50 60 pF1KE6 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT :::: .:.: .::.:...: .:: :.:: ::: ::.. ..::: : :...... CCDS47 MMYRTVGFGTRSR-NLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEY-YHGSFKIL 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 TDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHML .. .::. . .. .. . :..: . : : .....:.::.... .. :: . .. CCDS47 DPQINNNFGQSNTYQLKDLRETTENLVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKVDVI 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 LICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGT .. .: :::. . .: .: .:..:... . : .. ::... .... . .. :: CCDS47 MVFQFPSTEQRAVREKKIQSILNQKIRNLRALP-INASSVQVNAMSSSTGELTVQASCG- 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 RRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNP .: :. . ::..:. . .. ::::::::.:. :.::::::. ::::.::::: :::: CCDS47 KRVVPLNVN-RIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKYKNP 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE6 ARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPD .::.:::. :.: :::..::.:.::::. ...:::.....:: : ... ....:::. CCDS47 HQWTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRQICLPE 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE6 ASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAG :: :::. .. .:::::: : ::: ::.:.: .:. .:..::.:.. : : :.::: CCDS47 ASASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMFCAG 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE6 SLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSK .:: :::.::::::::. : .: ::: :::::::.:.. .::::::.:: :.::.:: CCDS47 YMEGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWIASK 360 370 380 390 400 410 pF1KE6 TGI ::: CCDS47 TGI >>CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 (421 aa) initn: 1187 init1: 974 opt: 1266 Z-score: 1491.6 bits: 285.0 E(32554): 9.2e-77 Smith-Waterman score: 1266; 43.0% identity (75.1% similar) in 426 aa overlap (1-423:1-421) 10 20 30 40 50 60 pF1KE6 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT :::: .:.: .::.:...: .:: :.:: ::: ::.. ..::: : :...... CCDS35 MMYRTVGFGTRSR-NLKPWMIAVLIVLSLTVVAVTIGLLVHFLVFDQKKEY-YHGSFKIL 10 20 30 40 50 70 80 90 100 110 pF1KE6 TDKLYAEFGREAS---NNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLA .. .::. . ... : .. : :.: . : : .....:.::.... .. :: . CCDS35 DPQINNNFGQSNTYQLKDLRETTENLVSQVDEIFIDSAWKKNYIKNQVVRLTPEEDGVKV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 HMLLICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHC .... .: :::. . .: .: .:..:... . : .. ::... .... . .. CCDS35 DVIMVFQFPSTEQRAVREKKIQSILNQKIRNLRALP-INASSVQVNAMSSSTGELTVQAS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 CGTRRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTY :: .: :. . ::..:. . .. ::::::::.:. :.::::::. ::::.::::: : CCDS35 CG-KRVVPLNVN-RIASGVIAPKAAWPWQASLQYDNIHQCGATLISNTWLVTAAHCFQKY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 KNPARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVC ::: .::.:::. :.: :::..::.:.::::. ...:::.....:: : ... ....: CCDS35 KNPHQWTVSFGTKINPPLMKRNVRRFIIHEKYRSAAREYDIAVVQVSSRVTFSDDIRQIC 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 LPDASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRML ::.:: :::. .. .:::::: : ::: ::.:.: .:. .:..::.:.. : : :. CCDS35 LPEASASFQPNLTVHITGFGALYYGGESQNDLREARVKIISDDVCKQPQVYGNDIKPGMF 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 CAGSLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWI ::: .:: :::.::::::::. : .: ::: :::::::.:.. .::::::.:: :.:: CCDS35 CAGYMEGIYDACRGDSGGPLVTRDLKDTWYLIGIVSWGDNCGQKDKPGVYTQVTYYRNWI 360 370 380 390 400 410 420 pF1KE6 TSKTGI .::::: CCDS35 ASKTGI 420 >>CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 (438 aa) initn: 984 init1: 643 opt: 1208 Z-score: 1423.1 bits: 272.4 E(32554): 6e-73 Smith-Waterman score: 1211; 43.2% identity (70.9% similar) in 440 aa overlap (1-423:1-438) 10 20 30 40 50 pF1KE6 MMYRP------DVVRA---RKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTY ::: : . :: ::. :. ..: . . .... ::...:.: ..:. : CCDS35 MMYAPVEFSEAEFSRAEYQRKQQFWDSVRLALFTLAIVAIIGIAIGIVTHFVVEDDKSFY 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 NYYSTLSFTTDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQ : .... :. : ..: ..: .: : :...: :.. : .: . .:.::.:::.: . CCDS35 -YLASFKVTNIKYKENYGIRSSREFIERSHQIERMMSRIFRHSSVGGRFIKSHVIKLSPD 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 KHGVLAHMLLICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETD ..:: ..:: :. ::.. : . : .. .:...:. .. : .. :.. . CCDS35 EQGVDILIVLIFRYPSTDSAEQIKKKIEKALYQSLKTKQLSLTINKPSFRLTPIDSKKMR 120 130 140 150 160 170 180 190 200 210 220 pF1KE6 SYLNHCCGTRRSKT------LGQSLRIVGGTEVE-EGEWPWQASLQWDGS-HRCGATLIN . :: :: : ... ... ::: : :. ::::::::::: :: :.:::.::. CCDS35 NLLNSRCGIRMTSSNMPLPASSSTQRIVQGRETAMEGEWPWQASLQLIGSGHQCGASLIS 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 ATWLVSAAHCFTTYKNPARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPSHDYDISLAEL :::..::::: :.:..: :.::.:: : .::..:.::.::.:.. ... ::.:..: CCDS35 NTWLLTAAHCFWKNKDPTQWIATFGATITPPAVKRNVRKIILHENYHRETNENDIALVQL 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 SSPVPYTNAVHRVCLPDASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCN :. : ..: :.::::::.: .. : .::::::.. .:: :: ::::.: :.. .:: CCDS35 STGVEFSNIVQRVCLPDSSIKLPPKTSVFVTGFGSIVDDGPIQNTLRQARVETISTDVCN 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 EPQAYNDAITPRMLCAGSLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNK . ..:. ::: ::::: .::: :::.:::::::: : .::::..::::::. :: :.: CCDS35 RKDVYDGLITPGMLCAGFMEGKIDACKGDSGGPLVY-DNHDIWYIVGIVSWGQSCALPKK 360 370 380 390 400 410 410 420 pF1KE6 PGVYTRVTALRDWITSKTGI :::::::: ::::.::::. CCDS35 PGVYTRVTKYRDWIASKTGM 420 430 >>CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 (418 aa) initn: 900 init1: 900 opt: 1153 Z-score: 1358.8 bits: 260.4 E(32554): 2.3e-69 Smith-Waterman score: 1153; 38.9% identity (73.0% similar) in 422 aa overlap (2-423:1-418) 10 20 30 40 50 60 pF1KE6 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT :::: : . .: .:.:. ... ....::: :.: :... ..:: .: : :.... CCDS35 MYRPARVTSTSRFL-NPYVVCFIVVAGVVILAVTIALLVYFLAFDQK-SYFYRSSFQLL 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 TDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHML . . .... :.... .: :.::.. ..: .: ::..:....: :. :. :: : .. CCDS35 NVEYNSQLNSPATQEYRTLSGRIESLITKTFKESNLRNQFIRAHVAKLRQDGSGVRADVV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 LICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGT . .: ... .. . .. ::.. :... : ...: :..: ... . ..: . ::. CCDS35 MKFQFTRNNNGASMKSRIESVLRQMLNNS-GNLEINP-STEITSLTDQAAANWLINECGA 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 RRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNP . . ::.::::.::: ::::.::. ...:.::..::: :...::::: . .:: CCDS35 GPDLITLSEQRILGGTEAEEGSWPWQVSLRLNNAHHCGGSLINNMWILTAAHCFRSNSNP 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE6 ARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPD : :. :.. :.. .: :..:..:: .:. ::.:..: . : .:. .: :::: CCDS35 RDWIATSGISTTFPKLRMRVRNILIHNNYKSATHENDIALVRLENSVTFTKDIHSVCLPA 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE6 ASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAG :. .. ::.. .:::.:: . :.. .:::.:: .:. .:: :..:: :: ::::: CCDS35 ATQNIPPGSTAYVTGWGAQEYAGHTVPELRQGQVRIISNDVCNAPHSYNGAILSGMLCAG 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE6 SLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSK .: .::::::::::::. :.: .:...:::::::.:. :.:::::::::: ::: .. CCDS35 VPQGGVDACQGDSGGPLVQEDSRRLWFIVGIVSWGDQCGLPDKPGVYTRVTAYLDWIRQQ 360 370 380 390 400 410 pF1KE6 TGI ::: CCDS35 TGI >>CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 (416 aa) initn: 992 init1: 866 opt: 1087 Z-score: 1281.2 bits: 246.1 E(32554): 4.9e-65 Smith-Waterman score: 1087; 39.5% identity (67.6% similar) in 423 aa overlap (2-423:1-416) 10 20 30 40 50 60 pF1KE6 MMYRPDVVRARKRVCWEPWVIGLVIFISLIVLAVCIGLTVHYVRYNQKKTYNYYSTLSFT ::: . :. : :. .... .:.: ::: ::.. .::: : . . .. CCDS35 MYRHGISSQRS---WPLWTTIFIFLGVAAILGVTIGLLVHFLAV--EKTYYYQGDFHIS 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 TDKLYAEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHML . ::. :..:. .:. . ::: .: . .:.:::.:::. . .: ... CCDS35 GVTYNDNCENAASQASTNLSKDIETKMLNAFQNSSIYKEYVKSEVIKLLPNANGSNVQLQ 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 LICRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGT : .: .: :: . ::. :.. .. .. : :.:. .:.:. .. :.::: CCDS35 LKFKFPPAEGVSMRTKI-KAKLHQMLKNNMASWNAVPASIKLMEISKAASEMLTNNCCGR 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 RRSKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNP . .... . .::.: :: ::::::.:: : : :::.::.. ::.::::::. .: CCDS35 QVANSIITGNKIVNGKSSLEGAWPWQASMQWKGRHYCGASLISSRWLLSAAHCFAKKNNS 180 190 200 210 220 230 250 260 270 280 290 pF1KE6 ARWTASFGVTIKPSKMKRGLRRIIVHEKYKHPS-HDYDISLAELSSPVPYTNAVHRVCLP ::..::.... : : .. :: ::.:. :. :: ::.:..:. : .:. ....::: CCDS35 KDWTVNFGIVVNKPYMTRKVQNIIFHENYSSPGLHD-DIALVQLAEEVSFTEYIRKICLP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 DASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCA .:..... .: . :::.:.: .: :.. . .:: :: ::. .: :::: CCDS35 EAKMKLSENDNVVVTGWGTLYMNGSFPVILQEDFLKIIDNKICNASYAYSGFVTDTMLCA 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 GSLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITS : . :..::::.::::::. :.:.::.:.::::::: :.: ::::::::::. :.:::: CCDS35 GFMSGEADACQNDSGGPLAYPDSRNIWHLVGIVSWGDGCGKKNKPGVYTRVTSYRNWITS 360 370 380 390 400 410 420 pF1KE6 KTGI :::. CCDS35 KTGL >>CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 (802 aa) initn: 737 init1: 303 opt: 749 Z-score: 879.1 bits: 172.6 E(32554): 1.2e-42 Smith-Waterman score: 749; 45.8% identity (68.7% similar) in 249 aa overlap (176-417:556-797) 150 160 170 180 190 200 pF1KE6 LQDAVGPPKVDPHSVKIKKINKTETDSYLNHC-CGTRRSKTLGQSLRIVGGTEVEEGEWP :: :: . : : :::::. ::::: CCDS74 TFQCEDRSCVKKPNPQCDGRPDCRDGSDEEHCDCGLQ-----GPSSRIVGGAVSSEGEWP 530 540 550 560 570 580 210 220 230 240 250 pF1KE6 WQASLQWDGSHRCGATLINATWLVSAAHCFT--TYKNPARWTASFGVTIK----PSKMKR :::::: : : ::..:: :...::::: .. . . ::. .: . . :.... CCDS74 WQASLQVRGRHICGGALIADRWVITAAHCFQEDSMASTVLWTVFLGKVWQNSRWPGEVSF 590 600 610 620 630 640 260 270 280 290 300 310 pF1KE6 GLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPDASYEFQPGDVMFVTGFGA . :...: ... :::::..: .:. :: . ::. :::: :. :.:: ..::.:: CCDS74 KVSRLLLHPYHEEDSHDYDVALLQLDHPVVRSAAVRPVCLPARSHFFEPGLHCWITGWGA 650 660 670 680 690 700 320 330 340 350 360 370 pF1KE6 LKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAGSLEGKTDACQGDSGGPLV :.. : .: :....: :: :.: .: .:::::::: .:: :::::::::::: CCDS74 LREGGPISNALQKVDVQLIPQDLCSE--VYRYQVTPRMLCAGYRKGKKDACQGDSGGPLV 710 720 730 740 750 380 390 400 410 420 pF1KE6 SSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSKTGI . :.:::.:::: :..:: :::::.:.. .:: CCDS74 CKALSGRWFLAGLVSWGLGCGRPNYFGVYTRITGVISWIQQVVT 760 770 780 790 800 >>CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 (811 aa) initn: 737 init1: 303 opt: 749 Z-score: 879.0 bits: 172.6 E(32554): 1.2e-42 Smith-Waterman score: 749; 45.8% identity (68.7% similar) in 249 aa overlap (176-417:565-806) 150 160 170 180 190 200 pF1KE6 LQDAVGPPKVDPHSVKIKKINKTETDSYLNHC-CGTRRSKTLGQSLRIVGGTEVEEGEWP :: :: . : : :::::. ::::: CCDS13 TFQCEDRSCVKKPNPQCDGRPDCRDGSDEEHCDCGLQ-----GPSSRIVGGAVSSEGEWP 540 550 560 570 580 210 220 230 240 250 pF1KE6 WQASLQWDGSHRCGATLINATWLVSAAHCFT--TYKNPARWTASFGVTIK----PSKMKR :::::: : : ::..:: :...::::: .. . . ::. .: . . :.... CCDS13 WQASLQVRGRHICGGALIADRWVITAAHCFQEDSMASTVLWTVFLGKVWQNSRWPGEVSF 590 600 610 620 630 640 260 270 280 290 300 310 pF1KE6 GLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPDASYEFQPGDVMFVTGFGA . :...: ... :::::..: .:. :: . ::. :::: :. :.:: ..::.:: CCDS13 KVSRLLLHPYHEEDSHDYDVALLQLDHPVVRSAAVRPVCLPARSHFFEPGLHCWITGWGA 650 660 670 680 690 700 320 330 340 350 360 370 pF1KE6 LKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAGSLEGKTDACQGDSGGPLV :.. : .: :....: :: :.: .: .:::::::: .:: :::::::::::: CCDS13 LREGGPISNALQKVDVQLIPQDLCSE--VYRYQVTPRMLCAGYRKGKKDACQGDSGGPLV 710 720 730 740 750 760 380 390 400 410 420 pF1KE6 SSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSKTGI . :.:::.:::: :..:: :::::.:.. .:: CCDS13 CKALSGRWFLAGLVSWGLGCGRPNYFGVYTRITGVISWIQQVVT 770 780 790 800 810 >>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa) initn: 660 init1: 322 opt: 693 Z-score: 817.1 bits: 160.3 E(32554): 3.4e-39 Smith-Waterman score: 693; 41.7% identity (65.5% similar) in 264 aa overlap (158-417:186-443) 130 140 150 160 170 180 pF1KE6 TEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHC--CGTRRSKT ::: ... . : .: :: :: CCDS58 LRVSSLEGQFREEFVSIDHLLPDDKVTALHHSVYVREGCASGHVVTL-QCTACGHRR--- 160 170 180 190 200 210 190 200 210 220 230 240 pF1KE6 LGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNPARWTA : : :::::. ..::::::::..: : ::...:. :...:::: : :: CCDS58 -GYSSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSVITPLWIITAAHCVYDLYLPKSWTI 220 230 240 250 260 270 250 260 270 280 290 300 pF1KE6 SFG-VTIKPSKMKRGL-RRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCLPDASY . : :.. . : ..:. : ::: ::.: .:..:. ... .. ::::.. CCDS58 QVGLVSLLDNPAPSHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEE 280 290 300 310 320 330 310 320 330 340 350 360 pF1KE6 EFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEPQAYNDAITPRMLCAGSLE .: : : ...:.:: .. : .. : .: : ::. ::. ..:. :.: ::::: : CCDS58 NFPDGKVCWTSGWGATEDGGDASPVLNHAAVPLISNKICNHRDVYGGIISPSMLCAGYLT 340 350 360 370 380 390 370 380 390 400 410 420 pF1KE6 GKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRDWITSKTGI : .:.:::::::::: .. : .: :.: .:.: ::. ::::::::::.. ::: CCDS58 GGVDSCQGDSGGPLVCQE-RRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQMER 400 410 420 430 440 CCDS58 DLKT 450 >>CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 (532 aa) initn: 427 init1: 243 opt: 692 Z-score: 814.9 bits: 160.1 E(32554): 4.6e-39 Smith-Waterman score: 697; 36.1% identity (63.0% similar) in 338 aa overlap (96-420:192-522) 70 80 90 100 110 120 pF1KE6 AEFGREASNNFTEMSQRLESMVKNAFYKSPLREEFVKSQVIKFSQQKHGVLAHMLLICRF .: .. :: . .: ..: . : :: CCDS55 YKEQRESCPKHAVRCDGVVDCKLKSDELGCVRFDWDKSLLKIYSGSSH----QWLPIC-- 170 180 190 200 210 130 140 150 160 170 180 pF1KE6 HSTEDPETVDKIVQLVLHEKLQDAVGPPKVD-PHSVKIKKINKTETDSYLNHCCGTRRSK :. . .: : . :. . .. . : .: .: . :.: .: : ..: CCDS55 SSNWNDSYSEKTCQQLGFESAHRTTEVAHRDFANSFSILRYNSTIQESLHRSECPSQRYI 220 230 240 250 260 270 190 200 210 220 230 pF1KE6 TL--------GQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCF-- .: ... :::::. . ...::::.::.. .: ::.:::.: :...::::: CCDS55 SLQCSHCGLRAMTGRIVGGALASDSKWPWQVSLHFGTTHICGGTLIDAQWVLTAAHCFFV 280 290 300 310 320 330 240 250 260 270 280 290 pF1KE6 TTYKNPARWTASFGVT-IKPSKMKRGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAV : : : . :.. .. .. .::.. .: ::::.: .::.:. . . CCDS55 TREKVLEGWKVYAGTSNLHQLPEAASIAEIIINSNYTDEEDDYDIALMRLSKPLTLSAHI 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE6 HRVCLPDASYEFQPGDVMFVTGFGALKN-DGYSQNHLRQAQVTLIDATTCNEPQAYNDAI : .::: . :. ... ..:::: .. : .. ::..::.::: ::. .:.. . CCDS55 HPACLPMHGQTFSLNETCWITGFGKTRETDDKTSPFLREVQVNLIDFKKCNDYLVYDSYL 400 410 420 430 440 450 360 370 380 390 400 410 pF1KE6 TPRMLCAGSLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTA ::::.:::.:.: :.:::::::::: . . :::::..::: :.. :::::::.:: CCDS55 TPRMMCAGDLRGGRDSCQGDSGGPLVC-EQNNRWYLAGVTSWGTGCGQRNKPGVYTKVTE 460 470 480 490 500 510 420 pF1KE6 LRDWITSKTGI . :: :: CCDS55 VLPWIYSKMESEVRFRKS 520 530 423 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:40:29 2016 done: Tue Nov 8 12:40:30 2016 Total Scan time: 2.130 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]