FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6732, 1134 aa 1>>>pF1KE6732 1134 - 1134 aa - 1134 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3037+/-0.000895; mu= 23.1234+/- 0.054 mean_var=84.5492+/-17.342, 0's: 0 Z-trim(107.0): 215 B-trim: 4 in 1/52 Lambda= 0.139482 statistics sampled from 9084 (9315) to 9084 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.642), E-opt: 0.2 (0.286), width: 16 Scan time: 3.930 The best scores are: opt bits E(32554) CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 809 173.3 1.4e-42 CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 681 147.6 8.4e-35 CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 678 147.1 1.6e-34 CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 679 147.4 1.7e-34 CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 674 146.1 1.9e-34 CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 674 146.1 2e-34 CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 672 145.7 2.4e-34 CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 662 143.6 9.6e-34 CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 655 142.2 2.4e-33 CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 641 139.6 2.5e-32 CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 634 138.0 4.5e-32 CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 637 138.8 4.8e-32 CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 637 138.8 4.8e-32 CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 632 137.6 6.2e-32 CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 630 137.3 1.1e-31 CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 625 136.0 1.2e-31 CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 621 135.3 2.4e-31 CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 616 134.4 5.5e-31 CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 616 134.4 5.5e-31 CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 609 133.0 1.5e-30 CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 604 131.8 2.1e-30 CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 604 131.8 2.3e-30 CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 604 131.9 2.8e-30 CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 604 132.0 3e-30 CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 604 132.0 3.1e-30 CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 595 130.0 7.5e-30 CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 597 130.5 7.8e-30 CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 597 130.6 8.2e-30 CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 597 130.6 8.4e-30 CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 598 130.8 8.5e-30 CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 594 130.0 1.4e-29 CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 594 130.0 1.5e-29 CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 590 129.0 1.5e-29 CCDS32490.1 CTRB1 gene_id:1504|Hs108|chr16 ( 263) 585 127.9 3e-29 CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 591 129.6 3.3e-29 CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 591 129.7 3.6e-29 CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 584 127.8 4e-29 CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 577 126.4 9.5e-29 CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 577 126.4 1e-28 CCDS32489.1 CTRB2 gene_id:440387|Hs108|chr16 ( 263) 575 125.9 1.2e-28 CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 572 125.3 1.8e-28 CCDS44881.1 TMPRSS12 gene_id:283471|Hs108|chr12 ( 348) 572 125.4 2.2e-28 CCDS3709.1 PRSS12 gene_id:8492|Hs108|chr4 ( 875) 576 126.6 2.5e-28 CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 573 125.9 3e-28 CCDS83495.1 F9 gene_id:2158|Hs108|chrX ( 423) 564 123.9 7.9e-28 CCDS14666.1 F9 gene_id:2158|Hs108|chrX ( 461) 564 123.9 8.4e-28 CCDS14101.1 ACR gene_id:49|Hs108|chr22 ( 421) 563 123.7 9e-28 CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 559 122.8 1.3e-27 CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 418) 553 121.7 3.6e-27 CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 421) 553 121.7 3.6e-27 >>CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 (565 aa) initn: 989 init1: 602 opt: 809 Z-score: 877.9 bits: 173.3 E(32554): 1.4e-42 Smith-Waterman score: 1117; 34.8% identity (65.3% similar) in 554 aa overlap (3-532:2-544) 10 20 30 40 50 pF1KE6 MGLLASAGLLLLLVI-----GHPRSLGL----KCGIRMVNMKSKEPAVGSRFFSRISSWR :.. :.::: : :. .:.: .:: .:.. .: .:::: . CCDS73 MLISRNKLILLLGIVFFERGKSATLSLPKAPSCGQSLVKV---QPWNYFNIFSRILGGS 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 NSTVTGHPWQVSLKSDEHHFCGGSLIQEDRVVTAAHCLDSLSEKQLKNITVTSGEYSLFQ . ..:::::::. ..:.::::... . :.:::::. ... .....::.:::.: : CCDS73 QVEKGSYPWQVSLKQRQKHICGGSIVSPQWVITAAHCIA--NRNIVSTLNVTAGEYDLSQ 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 KDKQEQNIPVSKIITHPEYNSREYMSPDIALLYLKHKVKFGNAVQPICLPDSDDKVEPGI : ::.. . .: ::...... :. ::::: . .::. : :::::. .. : :. CCDS73 TDPGEQTLTIETVIIHPHFSTKKPMDYDIALLKMAGAFQFGHFVGPICLPELREQFEAGF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 LCLSSGWGKISKTSEYSNVLQEMELPIMDDRACNTVLKSMNLPPLGRTMLCAGFPDWGMD .: ..:::.... . :.::::..:::. . : ..: ... : :.:.::.:::: : : CCDS73 ICTTAGWGRLTEGGVLSQVLQEVNLPILTWEECVAALLTLKRPISGKTFLCTGFPDGGRD 180 190 200 210 220 230 240 250 260 270 280 pF1KE6 ACQGDSGGPLVCRRGGGIWILAGITSWVAGCAGGSVPVRNNHVKA---SLGIFSKVSELM :::::::: :.:: : : :::.::: ::. : ::: :. : :::. .:... CCDS73 ACQGDSGGSLMCRNKKGAWTLAGVTSWGLGCGRG---WRNNVRKSDQGSPGIFTDISKVL 240 250 260 270 280 290 290 300 310 320 330 pF1KE6 DFITQNLFTGLDRG--------QPLSKVGSR---YITKALSSVQEVNGSQRGKGILDMEK .: ... :: : : . :.. .. ..: : . .. : CCDS73 PWIHEHIQTGNRRKSSRAWCSEQDVIVSGAEGKLHFPESLHLYYESKQRCVWTLLVPEEM 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE6 QVGCDHDYVSLRSSSGVLFNQRSLMEDDGKQNKRVCGKILPSPLLAETSEAMVPFVSDTE .: . ......: ... :: :: . . ::. ::: .: .. . ::::. CCDS73 HVLLSFSHLDVESCHHSYLSMYSL-ED--RPIGKFCGESLPSSILIGSNSLRLKFVSDAT 360 370 380 390 400 400 410 420 430 440 450 pF1KE6 DSGSGFELTVTAVQKSEA-GSGCGSLAILVEEGTNHSAKYPDLYPSNTRCHWFICAPEKH :...::.:: :.. . :::. :..: ::: .: .::. : ... : :.. : ..: CCDS73 DNAAGFNLTYKALKPNYIPDSGCSYLTVLFEEGLIQSLNYPENYSDKANCDWIFQASKHH 410 420 430 440 450 460 460 470 480 490 500 510 pF1KE6 IIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSNMTVIYFKSD .:::.:... .. : .: : :....: :.:...:.:::. . : ..: :.. .: :.:: CCDS73 LIKLSFQSLEIEESGDCTSDYVTVHSDVERKKEIARLCGYDVPTPVLSPSSIMLISFQSD 470 480 490 500 510 520 520 530 540 550 560 570 pF1KE6 GKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIA .. .::.: ...: CCDS73 ENGTCRGFQATVSFIPKAVYPDLNISISEDESMFLET 530 540 550 560 >>CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 (603 aa) initn: 593 init1: 201 opt: 681 Z-score: 738.3 bits: 147.6 E(32554): 8.4e-35 Smith-Waterman score: 681; 38.9% identity (64.8% similar) in 270 aa overlap (574-840:104-363) 550 560 570 580 590 600 pF1KE6 PPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGA ::.:: : : ::: : :.. :. :::. CCDS74 RPQALLQDPPEPGPCGERRPSTANVTRAHGRIVGGSAAPPGAWPWLVRLQLGGQPLCGGV 80 90 100 110 120 130 610 620 630 640 650 660 pF1KE6 IINPVWILTAAHCVQLKNNPLSWTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDS .. :.:::::: : : ::. .. .:. :..:.: ...:. : :. .. . CCDS74 LVAASWVLTAAHCFVGAPNELLWTVTLAEGSRG--EQAEEVP-VNRILPHPKFDPRTFHN 140 150 160 170 180 190 670 680 690 700 710 720 pF1KE6 DIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSISADGGLASRLQQIQVHV :.::.:: .:. .. .::::::. . .. ::..:::.. :: : ... .: . CCDS74 DLALVQLWTPVSPGGSARPVCLPQEPQEPPAGTACAIAGWGALFEDGPEAEAVREARVPL 200 210 220 230 240 250 730 740 750 760 770 780 pF1KE6 LEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVCRHENGPF---VLYG : ..:.. . :: :.:::. :.: : :::::::::.: : :: ::.: CCDS74 LSTDTCRR---ALGPGLRPSTMLCAGYLAGGV-DSCQGDSGGPLTCS-EPGPRPREVLFG 260 270 280 290 300 790 800 810 820 830 840 pF1KE6 IVSWGAGCVQPWKPGVFARVMIFLDWIQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSA ..::: :: .: ::::..:: .: ::.: ... :: . . .:. : :: . :.: CCDS74 VTSWGDGCGEPGKPGVYTRVAVFKDWLQEQMS--ASSSREPSCRELLAWDPPQELQADAA 310 320 330 340 350 360 850 860 870 880 890 900 pF1KE6 SWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKFTIEYLSLLGSPVC CCDS74 RLCAFYARLCPGSQGACARLAHQQCLQRRRRCELRSLAHTLLGLLRNAQELLGPRPGLRR 370 380 390 400 410 420 >>CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 (855 aa) initn: 642 init1: 241 opt: 678 Z-score: 733.0 bits: 147.1 E(32554): 1.6e-34 Smith-Waterman score: 678; 41.2% identity (67.5% similar) in 255 aa overlap (561-808:604-850) 540 550 560 570 580 590 pF1KE6 LPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQV ::. :. : :..:: .: ::::: CCDS84 CLNGLCLSKGNPECDGKEDCSDGSDEKDCDCGLRSFTRQ---ARVVGGTDADEGEWPWQV 580 590 600 610 620 630 600 610 620 630 640 pF1KE6 GLRFLGD-YQCGGAIINPVWILTAAHC-VQLK----NNPLSWTIIAGDHDRNLKESTE-Q .:. ::. . ::...:.: :...:::: .. . ..: .:: . : ::.. . . : CCDS84 SLHALGQGHICGASLISPNWLVSAAHCYIDDRGFRYSDPTQWTAFLGLHDQSQRSAPGVQ 640 650 660 670 680 690 650 660 670 680 690 700 pF1KE6 VRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGW :: :.:: : :: ...: ::::..: .: ::.:.:::.::: ... . ... :::: CCDS84 ERRLKRIISHPFFNDFTFDYDIALLELEKPAEYSSMVRPICLPDASHVFPAGKAIWVTGW 700 710 720 730 740 750 710 720 730 740 750 760 pF1KE6 GSISADGGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDS : . : : ::. ...:... .::. : :: .:.:.:: :: : ::::: CCDS84 GHTQYGGTGALILQKGEIRVINQTTCENLL----PQQITPRMMCVGFL-SGGVDSCQGDS 760 770 780 790 800 770 780 790 800 810 820 pF1KE6 GGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSKINGPASLQTNNKC :::: . .: . :.:::: ::.: ::::..:. .: :::. CCDS84 GGPLSSVEADGRIFQAGVVSWGDGCAQRNKPGVYTRLPLFRDWIKENTGV 810 820 830 840 850 830 840 850 860 870 880 pF1KE6 KTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASS >>CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059 aa) initn: 764 init1: 348 opt: 679 Z-score: 732.9 bits: 147.4 E(32554): 1.7e-34 Smith-Waterman score: 690; 34.9% identity (63.8% similar) in 318 aa overlap (528-843:159-458) 500 510 520 530 540 550 pF1KE6 TITSIFSSSNMTVIYFKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVKAIL :. :. ..: .:. :.. : . CCDS12 GTIVSAELTGRHKGPLAERDFKSGRCPGNSFSCGNSQCVTKVNPECDDQED-CSDGSDEA 130 140 150 160 170 180 560 570 580 590 600 610 pF1KE6 HDVCGIPPFSPQW-LSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHC : ::. .: : .. ::.:: :: : .:::..:: .. ::.:::: :...:::: CCDS12 HCECGL---QPAWRMAGRIVGGMEASPGEFPWQASLRENKEHFCGAAIINARWLVSAAHC 190 200 210 220 230 240 620 630 640 650 660 670 pF1KE6 VQLKNNPLSWTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEY . ..: .:. .: . .:.. .. .:. : .:. . : :.:...:.::: . CCDS12 FNEFQDPTKWVAYVGATYLSGSEASTVRAQVVQIVKHPLYNADTADFDVAVLELTSPLPF 250 260 270 280 290 300 680 690 700 710 720 730 pF1KE6 NSVVRPVCLPHSAEPLFSSEICAVTGWGSISADGGLASR-LQQIQVHVLEREVCEHTYYS . ..::::: ... . :. : ..::: .. : . . ::. :..:.. .: : CCDS12 GRHIQPVCLPAATHIFPPSKKCLISGWGYLKEDFLVKPEVLQKATVELLDQALCASLY-- 310 320 330 340 350 360 740 750 760 770 780 790 pF1KE6 AHPGGITEKMICAGFAASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPG .: ..:..:.:::. .:. : :::::::::::.. .: : : :::::: ::.. .:: CCDS12 GH--SLTDRMVCAGYL-DGKVDSCQGDSGGPLVCEEPSGRFFLAGIVSWGIGCAEARRPG 370 380 390 400 410 800 810 820 830 840 850 pF1KE6 VFARVMIFLDWIQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPR :.::: . ::: :....: . :.:. :..:: CCDS12 VYARVTRLRDWI---------LEATTKASMPLAPTMAPAPAAPSTAWPTSPESPVVSTPT 420 430 440 450 460 470 860 870 880 890 900 910 pF1KE6 GFFPTPRYLLDYRGRLECSWVLRVSASSMAKFTIEYLSLLGSPVCQDSVLIIYEERHSKR CCDS12 KSMQALSTVPLDWVTVPKLQECGARPAMEKPTRVVGGFGAASGEVPWQVSLKEGSRHFCG 480 490 500 510 520 530 >-- initn: 634 init1: 231 opt: 550 Z-score: 592.6 bits: 121.4 E(32554): 1.1e-26 Smith-Waterman score: 826; 26.0% identity (49.1% similar) in 755 aa overlap (59-811:516-1057) 30 40 50 60 70 80 pF1KE6 MVNMKSKEPAVGSRFFSRISSWRNSTVTGHPWQVSLKSDEHHFCGGSLIQEDRVVTAAHC ::::::: .::::.... . ...:::: CCDS12 VPKLQECGARPAMEKPTRVVGGFGAASGEVPWQVSLKEGSRHFCGATVVGDRWLLSAAHC 490 500 510 520 530 540 90 100 110 120 130 140 pF1KE6 LDSLSEKQLKNITVTSGEYSLFQKDKQEQNIPVSKIITHPEYNSREYMSPDIALLYLKHK .. . .:.. . : ::. . .: . ... :: :: .. :.:.: : CCDS12 FNHTKVEQVR---AHLGTASLLGLGGSPVKIGLRRVVLHPLYNPG-ILDFDLAVLELASP 550 560 570 580 590 600 150 160 170 180 190 200 pF1KE6 VKFGNAVQPICLPDSDDKVEPGILCLSSGWGKISK-TSEYSNVLQEMELPIMDDRACNTV . :.. .::.::: . .: : :. ::::. .. .. ..::. . :.:...: .: CCDS12 LAFNKYIQPVCLPLAIQKFPVGRKCMISGWGNTQEGNATKPELLQKASVGIIDQKTC-SV 610 620 630 640 650 660 210 220 230 240 250 260 pF1KE6 LKSMNLPPLGRTMLCAGFPDWGMDACQGDSGGPLVCRRGGGIWILAGITSWVAGCAGGSV : ...: :.:::: . .:.:::::::::.:... :.. ::::.:: ::: . CCDS12 LYNFSLTD---RMICAGFLEGKVDSCQGDSGGPLACEEAPGVFYLAGIVSWGIGCAQVKK 670 680 690 700 710 270 280 290 300 310 320 pF1KE6 PVRNNHVKASLGIFSKVSELMDFITQNLFTGLDRGQPLSKVGSRYITKALSSVQEVNGSQ : :.......: .: :. .:: CCDS12 P----------GVYTRITRLKGWIL-----------------------------EIMSSQ 720 730 330 340 350 360 370 380 pF1KE6 RGKGILDMEKQVGCDHDYVSLRSSSGVLFNQRSLMEDDGKQNKRVCGKILPSPLLAETSE : :. .. CCDS12 --------------------------------------------------PLPMSPPSTT 740 390 400 410 420 430 440 pF1KE6 AMVPFVSDTEDSGSGFELTVTAVQKSEAGSGCGSLAILVEEGTNHSAKYPDLYPSNTRCH :. .: .: ::: .. :. : .: CCDS12 RMLATTSPRTTAG----LTVPGATPSRPTPGAAS-------------------------- 750 760 770 450 460 470 480 490 500 pF1KE6 WFICAPEKHIIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSN .:. ..:. CCDS12 --------------------------------------------------RVTGQPANST 780 510 520 530 540 550 560 pF1KE6 MTVIYFKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFS .... . :.. : . : .:... : : ::. : . CCDS12 LSAVSTTARGQT------------------------PFPDAPEATTHTQLPD-CGLAPAA 790 800 810 820 570 580 590 600 610 620 pF1KE6 PQWLSRRIAGGEEACPHCWPWQVGLRFLG-DYQCGGAIINPVWILTAAHCVQLKNNPLSW :.: :.:: : :::::.: . ...::.... :.:.:::: .. ..: .: CCDS12 ---LTR-IVGGSAAGRGEWPWQVSLWLRRREHRCGAVLVAERWLLSAAHCFDVYGDPKQW 830 840 850 860 870 630 640 650 660 670 680 pF1KE6 TIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLP . . : :. . :..:. .: : .: . : :.::..:..:.. . .:::.::: CCDS12 AAFLGTP--FLSGAEGQLERVARIYKHPFYNLYTLDYDVALLELAGPVRRSRLVRPICLP 880 890 900 910 920 930 690 700 710 720 730 740 pF1KE6 HSAEPLFSSEICAVTGWGSISADGGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMI . : .. :..:::::. :..: .::. :..: ...:.. : : :. .:. CCDS12 EPAPRPPDGTRCVITGWGSVREGGSMARQLQKAAVRLLSEQTCRRFY----PVQISSRML 940 950 960 970 980 990 750 760 770 780 790 800 pF1KE6 CAGFAASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDW :::: .: : :.::.::::.::. .: .:: :..::: :: .: :::..:: : CCDS12 CAGFPQGGV-DSCSGDAGGPLACREPSGRWVLTGVTSWGYGCGRPHFPGVYTRVAAVRGW 1000 1010 1020 1030 1040 1050 810 820 830 840 850 860 pF1KE6 IQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLD : ..: CCDS12 IGQHIQE >>CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 (492 aa) initn: 742 init1: 345 opt: 674 Z-score: 731.9 bits: 146.1 E(32554): 1.9e-34 Smith-Waterman score: 674; 40.6% identity (66.4% similar) in 256 aa overlap (561-813:244-492) 540 550 560 570 580 590 pF1KE6 LPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQV ::. : . . ::.::: : : ::::: CCDS33 TSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSR--QSRIVGGESALPGAWPWQV 220 230 240 250 260 270 600 610 620 630 640 pF1KE6 GLRFLGDYQCGGAIINPVWILTAAHCVQLK-NNPLSWTIIAGDHDRNLKESTEQVRRAKH .:. . . :::.::.: ::.::::::. ::: :: .:: ... . : CCDS33 SLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK- 280 290 300 310 320 330 650 660 670 680 690 700 pF1KE6 IIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSISAD .: : .... . ..::::..:..:: .:..:.:::::. . : ..: ..:::. CCDS33 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK 340 350 360 370 380 390 710 720 730 740 750 760 pF1KE6 GGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVC : . :. .: ..: . :. : .. . :: :::::: .:. : :::::::::: CCDS33 GKTSEVLNAAKVLLIETQRCNSRY--VYDNLITPAMICAGFL-QGNVDSCQGDSGGPLVT 400 410 420 430 440 770 780 790 800 810 820 pF1KE6 RHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWI--QSKINGPASLQTNNKCKTLK .:. . : : .:::.::.. ..:::.. ::.: ::: : . .: CCDS33 S-KNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG 450 460 470 480 490 830 840 850 860 870 880 pF1KE6 QQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKF >>CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 (529 aa) initn: 742 init1: 345 opt: 674 Z-score: 731.4 bits: 146.1 E(32554): 2e-34 Smith-Waterman score: 674; 40.6% identity (66.4% similar) in 256 aa overlap (561-813:281-529) 540 550 560 570 580 590 pF1KE6 LPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQV ::. : . . ::.::: : : ::::: CCDS54 TSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSR--QSRIVGGESALPGAWPWQV 260 270 280 290 300 600 610 620 630 640 pF1KE6 GLRFLGDYQCGGAIINPVWILTAAHCVQLK-NNPLSWTIIAGDHDRNLKESTEQVRRAKH .:. . . :::.::.: ::.::::::. ::: :: .:: ... . : CCDS54 SLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK- 310 320 330 340 350 360 650 660 670 680 690 700 pF1KE6 IIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSISAD .: : .... . ..::::..:..:: .:..:.:::::. . : ..: ..:::. CCDS54 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK 370 380 390 400 410 420 710 720 730 740 750 760 pF1KE6 GGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVC : . :. .: ..: . :. : .. . :: :::::: .:. : :::::::::: CCDS54 GKTSEVLNAAKVLLIETQRCNSRY--VYDNLITPAMICAGFL-QGNVDSCQGDSGGPLVT 430 440 450 460 470 480 770 780 790 800 810 820 pF1KE6 RHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWI--QSKINGPASLQTNNKCKTLK .:. . : : .:::.::.. ..:::.. ::.: ::: : . .: CCDS54 S-KNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG 490 500 510 520 830 840 850 860 870 880 pF1KE6 QQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKF >>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa) initn: 681 init1: 224 opt: 672 Z-score: 730.2 bits: 145.7 E(32554): 2.4e-34 Smith-Waterman score: 672; 35.3% identity (65.3% similar) in 331 aa overlap (483-811:131-447) 460 470 480 490 500 510 pF1KE6 PEKHIIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSNMTVIY :. . : :..: . : ::.:. : CCDS58 GEDEYRCVRVGGQNAVLQVFTAASWKTMCSDDWKGHYANVACAQLGFPSYVSSDNLRVSS 110 120 130 140 150 160 520 530 540 550 560 570 pF1KE6 FKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVST-VKAILHDVCGIPPFSPQWL . .:. : . : . .::..... .. .. ... .: : .. .:: . CCDS58 L--EGQFREE-FVSIDHLLPDDKVTALHHSVYVREGCASGHVVTLQCTACG----HRRGY 170 180 190 200 210 580 590 600 610 620 630 pF1KE6 SRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHCVQLKNNPLSWTIIAG : ::.::. . ::::..:.: : . :::..:.:.::.:::::: : :::: .: CCDS58 SSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVG 220 230 240 250 260 270 640 650 660 670 680 690 pF1KE6 DHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEP .: .. . ...:. : .. .::::..:..:: .: ...:::::.: : CCDS58 L--VSLLDNPAPSHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEEN 280 290 300 310 320 330 700 710 720 730 740 750 pF1KE6 LFSSEICAVTGWGSISADGGLASR-LQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGF . ....: ..:::. . ::: :: :.. : .. ..:.: ... : :. .:.:::. CCDS58 FPDGKVCWTSGWGA-TEDGGDASPVLNHAAVPLISNKICNH--RDVYGGIISPSMLCAGY 340 350 360 370 380 760 770 780 790 800 810 pF1KE6 AASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSK ..: : :::::::::::. : . : : .:.: ::.. ::::..:: :::::. . CCDS58 LTGGV-DSCQGDSGGPLVCQ-ERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQ 390 400 410 420 430 440 820 830 840 850 860 870 pF1KE6 INGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGR . CCDS58 MERDLKT 450 >>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa) initn: 566 init1: 228 opt: 662 Z-score: 719.3 bits: 143.6 E(32554): 9.6e-34 Smith-Waterman score: 662; 34.7% identity (64.7% similar) in 331 aa overlap (483-811:131-448) 460 470 480 490 500 510 pF1KE6 PEKHIIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSNMTVIY :. . : :..: . : ::.:. : CCDS13 GEDEYRCVRVGGQNAVLQVFTAASWKTMCSDDWKGHYANVACAQLGFPSYVSSDNLRVSS 110 120 130 140 150 160 520 530 540 550 560 570 pF1KE6 FKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVST-VKAILHDVCGIPPFSPQWL . .:. : . : . .::..... .. .. ... .: : .. .:: . CCDS13 L--EGQFREE-FVSIDHLLPDDKVTALHHSVYVREGCASGHVVTLQCTACG----HRRGY 170 180 190 200 210 580 590 600 610 620 630 pF1KE6 SRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHCVQLKNNPLSWTIIAG : ::.::. . ::::..:.: : . :::..:.:.::.:::::: : :::: .: CCDS13 SSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVG 220 230 240 250 260 270 640 650 660 670 680 690 pF1KE6 DHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEP .: .. . ...:. : .. .::::..:..:: .: ...:::::.: : CCDS13 L--VSLLDNPAPSHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEEN 280 290 300 310 320 330 700 710 720 730 740 750 pF1KE6 LFSSEICAVTGWGSISADGGLASR-LQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGF . ....: ..:::. .: :: :.. : .. ..:.: ... : :. .:.:::. CCDS13 FPDGKVCWTSGWGATEDGAGDASPVLNHAAVPLISNKICNH--RDVYGGIISPSMLCAGY 340 350 360 370 380 760 770 780 790 800 810 pF1KE6 AASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSK ..: : :::::::::::. : . : : .:.: ::.. ::::..:: :::::. . CCDS13 LTGGV-DSCQGDSGGPLVCQ-ERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQ 390 400 410 420 430 440 820 830 840 850 860 870 pF1KE6 INGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGR . CCDS13 MERDLKT 450 >>CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 (423 aa) initn: 608 init1: 225 opt: 655 Z-score: 712.1 bits: 142.2 E(32554): 2.4e-33 Smith-Waterman score: 655; 38.2% identity (65.1% similar) in 275 aa overlap (541-810:153-420) 520 530 540 550 560 pF1KE6 IYFKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVK-----AILHDVCGIPP ::. :.. .. .. . :. :: CCDS33 CRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGTRR 130 140 150 160 170 180 570 580 590 600 610 620 pF1KE6 FSPQWLSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHCVQLKNNPLS . : ::.:: :. ::::..:.. :...::...:: .:...:::: .:: CCDS33 SKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNPAR 190 200 210 220 230 240 630 640 650 660 670 680 pF1KE6 WTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCL :: : ..: : . : ..::::: .. :.: ::.: .::::. :...:. ::: CCDS33 WTASFG---VTIKPSKMK-RGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCL 250 260 270 280 290 690 700 710 720 730 740 pF1KE6 PHSAEPLFSSEICAVTGWGSISADGGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKM : .. . ... :::.:... :: ..:.: :: ... .:.. .:. .:: .: CCDS33 PDASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEP--QAYNDAITPRM 300 310 320 330 340 350 750 760 770 780 790 800 pF1KE6 ICAGFAASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLD .::: . :. : :::::::::: . : :::::: :..: ::::..:: . : CCDS33 LCAG-SLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRD 360 370 380 390 400 410 810 820 830 840 850 860 pF1KE6 WIQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLL :: :: CCDS33 WITSKTGI 420 >>CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 (717 aa) initn: 609 init1: 174 opt: 641 Z-score: 693.8 bits: 139.6 E(32554): 2.5e-32 Smith-Waterman score: 641; 41.0% identity (68.0% similar) in 244 aa overlap (574-811:479-713) 550 560 570 580 590 600 pF1KE6 PPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGA :: :: .. :::::.:.:.:. ::.. CCDS43 QNAKCDGTVDCPDGSDEEGCTCSRSSSALHRIIGGTDTLEGGWPWQVSLHFVGSAYCGAS 450 460 470 480 490 500 610 620 630 640 650 660 pF1KE6 IINPVWILTAAHCVQLK--NNPLSWTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSY .:. :.:.:::: . . ..: :: : . .. . . ::: :.::: .:. .. CCDS43 VISREWLLSAAHCFHGNRLSDPTPWTAHLGMYVQGNAKFVSPVRR---IVVHEYYNSQTF 510 520 530 540 550 560 670 680 690 700 710 pF1KE6 DSDIALIQLSS--PLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSIS-ADGGLASRLQQ : ::::.::: : .....:.:.: ... . :.: : ::::: ::. . ::: CCDS43 DYDIALLQLSIAWPETLKQLIQPICIPPTGQRVRSGEKCWVTGWGRRHEADNKGSLVLQQ 570 580 590 600 610 620 720 730 740 750 760 770 pF1KE6 IQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVCRHE-NGPFV .:..... .: :: : :: .:.:::. ::..: :.::::::: ::.. .: .. CCDS43 AEVELIDQTLCVSTY-----GIITSRMLCAGIM-SGKRDACKGDSGGPLSCRRKSDGKWI 630 640 650 660 670 780 790 800 810 820 830 pF1KE6 LYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSKINGPASLQTNNKCKTLKQQLPPPTPSP : :::::: : .: :::..:: :. ::.. . CCDS43 LTGIVSWGHGSGRPNFPGVYTRVSNFVPWIHKYVPSLL 680 690 700 710 840 850 860 870 880 890 pF1KE6 DSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKFTIEYLSLLGS 1134 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 15:49:45 2016 done: Tue Nov 8 15:49:45 2016 Total Scan time: 3.930 Total Display time: 0.120 Function used was FASTA [36.3.4 Apr, 2011]